Nicholas Christakis: How social networks predict epidemics

Николас Кристакис: Как социальные сети предсказывают эпидемии

93,421 views

2010-09-16 ・ TED


New videos

Nicholas Christakis: How social networks predict epidemics

Николас Кристакис: Как социальные сети предсказывают эпидемии

93,421 views ・ 2010-09-16

TED


Пожалуйста, дважды щелкните на английские субтитры ниже, чтобы воспроизвести видео.

Переводчик: Nadezhda Lebedeva Редактор: Tetyana Zapevalina
00:15
For the last 10 years, I've been spending my time trying to figure out
0
15260
3000
Последние 10 лет я провёл, пытаясь понять,
00:18
how and why human beings
1
18260
2000
как и почему люди
00:20
assemble themselves into social networks.
2
20260
3000
объединяются в социальные сети.
00:23
And the kind of social network I'm talking about
3
23260
2000
Социальная сеть, о которой я говорю,
00:25
is not the recent online variety,
4
25260
2000
это не та, которая недавно появилась в интернете,
00:27
but rather, the kind of social networks
5
27260
2000
а скорее та,
00:29
that human beings have been assembling for hundreds of thousands of years,
6
29260
3000
в которую люди объединялись в течение сотен тысяч лет
00:32
ever since we emerged from the African savannah.
7
32260
3000
с момента возникновения человечества в Африканских саваннах.
00:35
So, I form friendships and co-worker
8
35260
2000
Я создаю дружеские и рабочие отношения,
00:37
and sibling and relative relationships with other people
9
37260
3000
родственные связи с окружающими,
00:40
who in turn have similar relationships with other people.
10
40260
2000
которые, в свою очередь, образуют такие же связи с другими.
00:42
And this spreads on out endlessly into a distance.
11
42260
3000
И эта цепочка бесконечна.
00:45
And you get a network that looks like this.
12
45260
2000
Мы получаем социальную сеть, которая выглядит вот так.
00:47
Every dot is a person.
13
47260
2000
Каждая точка - это человек.
00:49
Every line between them is a relationship between two people --
14
49260
2000
Каждая линия между точками - это отношения между двумя людьми,
00:51
different kinds of relationships.
15
51260
2000
разные типы отношений.
00:53
And you can get this kind of vast fabric of humanity,
16
53260
3000
Таким образом можно получить пространственную структуру человечества,
00:56
in which we're all embedded.
17
56260
2000
в которую включены мы все.
00:58
And my colleague, James Fowler and I have been studying for quite sometime
18
58260
3000
Некоторое время мы с моим коллегой Джеймсом Фаулером изучали,
01:01
what are the mathematical, social,
19
61260
2000
какие математические, социальные,
01:03
biological and psychological rules
20
63260
3000
биологические и психологические законы
01:06
that govern how these networks are assembled
21
66260
2000
регламентируют создание этих сетей
01:08
and what are the similar rules
22
68260
2000
и какие похожие правила
01:10
that govern how they operate, how they affect our lives.
23
70260
3000
управляют ее функционированием и влиянием на нашу жизнь.
01:13
But recently, we've been wondering
24
73260
2000
До недавнего времени мы пытались понять,
01:15
whether it might be possible to take advantage of this insight,
25
75260
3000
возможно ли использовать эти знания во благо,
01:18
to actually find ways to improve the world,
26
78260
2000
найти способ усовершенствовать мир,
01:20
to do something better,
27
80260
2000
что-то улучшить,
01:22
to actually fix things, not just understand things.
28
82260
3000
исправить, а не только понять.
01:25
So one of the first things we thought we would tackle
29
85260
3000
И первое, над чем мы начали работать, -
01:28
would be how we go about predicting epidemics.
30
88260
3000
это способ предсказания эпидемий.
01:31
And the current state of the art in predicting an epidemic --
31
91260
2000
В настоящее время положение дел такое:
01:33
if you're the CDC or some other national body --
32
93260
3000
представители СЭС или других национальных организаций
01:36
is to sit in the middle where you are
33
96260
2000
сидят на своих местах
01:38
and collect data
34
98260
2000
и собирают данные,
01:40
from physicians and laboratories in the field
35
100260
2000
поступающие от врачей и полевых лабораторий,
01:42
that report the prevalence or the incidence of certain conditions.
36
102260
3000
указывающие на распространение или наличие определённых заболеваний.
01:45
So, so and so patients have been diagnosed with something,
37
105260
3000
Такие-то и такие-то случаи заболевания были диагностированы здесь,
01:48
or other patients have been diagnosed,
38
108260
2000
или другие случаи были диагностированы там,
01:50
and all these data are fed into a central repository, with some delay.
39
110260
3000
а данные об этом попали в центральную базу данных с задержкой.
01:53
And if everything goes smoothly,
40
113260
2000
И если всё пройдёт гладко,
01:55
one to two weeks from now
41
115260
2000
то через неделю или две
01:57
you'll know where the epidemic was today.
42
117260
3000
вы будете знать, на какой стадии эпидемия была сегодня.
02:00
And actually, about a year or so ago,
43
120260
2000
На самом деле около года назад
02:02
there was this promulgation
44
122260
2000
была обнародована
02:04
of the idea of Google Flu Trends, with respect to the flu,
45
124260
3000
идея создания клиента Google Flu Trends, посвящённого гриппу,
02:07
where by looking at people's searching behavior today,
46
127260
3000
где, взглянув на поисковые запросы людей в данный момент,
02:10
we could know where the flu --
47
130260
2000
мы сможем узнать
02:12
what the status of the epidemic was today,
48
132260
2000
состояние эпидемии
02:14
what's the prevalence of the epidemic today.
49
134260
3000
и степень её распространения в данный момент.
02:17
But what I'd like to show you today
50
137260
2000
Но сегодня я бы хотел показать вам
02:19
is a means by which we might get
51
139260
2000
способ, с помощью которого мы сможем
02:21
not just rapid warning about an epidemic,
52
141260
3000
не просто быстро узнавать об эпидемии,
02:24
but also actually
53
144260
2000
но и заранее
02:26
early detection of an epidemic.
54
146260
2000
обнаруживать её появление.
02:28
And, in fact, this idea can be used
55
148260
2000
На самом деле эту идею можно использовать
02:30
not just to predict epidemics of germs,
56
150260
3000
не только для предсказания вирусной эпидемии,
02:33
but also to predict epidemics of all sorts of kinds.
57
153260
3000
но и для предсказания любых других эпидемий.
02:37
For example, anything that spreads by a form of social contagion
58
157260
3000
Например, таким образом можно понимать всё,
02:40
could be understood in this way,
59
160260
2000
что распространяется в социальной среде:
02:42
from abstract ideas on the left
60
162260
2000
от абстрактных идей
02:44
like patriotism, or altruism, or religion
61
164260
3000
вроде патриотизма, альтруизма и религии
02:47
to practices
62
167260
2000
до таких действий,
02:49
like dieting behavior, or book purchasing,
63
169260
2000
как следование диете, покупки книг,
02:51
or drinking, or bicycle-helmet [and] other safety practices,
64
171260
3000
выпивка, использование велосипедного шлема и других мер безопасности,
02:54
or products that people might buy,
65
174260
2000
или товаров, которые люди могут купить,
02:56
purchases of electronic goods,
66
176260
2000
покупки электроники -
02:58
anything in which there's kind of an interpersonal spread.
67
178260
3000
всё, что распространяется межличностно.
03:01
A kind of a diffusion of innovation
68
181260
2000
Распространение нововведения
03:03
could be understood and predicted
69
183260
2000
можно понять и предсказать
03:05
by the mechanism I'm going to show you now.
70
185260
3000
с помощью механизма, который я вам сейчас покажу.
03:08
So, as all of you probably know,
71
188260
2000
Итак, как вы, возможно, знаете,
03:10
the classic way of thinking about this
72
190260
2000
обычно его описывают
03:12
is the diffusion-of-innovation,
73
192260
2000
как диффузию инновации
03:14
or the adoption curve.
74
194260
2000
или кривую восприятия.
03:16
So here on the Y-axis, we have the percent of the people affected,
75
196260
2000
Здесь, на оси У, отмечается число попавших под воздействие людей,
03:18
and on the X-axis, we have time.
76
198260
2000
а на оси Х - время.
03:20
And at the very beginning, not too many people are affected,
77
200260
3000
В самом начале, пока еще количество попавших под воздействие не очень велико,
03:23
and you get this classic sigmoidal,
78
203260
2000
получим классический сигмоид
03:25
or S-shaped, curve.
79
205260
2000
или S-образную кривую.
03:27
And the reason for this shape is that at the very beginning,
80
207260
2000
А причина такой формы в том, что в самом начале
03:29
let's say one or two people
81
209260
2000
допустим, один или два человека
03:31
are infected, or affected by the thing
82
211260
2000
оказываются под влиянием или заражены,
03:33
and then they affect, or infect, two people,
83
213260
2000
потом они влияют или заражают двух людей,
03:35
who in turn affect four, eight, 16 and so forth,
84
215260
3000
которые, в свою очередь, влияют на 4, 8, 16 и так далее,
03:38
and you get the epidemic growth phase of the curve.
85
218260
3000
и на кривой вы получите стадию роста эпидемии.
03:41
And eventually, you saturate the population.
86
221260
2000
В конце концов вы достигнете точки насыщения.
03:43
There are fewer and fewer people
87
223260
2000
Людей, которых можно заразить,
03:45
who are still available that you might infect,
88
225260
2000
становится всё меньше и меньше,
03:47
and then you get the plateau of the curve,
89
227260
2000
у вас стадия стабилизации кривой
03:49
and you get this classic sigmoidal curve.
90
229260
3000
и классическая сигмоидальная кривая.
03:52
And this holds for germs, ideas,
91
232260
2000
И это справедливо для бактерий, идей,
03:54
product adoption, behaviors,
92
234260
2000
восприятие товаров, моделей поведения
03:56
and the like.
93
236260
2000
и прочего.
03:58
But things don't just diffuse in human populations at random.
94
238260
3000
Однако всё это не распространяется в сообществе случайно.
04:01
They actually diffuse through networks.
95
241260
2000
На самом деле оно распространяется через социальные сети.
04:03
Because, as I said, we live our lives in networks,
96
243260
3000
Потому что, как я сказал, мы живём в социальных сетях,
04:06
and these networks have a particular kind of a structure.
97
246260
3000
и у каждой из этих сетей своя особенная структура.
04:09
Now if you look at a network like this --
98
249260
2000
Давайте взглянем на эту сеть...
04:11
this is 105 people.
99
251260
2000
Здесь 105 человек.
04:13
And the lines represent -- the dots are the people,
100
253260
2000
Линии обозначают... Да, точки - это люди,
04:15
and the lines represent friendship relationships.
101
255260
2000
а линии обозначают дружеские отношения.
04:17
You might see that people occupy
102
257260
2000
Можно заметить, что люди занимают
04:19
different locations within the network.
103
259260
2000
разные положения внутри одной сети.
04:21
And there are different kinds of relationships between the people.
104
261260
2000
И виды отношений между людьми отличаются.
04:23
You could have friendship relationships, sibling relationships,
105
263260
3000
Вы можете вступить в дружеские, кровные,
04:26
spousal relationships, co-worker relationships,
106
266260
3000
супружеские, рабочие,
04:29
neighbor relationships and the like.
107
269260
3000
соседские отношения и множество других.
04:32
And different sorts of things
108
272260
2000
И разные вещи
04:34
spread across different sorts of ties.
109
274260
2000
распространяются через разные виды связей.
04:36
For instance, sexually transmitted diseases
110
276260
2000
Например, болезни, передаваемые половым путём,
04:38
will spread across sexual ties.
111
278260
2000
распространяются через сексуальные связи.
04:40
Or, for instance, people's smoking behavior
112
280260
2000
Или, например, на то, что человек курит,
04:42
might be influenced by their friends.
113
282260
2000
могут повлиять его друзья.
04:44
Or their altruistic or their charitable giving behavior
114
284260
2000
А на альтруизм и щедрость
04:46
might be influenced by their coworkers,
115
286260
2000
могут повлиять коллеги
04:48
or by their neighbors.
116
288260
2000
или соседи.
04:50
But not all positions in the network are the same.
117
290260
3000
Но не все положения в социальной сети одинаковы.
04:53
So if you look at this, you might immediately grasp
118
293260
2000
Так, если вы посмотрите на эту схему, то сразу поймёте,
04:55
that different people have different numbers of connections.
119
295260
3000
что у разных людей образуется разное число связей.
04:58
Some people have one connection, some have two,
120
298260
2000
У некоторых людей - одна, у кого-то - две,
05:00
some have six, some have 10 connections.
121
300260
3000
у кого-то - шесть, а у кого-то и десять.
05:03
And this is called the "degree" of a node,
122
303260
2000
Это так называемая "степень" узла сети,
05:05
or the number of connections that a node has.
123
305260
2000
или число связей в одном узле.
05:07
But in addition, there's something else.
124
307260
2000
Однако есть и другие различия.
05:09
So, if you look at nodes A and B,
125
309260
2000
Так, если вы взглянете на узлы А и Б,
05:11
they both have six connections.
126
311260
2000
вы увидите, что в них по шесть связей.
05:13
But if you can see this image [of the network] from a bird's eye view,
127
313260
3000
Но если вы взглянете на схему с высоты птичьего полёта,
05:16
you can appreciate that there's something very different
128
316260
2000
вы заметите, что узлы А и Б
05:18
about nodes A and B.
129
318260
2000
чем-то всё же отличаются.
05:20
So, let me ask you this -- I can cultivate this intuition by asking a question --
130
320260
3000
Итак, позвольте мне задать вопрос - я помогу вам понять, задавая вопросы, -
05:23
who would you rather be
131
323260
2000
кем бы вы хотели быть,
05:25
if a deadly germ was spreading through the network, A or B?
132
325260
3000
если бы по сети распространялся смертоносный вирус: А или Б?
05:28
(Audience: B.) Nicholas Christakis: B, it's obvious.
133
328260
2000
(Аудитория: Б.) Николас: Б, это очевидно.
05:30
B is located on the edge of the network.
134
330260
2000
Узел Б находится на краю сети.
05:32
Now, who would you rather be
135
332260
2000
А кем бы вы хотели быть,
05:34
if a juicy piece of gossip were spreading through the network?
136
334260
3000
если бы сочная сплетня распространялась по той же сети?
05:37
A. And you have an immediate appreciation
137
337260
3000
А. И вы сами сразу же поняли,
05:40
that A is going to be more likely
138
340260
2000
что у А куда больше шансов
05:42
to get the thing that's spreading and to get it sooner
139
342260
3000
подхватить то, что распространяется, быстрее
05:45
by virtue of their structural location within the network.
140
345260
3000
благодаря структурному расположению узла внутри сети.
05:48
A, in fact, is more central,
141
348260
2000
Узел А расположен ближе к центру,
05:50
and this can be formalized mathematically.
142
350260
3000
и это может быть определено математически.
05:53
So, if we want to track something
143
353260
2000
Таким образом, если мы хотим отследить что-то,
05:55
that was spreading through a network,
144
355260
3000
что распространяется по сети,
05:58
what we ideally would like to do is to set up sensors
145
358260
2000
в идеале нам надо бы установить сенсорное устройство
06:00
on the central individuals within the network,
146
360260
2000
на людей, находящихся в центре данной сети,
06:02
including node A,
147
362260
2000
включая узел А,
06:04
monitor those people that are right there in the middle of the network,
148
364260
3000
следить за людьми, которые находятся прямо в центре сети,
06:07
and somehow get an early detection
149
367260
2000
и таким образом распознать на ранней стадии элемент,
06:09
of whatever it is that is spreading through the network.
150
369260
3000
распространяющийся по данной сети.
06:12
So if you saw them contract a germ or a piece of information,
151
372260
3000
То есть, если вы видите, что они подхватили микроб или какую-то информацию,
06:15
you would know that, soon enough,
152
375260
2000
вы поймёте, что довольно скоро
06:17
everybody was about to contract this germ
153
377260
2000
этот микроб или информацию
06:19
or this piece of information.
154
379260
2000
подхватят все.
06:21
And this would be much better
155
381260
2000
И это гораздо лучше,
06:23
than monitoring six randomly chosen people,
156
383260
2000
чем следить за шестью случайно выбранными людьми
06:25
without reference to the structure of the population.
157
385260
3000
безотносительно к структуре сообщества.
06:28
And in fact, if you could do that,
158
388260
2000
Действительно, если вам удастся это сделать,
06:30
what you would see is something like this.
159
390260
2000
вы увидите что-то подобное.
06:32
On the left-hand panel, again, we have the S-shaped curve of adoption.
160
392260
3000
Слева мы снова видим S-образную кривую восприятия.
06:35
In the dotted red line, we show
161
395260
2000
Красной пунктирной линией мы показываем
06:37
what the adoption would be in the random people,
162
397260
2000
закономерность восприятия случайных людей,
06:39
and in the left-hand line, shifted to the left,
163
399260
3000
а линией, расположенной слева,
06:42
we show what the adoption would be
164
402260
2000
мы показываем, каким бы было восприятие
06:44
in the central individuals within the network.
165
404260
2000
у людей, расположенных в центре сети.
06:46
On the Y-axis is the cumulative instances of contagion,
166
406260
2000
На оси Y обозначены все случаи заражения,
06:48
and on the X-axis is the time.
167
408260
2000
на оси Х - время.
06:50
And on the right-hand side, we show the same data,
168
410260
2000
Справа - те же данные,
06:52
but here with daily incidence.
169
412260
2000
но с ежедневным интервалом.
06:54
And what we show here is -- like, here --
170
414260
2000
Мы показываем, что здесь
06:56
very few people are affected, more and more and more and up to here,
171
416260
2000
очень мало людей оказалось под воздействием; до этого места больше и больше,
06:58
and here's the peak of the epidemic.
172
418260
2000
а вот здесь находится пик эпидемии.
07:00
But shifted to the left is what's occurring in the central individuals.
173
420260
2000
Однако слева мы видим, что происходит с людьми в центре сети.
07:02
And this difference in time between the two
174
422260
3000
И разница во времени между двумя показателями
07:05
is the early detection, the early warning we can get,
175
425260
3000
может обеспечить заблаговременное распознавание и предупреждение
07:08
about an impending epidemic
176
428260
2000
о приближающейся эпидемии
07:10
in the human population.
177
430260
2000
в сообществе.
07:12
The problem, however,
178
432260
2000
Однако, проблема в том,
07:14
is that mapping human social networks
179
434260
2000
что сделать карту человеческих социальных сетей
07:16
is not always possible.
180
436260
2000
не всегда возможно.
07:18
It can be expensive, not feasible,
181
438260
2000
Это может оказаться затратным, очень сложным,
07:20
unethical,
182
440260
2000
неэтичным,
07:22
or, frankly, just not possible to do such a thing.
183
442260
3000
или, по правде говоря, просто невозможным.
07:25
So, how can we figure out
184
445260
2000
Итак, как же мы можем вычислить
07:27
who the central people are in a network
185
447260
2000
людей, находящихся в центре социальной сети,
07:29
without actually mapping the network?
186
449260
3000
без составления её карты?
07:32
What we came up with
187
452260
2000
У нас появилась идея
07:34
was an idea to exploit an old fact,
188
454260
2000
воспользоваться старым,
07:36
or a known fact, about social networks,
189
456260
2000
давно известным фактом о социальных сетях,
07:38
which goes like this:
190
458260
2000
который звучит так:
07:40
Do you know that your friends
191
460260
2000
"Знаете ли вы, что у ваших друзей
07:42
have more friends than you do?
192
462260
3000
больше друзей, чем у вас?
07:45
Your friends have more friends than you do,
193
465260
3000
У ваших друзей больше друзей, чем у вас самих".
07:48
and this is known as the friendship paradox.
194
468260
2000
Этот феномен известен как парадокс дружбы.
07:50
Imagine a very popular person in the social network --
195
470260
2000
Представьте себе очень популярного в социальной сети человека,
07:52
like a party host who has hundreds of friends --
196
472260
3000
вроде любителя вечеринок, у которого сотни друзей,
07:55
and a misanthrope who has just one friend,
197
475260
2000
и мизантропа, у которого лишь один друг,
07:57
and you pick someone at random from the population;
198
477260
3000
и если вы случайным образом выберете кого-то из сообщества,
08:00
they were much more likely to know the party host.
199
480260
2000
скорее всего, он знает этого любителя вечеринок.
08:02
And if they nominate the party host as their friend,
200
482260
2000
Если он назовёт любителя вечеринок своим другом,
08:04
that party host has a hundred friends,
201
484260
2000
а у того сотня друзей,
08:06
therefore, has more friends than they do.
202
486260
3000
следовательно, у любителя вечеринок больше друзей, чем у выбранного нами человека.
08:09
And this, in essence, is what's known as the friendship paradox.
203
489260
3000
И, по сути, это и есть парадокс дружбы.
08:12
The friends of randomly chosen people
204
492260
3000
У друзей случайно выбранных людей
08:15
have higher degree, and are more central
205
495260
2000
"степень" узла выше и они ближе к центру сети,
08:17
than the random people themselves.
206
497260
2000
чем сами случайно выбранные люди.
08:19
And you can get an intuitive appreciation for this
207
499260
2000
Это становится наглядно,
08:21
if you imagine just the people at the perimeter of the network.
208
501260
3000
если представить себе людей, находящихся на границах сети.
08:24
If you pick this person,
209
504260
2000
Если вы выберете этого человека,
08:26
the only friend they have to nominate is this person,
210
506260
3000
единственный друг, которого он сможет назвать, будет этот человек,
08:29
who, by construction, must have at least two
211
509260
2000
у которого, согласно структуре, будет по меньшей мере два,
08:31
and typically more friends.
212
511260
2000
а то и больше друзей.
08:33
And that happens at every peripheral node.
213
513260
2000
Так происходит с любым узлом на периферии.
08:35
And in fact, it happens throughout the network as you move in,
214
515260
3000
И так происходит всё время, пока вы приближаетесь к центру,
08:38
everyone you pick, when they nominate a random --
215
518260
2000
если каждый, кого вы выберете, называет случайного...
08:40
when a random person nominates a friend of theirs,
216
520260
3000
когда случайный человек называет своего друга,
08:43
you move closer to the center of the network.
217
523260
3000
вы чуть больше приближаетесь к центру сети.
08:46
So, we thought we would exploit this idea
218
526260
3000
Итак, мы подумали, что можно воспользоваться этой идеей,
08:49
in order to study whether we could predict phenomena within networks.
219
529260
3000
чтобы посмотреть, сможем ли мы предсказывать явления, происходящие внутри сети.
08:52
Because now, with this idea
220
532260
2000
Ведь сейчас по этой модели
08:54
we can take a random sample of people,
221
534260
2000
мы можем выбрать несколько случайных людей,
08:56
have them nominate their friends,
222
536260
2000
попросить их назвать своих друзей,
08:58
those friends would be more central,
223
538260
2000
эти друзья окажутся ближе к центру сети
09:00
and we could do this without having to map the network.
224
540260
3000
и нам не понадобится карта самой сети.
09:03
And we tested this idea with an outbreak of H1N1 flu
225
543260
3000
Мы протестировали данную модель во время эпидемии свиного гриппа
09:06
at Harvard College
226
546260
2000
в Гарвардском колледже
09:08
in the fall and winter of 2009, just a few months ago.
227
548260
3000
осенью и зимой 2009 года, всего несколько месяцев назад.
09:11
We took 1,300 randomly selected undergraduates,
228
551260
3000
Мы взяли 1300 случайно выбранных студентов,
09:14
we had them nominate their friends,
229
554260
2000
попросили их назвать своих друзей,
09:16
and we followed both the random students and their friends
230
556260
2000
а затем следили как за случайно выбранными студентами, так и за их друзьями
09:18
daily in time
231
558260
2000
каждый день,
09:20
to see whether or not they had the flu epidemic.
232
560260
3000
чтобы узнать, не заболели ли они гриппом.
09:23
And we did this passively by looking at whether or not they'd gone to university health services.
233
563260
3000
Мы делали это пассивно, проверяя, не обратились ли они в медпункт университета.
09:26
And also, we had them [actively] email us a couple of times a week.
234
566260
3000
Помимо этого мы попросили их отправлять нам электронное письмо пару раз в неделю.
09:29
Exactly what we predicted happened.
235
569260
3000
И случилось как раз то, чего мы ожидали.
09:32
So the random group is in the red line.
236
572260
3000
Итак, группа случайно выбранных студентов - это красная линия.
09:35
The epidemic in the friends group has shifted to the left, over here.
237
575260
3000
А эпидемия в группе друзей изображена слева, вот здесь.
09:38
And the difference in the two is 16 days.
238
578260
3000
И разница между двумя показателями - 16 дней.
09:41
By monitoring the friends group,
239
581260
2000
Следя за группой друзей,
09:43
we could get 16 days advance warning
240
583260
2000
мы смогли получить предупреждение о приближающейся эпидемии
09:45
of an impending epidemic in this human population.
241
585260
3000
в данном сообществе за 16 дней.
09:48
Now, in addition to that,
242
588260
2000
Помимо этого,
09:50
if you were an analyst who was trying to study an epidemic
243
590260
3000
если бы вы были аналитиком, изучающим эпидемию,
09:53
or to predict the adoption of a product, for example,
244
593260
3000
или, скажем, предсказывающим восприятие какого-то товара,
09:56
what you could do is you could pick a random sample of the population,
245
596260
3000
вы могли бы случайным образом выбрать несколько человек,
09:59
also have them nominate their friends and follow the friends
246
599260
3000
попросить их назвать своих друзей и следить за друзьями,
10:02
and follow both the randoms and the friends.
247
602260
3000
а также за случайной группой.
10:05
Among the friends, the first evidence you saw of a blip above zero
248
605260
3000
Как только вы увидите, что среди друзей отметка
10:08
in adoption of the innovation, for example,
249
608260
3000
восприятия новинки поднялась выше нуля,
10:11
would be evidence of an impending epidemic.
250
611260
2000
это будет свидетельством приближающейся эпидемии.
10:13
Or you could see the first time the two curves diverged,
251
613260
3000
Или как только вы увидите, что две кривые разошлись,
10:16
as shown on the left.
252
616260
2000
как это показано слева.
10:18
When did the randoms -- when did the friends take off
253
618260
3000
Когда кривая друзей взлетела
10:21
and leave the randoms,
254
621260
2000
намного выше случайно выбранной группы
10:23
and [when did] their curve start shifting?
255
623260
2000
и когда эта кривая начала меняться?
10:25
And that, as indicated by the white line,
256
625260
2000
Это, как показано белой линией,
10:27
occurred 46 days
257
627260
2000
случилось за 46 дней
10:29
before the peak of the epidemic.
258
629260
2000
до пика эпидемии.
10:31
So this would be a technique
259
631260
2000
Такова методика,
10:33
whereby we could get more than a month-and-a-half warning
260
633260
2000
с помощью которой мы могли бы получать предупреждения
10:35
about a flu epidemic in a particular population.
261
635260
3000
об эпидемии гриппа в определённом сообществе раньше, чем за полтора месяца.
10:38
I should say that
262
638260
2000
Необходимо отметить,
10:40
how far advanced a notice one might get about something
263
640260
2000
что быстрота получения предупреждения
10:42
depends on a host of factors.
264
642260
2000
зависит от множества факторов.
10:44
It could depend on the nature of the pathogen --
265
644260
2000
Они могут зависеть от природы болезнетворного микроорганизма -
10:46
different pathogens,
266
646260
2000
при разных болезнетворных организмах,
10:48
using this technique, you'd get different warning --
267
648260
2000
используя эту схему, вы получите разные предупреждения, -
10:50
or other phenomena that are spreading,
268
650260
2000
или от явлений,
10:52
or frankly, on the structure of the human network.
269
652260
3000
или от структуры социальной сети.
10:55
Now in our case, although it wasn't necessary,
270
655260
3000
Итак, в нашем случае, хотя это и не было необходимо,
10:58
we could also actually map the network of the students.
271
658260
2000
мы смогли создать и саму карту студентов.
11:00
So, this is a map of 714 students
272
660260
2000
Это карта 714 студентов
11:02
and their friendship ties.
273
662260
2000
и их дружеских связей.
11:04
And in a minute now, I'm going to put this map into motion.
274
664260
2000
И прямо сейчас я приведу карту в движение.
11:06
We're going to take daily cuts through the network
275
666260
2000
Мы увидим ежедневное изображение сети
11:08
for 120 days.
276
668260
2000
на протяжении 120 дней.
11:10
The red dots are going to be cases of the flu,
277
670260
3000
Красные точки - это случаи заболевания гриппом,
11:13
and the yellow dots are going to be friends of the people with the flu.
278
673260
3000
жёлтые - друзья заболевших.
11:16
And the size of the dots is going to be proportional
279
676260
2000
А размер точек будет прямо пропорциональным
11:18
to how many of their friends have the flu.
280
678260
2000
количеству заболевших друзей данного человека.
11:20
So bigger dots mean more of your friends have the flu.
281
680260
3000
Итак, чем больше будут точки, тем больше друзей заболело.
11:23
And if you look at this image -- here we are now in September the 13th --
282
683260
3000
Взгляните на эту картинку - это данные на 13 сентября -
11:26
you're going to see a few cases light up.
283
686260
2000
вы увидите, что уже появилось несколько случаев заболевания.
11:28
You're going to see kind of blooming of the flu in the middle.
284
688260
2000
Вы увидите пик эпидемии гриппа в центре сети.
11:30
Here we are on October the 19th.
285
690260
3000
Вот данные на 19 октября.
11:33
The slope of the epidemic curve is approaching now, in November.
286
693260
2000
Сейчас, в ноябре, кривая эпидемии достигает вершины.
11:35
Bang, bang, bang, bang, bang -- you're going to see lots of blooming in the middle,
287
695260
3000
Бам, бам, бам, бам, бам - вы увидите множество пиков в середине,
11:38
and then you're going to see a sort of leveling off,
288
698260
2000
а потом - что-то вроде угасания,
11:40
fewer and fewer cases towards the end of December.
289
700260
3000
все меньше и меньше случаев в концу декабря.
11:43
And this type of a visualization
290
703260
2000
Такой способ визуализации
11:45
can show that epidemics like this take root
291
705260
2000
демонстрирует, что подобные эпидемии появляются
11:47
and affect central individuals first,
292
707260
2000
и воздействуют сначала на людей в центре сети,
11:49
before they affect others.
293
709260
2000
а потом уже на всех остальных.
11:51
Now, as I've been suggesting,
294
711260
2000
Как я уже упомянул,
11:53
this method is not restricted to germs,
295
713260
3000
данный метод не ограничивается только болезнями,
11:56
but actually to anything that spreads in populations.
296
716260
2000
но может применяться ко всему, что распространяется в сообществе.
11:58
Information spreads in populations,
297
718260
2000
Например, к информации.
12:00
norms can spread in populations,
298
720260
2000
К правилам.
12:02
behaviors can spread in populations.
299
722260
2000
К поведению.
12:04
And by behaviors, I can mean things like criminal behavior,
300
724260
3000
Под поведением я понимаю такие вещи, как преступное поведение,
12:07
or voting behavior, or health care behavior,
301
727260
3000
поведение при голосовании, или заботе о здоровье:
12:10
like smoking, or vaccination,
302
730260
2000
вроде курения или вакцинации,
12:12
or product adoption, or other kinds of behaviors
303
732260
2000
или восприятие каких-то товаров, или другие типы поведения,
12:14
that relate to interpersonal influence.
304
734260
2000
связанные с влиянием людей друг на друга.
12:16
If I'm likely to do something that affects others around me,
305
736260
3000
Если есть вероятность, что мои действия повлияют на окружающих,
12:19
this technique can get early warning or early detection
306
739260
3000
данный метод может на ранней стадии определить,
12:22
about the adoption within the population.
307
742260
3000
как это будет принято в сообществе.
12:25
The key thing is that for it to work,
308
745260
2000
Чтобы метод работал, в его основе
12:27
there has to be interpersonal influence.
309
747260
2000
должно быть влияние людей друг на друга.
12:29
It cannot be because of some broadcast mechanism
310
749260
2000
Он не будет работать от широковещания,
12:31
affecting everyone uniformly.
311
751260
3000
действующего на всех одинаково.
12:35
Now the same insights
312
755260
2000
Теперь можно развить те же мысли -
12:37
can also be exploited -- with respect to networks --
313
757260
3000
относительно сетей -
12:40
can also be exploited in other ways,
314
760260
3000
в других областях:
12:43
for example, in the use of targeting
315
763260
2000
например, отбирая
12:45
specific people for interventions.
316
765260
2000
особых людей для вмешательства.
12:47
So, for example, most of you are probably familiar
317
767260
2000
Так, например, многие из вас, наверное, знакомы
12:49
with the notion of herd immunity.
318
769260
2000
с понятием коллективного иммунитета.
12:51
So, if we have a population of a thousand people,
319
771260
3000
Если мы занимаемся сообществом из тысячи людей
12:54
and we want to make the population immune to a pathogen,
320
774260
3000
и хотим защитить его от болезнетворного микроорганизма,
12:57
we don't have to immunize every single person.
321
777260
2000
нам не нужно проводить вакцинацию каждого отдельного человека.
12:59
If we immunize 960 of them,
322
779260
2000
Если мы иммунизируем 960 из них,
13:01
it's as if we had immunized a hundred [percent] of them.
323
781260
3000
получится, что мы сделали невосприимчивыми к инфекции 100% населения.
13:04
Because even if one or two of the non-immune people gets infected,
324
784260
3000
Потому что, даже если один-два человека без иммунитета заразятся,
13:07
there's no one for them to infect.
325
787260
2000
им некого будет заражать.
13:09
They are surrounded by immunized people.
326
789260
2000
Они окружены людьми с иммунитетом.
13:11
So 96 percent is as good as 100 percent.
327
791260
3000
То есть 96% - это почти 100%.
13:14
Well, some other scientists have estimated
328
794260
2000
Учёные уже подсчитали,
13:16
what would happen if you took a 30 percent random sample
329
796260
2000
что произойдёт, если вы выберете 30% случайных людей
13:18
of these 1000 people, 300 people and immunized them.
330
798260
3000
из этой тысячи - 300 человек - и проведёте их вакцинацию.
13:21
Would you get any population-level immunity?
331
801260
2000
Можно ли говорить о коллективном иммунитете?
13:23
And the answer is no.
332
803260
3000
Нет.
13:26
But if you took this 30 percent, these 300 people
333
806260
2000
Однако если вы возьмёте эти 30%, эти 300 человек,
13:28
and had them nominate their friends
334
808260
2000
попросите их назвать своих друзей
13:30
and took the same number of vaccine doses
335
810260
3000
и тем же самым количеством инъекций
13:33
and vaccinated the friends of the 300 --
336
813260
2000
вакцинируете друзей этих 300 человек -
13:35
the 300 friends --
337
815260
2000
300 друзей -
13:37
you can get the same level of herd immunity
338
817260
2000
вы сможете получить коллективный иммунитет такого же уровня,
13:39
as if you had vaccinated 96 percent of the population
339
819260
3000
как если бы вы вакцинировали 96% всего сообщества
13:42
at a much greater efficiency, with a strict budget constraint.
340
822260
3000
с ещё большей эффективностью и меньшими затратами.
13:45
And similar ideas can be used, for instance,
341
825260
2000
Такая же схема может использоваться, например,
13:47
to target distribution of things like bed nets
342
827260
2000
для целевого распространения таких товаров, как пологи над кроватями
13:49
in the developing world.
343
829260
2000
в развивающемся мире.
13:51
If we could understand the structure of networks in villages,
344
831260
3000
Если бы мы смогли понять структуру сетей в деревнях,
13:54
we could target to whom to give the interventions
345
834260
2000
мы могли бы выбрать, кому поручить
13:56
to foster these kinds of spreads.
346
836260
2000
заботы об их распространении.
13:58
Or, frankly, for advertising with all kinds of products.
347
838260
3000
Или рекламу всех товаров.
14:01
If we could understand how to target,
348
841260
2000
Если мы сможем понять, как выбирать таких людей,
14:03
it could affect the efficiency
349
843260
2000
мы сможем повлиять на продуктивность
14:05
of what we're trying to achieve.
350
845260
2000
результата, который пытаемся достичь.
14:07
And in fact, we can use data
351
847260
2000
Можно использовать данные
14:09
from all kinds of sources nowadays [to do this].
352
849260
2000
всех существующих сегодня ресурсов.
14:11
This is a map of eight million phone users
353
851260
2000
Вот карта восьми миллионов телефонных абонентов
14:13
in a European country.
354
853260
2000
в одной из европейских стран.
14:15
Every dot is a person, and every line represents
355
855260
2000
Каждая точка - это человек, а каждая линия показывает
14:17
a volume of calls between the people.
356
857260
2000
количество звонков между людьми.
14:19
And we can use such data, that's being passively obtained,
357
859260
3000
Мы можем использовать такие пассивно полученные данные,
14:22
to map these whole countries
358
862260
2000
чтобы сделать карту целых стран
14:24
and understand who is located where within the network.
359
864260
3000
и понять, кто где расположен внутри сети.
14:27
Without actually having to query them at all,
360
867260
2000
И нет необходимости их всех опрашивать,
14:29
we can get this kind of a structural insight.
361
869260
2000
чтобы получить структурный анализ такого рода.
14:31
And other sources of information, as you're no doubt aware
362
871260
3000
Существуют и другие источники информации, о которых вы, конечно же, знаете:
14:34
are available about such features, from email interactions,
363
874260
3000
общение по электронной почте,
14:37
online interactions,
364
877260
2000
взаимодействия в интернете,
14:39
online social networks and so forth.
365
879260
3000
социальные сети в интернете и так далее.
14:42
And in fact, we are in the era of what I would call
366
882260
2000
Мы живём в эпоху, которую можно назвать
14:44
"massive-passive" data collection efforts.
367
884260
3000
широкомасштабным пассивным сбором информации.
14:47
They're all kinds of ways we can use massively collected data
368
887260
3000
Существуют разнообразные способы для использования всей собранной информации,
14:50
to create sensor networks
369
890260
3000
чтобы создать сенсорную сеть
14:53
to follow the population,
370
893260
2000
для наблюдения за сообществом,
14:55
understand what's happening in the population,
371
895260
2000
понимания, что в нём происходит,
14:57
and intervene in the population for the better.
372
897260
3000
и вмешательства для улучшений.
15:00
Because these new technologies tell us
373
900260
2000
Ведь эти новые технологии могут нам объяснить,
15:02
not just who is talking to whom,
374
902260
2000
не только кто с кем общается,
15:04
but where everyone is,
375
904260
2000
но и кто где находится,
15:06
and what they're thinking based on what they're uploading on the Internet,
376
906260
3000
и о чём люди думают, судя по тому, что они скачивают из интернета,
15:09
and what they're buying based on their purchases.
377
909260
2000
и что они покупают, судя по их покупкам.
15:11
And all this administrative data can be pulled together
378
911260
3000
Можно собрать всю эту административную информацию
15:14
and processed to understand human behavior
379
914260
2000
и обработать её, чтобы понять человеческое поведение
15:16
in a way we never could before.
380
916260
3000
так, как это раньше было невозможно.
15:19
So, for example, we could use truckers' purchases of fuel.
381
919260
3000
Например, возьмём покупку бензина водителями грузовиков.
15:22
So the truckers are just going about their business,
382
922260
2000
Водители занимаются своим делом
15:24
and they're buying fuel.
383
924260
2000
и покупают бензин.
15:26
And we see a blip up in the truckers' purchases of fuel,
384
926260
3000
Мы видим увеличение покупок бензина
15:29
and we know that a recession is about to end.
385
929260
2000
и понимаем, что экономический спад скоро закончится.
15:31
Or we can monitor the velocity
386
931260
2000
Или мы можем следить за скоростью,
15:33
with which people are moving with their phones on a highway,
387
933260
3000
с которой люди с телефонами перемещаются по дорогам,
15:36
and the phone company can see,
388
936260
2000
а телефонная компания видит,
15:38
as the velocity is slowing down,
389
938260
2000
что если скорость падает,
15:40
that there's a traffic jam.
390
940260
2000
это означает, что на дорогах пробки.
15:42
And they can feed that information back to their subscribers,
391
942260
3000
Они могут предоставлять эту информацию своим клиентам,
15:45
but only to their subscribers on the same highway
392
945260
2000
но только тем, которые движутся по той же дороге,
15:47
located behind the traffic jam!
393
947260
2000
приближаясь к пробке.
15:49
Or we can monitor doctors prescribing behaviors, passively,
394
949260
3000
Или мы можем следить за тем, как врачи выписывают лекарства,
15:52
and see how the diffusion of innovation with pharmaceuticals
395
952260
3000
и заметить, что распространение новых препаратов
15:55
occurs within [networks of] doctors.
396
955260
2000
происходит внутри определённых врачебных сетей.
15:57
Or again, we can monitor purchasing behavior in people
397
957260
2000
Или, опять же, мы может отслеживать поведение покупателей
15:59
and watch how these types of phenomena
398
959260
2000
и наблюдать, как это явление
16:01
can diffuse within human populations.
399
961260
3000
распространяется в сообществе.
16:04
And there are three ways, I think,
400
964260
2000
Мне кажется, существует три способа,
16:06
that these massive-passive data can be used.
401
966260
2000
в которых эти пассивно собранные данные могут использоваться.
16:08
One is fully passive,
402
968260
2000
Один из них полностью пассивен,
16:10
like I just described --
403
970260
2000
вроде того, что я только что объяснил:
16:12
as in, for instance, the trucker example,
404
972260
2000
как в случае с водителями грузовиков,
16:14
where we don't actually intervene in the population in any way.
405
974260
2000
где мы никоим образом не вмешиваемся в жизнь сообщества.
16:16
One is quasi-active,
406
976260
2000
Ещё один - псевдоактивный,
16:18
like the flu example I gave,
407
978260
2000
как в случае с эпидемией гриппа,
16:20
where we get some people to nominate their friends
408
980260
3000
где мы просили людей назвать своих друзей,
16:23
and then passively monitor their friends --
409
983260
2000
затем пассивно следили за друзьями,
16:25
do they have the flu, or not? -- and then get warning.
410
985260
2000
заболели они гриппом или нет, и получали предупреждение о болезни.
16:27
Or another example would be,
411
987260
2000
Еще один пример:
16:29
if you're a phone company, you figure out who's central in the network
412
989260
3000
вы, телефонная компания, разыскиваете людей в центре сетей
16:32
and you ask those people, "Look, will you just text us your fever every day?
413
992260
3000
и просите их: "Вы не могли бы каждый день сообщать нам о своей температуре?
16:35
Just text us your temperature."
414
995260
2000
Просто пришлите нам цифру".
16:37
And collect vast amounts of information about people's temperature,
415
997260
3000
И собираете огромное количество информации о температуре людей,
16:40
but from centrally located individuals.
416
1000260
2000
находящихся в центре сети.
16:42
And be able, on a large scale,
417
1002260
2000
Так вы сможете в огромном масштабе
16:44
to monitor an impending epidemic
418
1004260
2000
отследить приближающуюся эпидемию
16:46
with very minimal input from people.
419
1006260
2000
с минимальной информацией от людей.
16:48
Or, finally, it can be more fully active --
420
1008260
2000
И, наконец, существует более активный способ -
16:50
as I know subsequent speakers will also talk about today --
421
1010260
2000
насколько я знаю, о нём ещё будут сегодня говорить, -
16:52
where people might globally participate in wikis,
422
1012260
2000
когда люди по всему миру участвуют в создании вики-сайтов,
16:54
or photographing, or monitoring elections,
423
1014260
3000
фотографируют, наблюдают за выборами
16:57
and upload information in a way that allows us to pool
424
1017260
2000
и загружают информацию, так что её можно объединить
16:59
information in order to understand social processes
425
1019260
2000
для понимания социальных процессов
17:01
and social phenomena.
426
1021260
2000
и явлений.
17:03
In fact, the availability of these data, I think,
427
1023260
2000
Мне кажется, что доступность такой информации
17:05
heralds a kind of new era
428
1025260
2000
является вестником новой эпохи,
17:07
of what I and others would like to call
429
1027260
2000
которую я бы назвал
17:09
"computational social science."
430
1029260
2000
эпохой "вычислительной социальной науки".
17:11
It's sort of like when Galileo invented -- or, didn't invent --
431
1031260
3000
Это похоже на то, как Галилей изобрёл (или не изобретал),
17:14
came to use a telescope
432
1034260
2000
начал использовать телескоп
17:16
and could see the heavens in a new way,
433
1036260
2000
и смог увидеть небеса по-новому;
17:18
or Leeuwenhoek became aware of the microscope --
434
1038260
2000
или как Левенгук узнал о микроскопе
17:20
or actually invented --
435
1040260
2000
(или сам изобрёл)
17:22
and could see biology in a new way.
436
1042260
2000
и смог по-новому взглянуть на биологию.
17:24
But now we have access to these kinds of data
437
1044260
2000
Но теперь, когда у нас есть доступ к любой информации,
17:26
that allow us to understand social processes
438
1046260
2000
мы сможем понять социальные процессы
17:28
and social phenomena
439
1048260
2000
и явления
17:30
in an entirely new way that was never before possible.
440
1050260
3000
совершенно новым, невозможным раньше, способом.
17:33
And with this science, we can
441
1053260
2000
С помощью этой науки мы сможем понять,
17:35
understand how exactly
442
1055260
2000
каким образом
17:37
the whole comes to be greater
443
1057260
2000
целое оказывается больше
17:39
than the sum of its parts.
444
1059260
2000
суммы своих элементов.
17:41
And actually, we can use these insights
445
1061260
2000
Мы сможем использовать эти открытия,
17:43
to improve society and improve human well-being.
446
1063260
3000
чтобы улучшить общество и благополучие людей.
17:46
Thank you.
447
1066260
2000
Спасибо.
Об этом сайте

Этот сайт познакомит вас с видеороликами YouTube, полезными для изучения английского языка. Вы увидите уроки английского языка, преподаваемые высококлассными учителями со всего мира. Дважды щелкните по английским субтитрам, отображаемым на каждой странице видео, чтобы воспроизвести видео оттуда. Субтитры прокручиваются синхронно с воспроизведением видео. Если у вас есть какие-либо комментарии или пожелания, пожалуйста, свяжитесь с нами, используя эту контактную форму.

https://forms.gle/WvT1wiN1qDtmnspy7