How we're building the world's largest family tree | Yaniv Erlich

41,746 views ・ 2019-10-18

TED


Пожалуйста, дважды щелкните на английские субтитры ниже, чтобы воспроизвести видео.

Переводчик: Dina Lukmanova Редактор: Péter Pallós
00:12
People use the internet for various reasons.
0
12817
3452
Люди пользуются интернетом в разных целях.
00:17
It turns out that one of the most popular categories of website
1
17765
3804
Самая популярная категория вебсайтов —
00:21
is something that people typically consume in private.
2
21593
2872
те, которые люди посещают конфиденциально.
00:25
It involves curiosity,
3
25639
2510
В этом замешаны любопытство,
00:28
non-insignificant levels of self-indulgence
4
28173
3796
значительное потворство своим желаниям
00:31
and is centered around recording the reproductive activities
5
31993
3260
и запись репродуктивной деятельности других людей.
00:35
of other people.
6
35277
1309
00:36
(Laughter)
7
36610
1032
(Смех)
00:37
Of course, I'm talking about genealogy --
8
37666
2250
Конечно, я говорю о генеалогии,
00:39
(Laughter)
9
39940
1214
(Смех)
00:41
the study of family history.
10
41178
1702
об изучении семейной истории.
00:43
When it comes to detailing family history,
11
43353
2037
Когда речь заходит о семейной истории,
00:45
in every family, we have this person that is obsessed with genealogy.
12
45414
3943
в каждой семье находится человек, одержимый генеалогией.
00:49
Let's call him Uncle Bernie.
13
49381
1713
Давайте назовём его дядей Берни.
00:51
Uncle Bernie is exactly the last person you want to sit next to
14
51118
3782
Дядя Берни — это последний человек, с которым вы хотите сидеть вместе
00:54
in Thanksgiving dinner,
15
54924
1599
за ужином в День благодарения,
00:56
because he will bore you to death with peculiar details
16
56547
2814
ведь он замучает вас до смерти
деталями жизни каких-то дальних родственников.
00:59
about some ancient relatives.
17
59385
1966
01:02
But as you know,
18
62462
1262
Но, как вы знаете,
01:03
there is a scientific side for everything,
19
63748
2872
у всего есть своя научная сторона,
01:06
and we found that Uncle Bernie's stories
20
66644
2978
и мы обнаружили, что истории дяди Берни
01:09
have immense potential for biomedical research.
21
69646
3168
имеют огромный потенциал для биомедицинских исследований.
01:13
We let Uncle Bernie and his fellow genealogists
22
73306
2714
Мы даём шанс дяде Берни и его коллегам по генеалогии
01:16
document their family trees through a genealogy website called geni.com.
23
76044
4668
создавать их генеалогические древа на сайте geni.com.
01:21
When users upload their trees to the website,
24
81198
2128
Когда пользователь загружает дерево на сайт,
01:23
it scans their relatives,
25
83350
1690
сайт распознаёт его родственников
01:25
and if it finds matches to existing trees,
26
85064
2075
и, если есть совпадение с другими деревьями,
01:27
it merges the existing and the new tree together.
27
87163
3610
то существующая и новая родословные объединяются.
01:31
The result is that large family trees are created,
28
91768
2950
В результате создаются большие родословные,
01:34
beyond the individual level of each genealogist.
29
94742
3479
которые невозможно создать одному отдельному генеалогу.
01:38
Now, by repeating this process with millions of people
30
98808
4129
Повторяя этот процесс для миллионов людей
01:42
all over the world,
31
102961
1817
по всему миру,
01:44
we can crowdsource the construction of a family tree of all humankind.
32
104802
5532
мы можем построить генеалогическое древо всего человечества.
01:51
Using this website,
33
111292
1584
Используя этот вебсайт,
01:52
we were able to connect 125 million people
34
112900
4813
мы смогли объединить 125 миллионов человек
01:57
into a single family tree.
35
117737
2521
в одно родословное дерево.
02:00
I cannot draw the tree on the screens over here
36
120967
2788
Я не смогу показать это дерево на экранах,
02:03
because they have less pixels
37
123779
2165
потому что число их пикселей меньше,
02:05
than the number of people in this tree.
38
125968
2513
чем число людей в дереве.
02:08
But here is an example of a subset of 6,000 individuals.
39
128505
5010
Но вот пример выборки из 6 000 человек.
02:14
Each green node is a person.
40
134159
2362
Каждый зелёный узел — это человек.
02:17
The red nodes represent marriages,
41
137060
2849
Красные узлы представляют браки,
02:19
and the connections represent parenthood.
42
139933
2258
а связи обозначают родителей.
02:22
In the middle of this tree, you see the ancestors.
43
142557
2372
В центре дерева вы видите предков,
02:24
And as we go to the periphery, you see the descendants.
44
144953
2604
а дальше к периферии — потомков.
02:27
This tree has seven generations, approximately.
45
147581
3102
В дереве около семи поколений.
02:31
Now, this is what happens when we increase the number of individuals
46
151692
3234
Вот что случится,
если мы увеличим число до 70 000 человек,
02:34
to 70,000 people --
47
154950
1828
02:36
still a tiny subset of all the data that we have.
48
156802
4330
всё ещё небольшой выборки из всех наших имеющихся данных.
02:41
Despite that, you can already see the formation of gigantic family trees
49
161629
4813
Несмотря на это, вы уже можете видеть образование огромных родословных
02:46
with many very distant relatives.
50
166466
2655
с большим количеством дальних родственников.
02:49
Thanks to the hard work of our genealogists,
51
169610
3134
Благодаря усердной работе наших генеалогов,
02:52
we can go back in time hundreds of years ago.
52
172768
3103
мы можем отправиться на сотни лет назад.
02:56
For example, here is Alexander Hamilton,
53
176418
3441
Например, вот Александр Гамильтон,
02:59
who was born in 1755.
54
179883
2475
родившийся в 1755 году.
03:02
Alexander was the first US Secretary of the Treasury,
55
182872
3764
Александр был первым министром финансов США,
03:06
but mostly known today due to a popular Broadway musical.
56
186660
3831
но наиболее известен сегодня из-за популярного бродвейского мюзикла.
03:11
We found that Alexander has deeper connections in the showbiz industry.
57
191137
4922
Мы обнаружили, что у Александра есть более глубокие связи в шоу-бизнесе.
03:16
In fact, he's a blood relative of ...
58
196083
2111
На самом деле он кровный родственник...
03:18
Kevin Bacon!
59
198781
1220
Кевина Бейкона!
03:20
(Laughter)
60
200025
2032
(Смех)
03:22
Both of them are descendants of a lady from Scotland
61
202081
2606
Оба они — потомки одной леди из Шотландии,
03:24
who lived in the 13th century.
62
204711
2314
что жила в XIII веке.
03:27
So you can say that Alexander Hamilton
63
207049
3102
Можно сказать, что Александр Гамильтон —
03:30
is 35 degrees of Kevin Bacon genealogy.
64
210175
3188
родственник Кевина Бэйкона в 35-м колене.
03:33
(Laughter)
65
213387
1441
(Смех)
03:34
And our tree has millions of stories like that.
66
214852
3230
В нашем древе миллионы таких историй.
03:40
We invested significant efforts to validate the quality of our data.
67
220113
4890
Мы приложили немалые усилия для проверки качества наших данных.
03:45
Using DNA, we found that .3 percent of the mother-child connections in our data
68
225027
5391
ДНК-тесты показали, что 0,3% связей между матерью и ребёнком в наших данных
03:50
are wrong,
69
230442
1250
неверны,
03:51
which could match the adoption rate in the US pre-Second World War.
70
231716
3591
что сопоставимо с уровнем усыновления в США до Второй мировой войны.
03:56
For the father's side,
71
236847
1785
С отцовской стороны
03:58
the news is not as good:
72
238656
1961
данные не так хороши:
04:02
1.9 percent of the father-child connections in our data are wrong.
73
242149
5600
1,9% связей отца и ребёнка в наших данных неверны.
04:07
And I see some people smirk over here.
74
247773
2363
Я вижу у некоторых из вас ухмылки.
04:10
It is what you think --
75
250160
1717
Да, это то, что вы думаете, —
04:11
there are many milkmen out there.
76
251901
1789
здесь замешано немало соседей.
04:13
(Laughter)
77
253714
1064
(Смех)
04:14
However, this 1.9 percent error rate in patrilineal connections
78
254802
3989
Однако ошибка в 1,9% отцовских связей
04:18
is not unique to our data.
79
258815
1769
не уникальна для наших данных.
04:20
Previous studies found a similar error rate
80
260608
3069
Предыдущие исследования показывают аналогичную частоту ошибок
04:23
using clinical-grade pedigrees.
81
263701
2021
в родословных клинического уровня.
04:26
So the quality of our data is good,
82
266254
2525
Так что наши данные — хорошего качества,
04:28
and that should not be a surprise.
83
268803
2133
и это не удивительно.
04:30
Our genealogists have a profound, vested interest
84
270960
3776
Наши генеалоги глубоко заинтересованы
04:34
in correctly documenting their family history.
85
274760
3668
в правильном документировании семейных историй.
04:40
We can leverage this data to learn quantitative information about humanity,
86
280594
4591
Эти данные могут помочь узнать количественную информацию о человечестве,
04:45
for example, questions about demography.
87
285209
2596
например, в вопросах демографии.
04:47
Here is a look at all our profiles on the map of the world.
88
287829
3857
Вот, на что похожи все наши анкеты на карте мира.
04:52
Each pixel is a person that lived at some point.
89
292250
4481
Каждый пиксель — это человек, живший в какой-то момент времени.
04:56
And since we have so much data,
90
296755
1680
Так как у нас есть так много данных,
04:58
you can see the contours of many countries,
91
298459
2781
вам видны контуры многих стран,
05:01
especially in the Western world.
92
301264
2099
особенно на западе.
05:03
In this clip, we stratified the map that I've showed you
93
303387
3548
В этом ролике мы расслоили карту, которую я вам показал,
05:06
based on the year of births of individuals from 1400 to 1900,
94
306959
5072
для людей, родившихся с 1400 по 1900 гг.,
05:12
and we compared it to known migration events.
95
312055
2766
и сравнили её с имеющейся информацией по миграции.
05:15
The clip is going to show you that the deepest lineages in our data
96
315482
3165
Ролик покажет, что самые полные родословные в наших данных
05:18
go all the way back to the UK,
97
318671
1627
уходят корнями в Соединённое Королевство,
05:20
where they had better record keeping,
98
320322
1808
где люди лучше ведут учёт,
05:22
and then they spread along the routes of Western colonialism.
99
322154
3282
а затем они расходятся по путям западного колониализма.
05:25
Let's watch this.
100
325460
1322
Давайте его посмотрим.
05:27
(Music)
101
327143
1609
(Музыка)
05:28
[Year of birth: ]
102
328776
2341
[Год рождения:]
05:31
[1492 - Columbus sails the ocean blue]
103
331705
1836
[1492 — Колумб переплывает океан]
05:35
[1620 - Mayflower lands in Massachusetts]
104
335661
2000
[1620 — Мэйфлаулер приходит в Массачусетс]
05:38
[1652 - Dutch settle in South Africa]
105
338726
1775
[1652 — голландцы в Южной Африке]
05:44
[1788 - Great Britain penal transportation to Australia starts]
106
344321
3186
[1788 — Великобритания начинает перевозку преступников в Австралию]
05:47
[1836 - First migrants use Oregon Trail]
107
347531
1927
[1836—первые мигранты на Орегонском пути]
05:50
[all activity]
108
350149
3183
[вся активность]
05:55
I love this movie.
109
355851
1543
Мне нравится этот ролик.
05:57
Now, since these migration events are giving the context of families,
110
357418
5093
Имея информацию о миграциях и семейных связях,
06:02
we can ask questions such as:
111
362535
2183
мы можем ответить на следующие вопросы:
06:04
What is the typical distance between the birth locations
112
364742
3470
каково обычное расстояние
между местами рождения мужей и жён?
06:08
of husbands and wives?
113
368236
2812
06:11
This distance plays a pivotal role in demography,
114
371072
3677
Это расстояние играет ключевую роль в демографии,
06:14
because the patterns in which people migrate to form families
115
374773
3681
потому что то, как люди мигрируют, чтобы сформировать семьи,
06:18
determine how genes spread in geographical areas.
116
378478
3713
определяет географическое распространение генов.
06:22
We analyzed this distance using our data,
117
382706
2328
Мы проанализировали эти расстояния
06:25
and we found that in the old days,
118
385058
2290
и обнаружили,
что раньше всё было просто.
06:27
people had it easy.
119
387372
1230
06:28
They just married someone in the village nearby.
120
388626
2594
Люди вступали в брак с кем-то не дальше соседней деревни.
06:31
But the Industrial Revolution really complicated our love life.
121
391958
3705
Но промышленная революция усложнила то, как мы строим отношения.
06:35
And today, with affordable flights and online social media,
122
395687
4560
Сегодня с доступными перелётами и социальными сетями
06:40
people typically migrate more than 100 kilometers from their place of birth
123
400271
4828
люди обычно мигрируют более чем на 100 км от своего места рождения,
06:45
to find their soul mate.
124
405123
1504
чтобы встретить вторую половину.
06:48
So now you might ask:
125
408524
1187
У вас возникает вопрос:
06:49
OK, but who does the hard work of migrating from places to places
126
409735
4496
но кто берёт на себя хлопоты переезжать с места на место,
06:54
to form families?
127
414255
1269
чтобы образовывать семьи?
06:55
Are these the males or the females?
128
415548
3727
Мужчины или женщины?
06:59
We used our data to address this question,
129
419752
2155
Мы использовали наши данные, чтобы найти ответ
07:01
and at least in the last 300 years,
130
421931
2594
и, по крайней мере,
07:04
we found that the ladies do the hard work
131
424549
3883
последние 300 лет дамы берут на себя
07:08
of migrating from places to places to form families.
132
428456
2996
переезд для создания семьи.
07:11
Now, these results are statistically significant,
133
431476
3101
Эти результаты статистически значимы,
07:14
so you can take it as scientific fact that males are lazy.
134
434601
3471
так что можно принять за научный факт то, что мужчины ленивы.
07:18
(Laughter)
135
438096
3156
(Смех)
07:21
We can move from questions about demography
136
441276
2536
Перейдём от вопросов демографии
07:23
and ask questions about human health.
137
443836
2913
к вопросам о здоровье людей.
07:26
For example, we can ask
138
446773
1487
Например, мы можем узнать,
07:28
to what extent genetic variations account for differences in life span
139
448284
4963
в какой степени генетические различия людей объясняют разницу
в продолжительности жизни.
07:33
between individuals.
140
453271
1194
07:34
Previous studies analyzed the correlation of longevity between twins
141
454988
4530
Исследования, изучившие соотношение долголетия между близнецами,
07:39
to address this question.
142
459542
1442
могут ответить на этот вопрос.
07:41
They estimated that the genetic variations account for
143
461411
2667
Выяснено, что генетические различия ответственны
07:44
about a quarter of the differences in life span between individuals.
144
464102
4040
примерно за четверть различий в продолжительности жизни между людьми.
07:48
But twins can be correlated due to so many reasons,
145
468688
2598
Но близнецы могут быть связаны по многим факторам,
07:51
including various environmental effects
146
471310
2304
включая воздействие окружающей среды
07:53
or a shared household.
147
473638
1622
и общий быт.
07:56
Large family trees give us the opportunity to analyze both close relatives,
148
476411
3753
Большие родословные дают нам возможность анализировать и близких родственников,
08:00
such as twins,
149
480188
1207
таких как близнецы,
08:01
all the way to distant relatives, even fourth cousins.
150
481419
2917
и дальних, таких как четвероюродные братья и сёстры.
08:04
This way we can build robust models
151
484749
2689
Таким образом, мы можем построить надёжные модели,
08:07
that can tease apart the contribution of genetic variations
152
487462
3708
которые могут отделить влияние генетических изменений
08:11
from environmental factors.
153
491194
1717
от факторов окружающей среды.
08:13
We conducted this analysis using our data,
154
493379
2899
Мы провели подобный анализ
08:16
and we found that genetic variations explain only 15 percent
155
496302
5791
и обнаружили, что гены ответственны только за 15% различий
08:22
of the differences in life span between individuals.
156
502117
2806
в продолжительности жизни между людьми.
08:26
That is five years, on average.
157
506760
2756
В среднем, это пять лет.
08:30
So genes matter less than what we thought before to life span.
158
510316
4708
То есть гены оказывают меньшее влияние на продолжительность жизни, чем мы думали.
08:35
And I find it great news,
159
515675
2136
Я считаю это прекрасной новостью,
08:38
because it means that our actions can matter more.
160
518438
3293
ведь это значит, что наш образ жизни может иметь бóльшее значение.
08:42
Smoking, for example, determines 10 years of our life expectancy --
161
522533
4274
Курение, например, может изменить продолжительность жизни на 10 лет.
08:46
twice as much as what genetics determines.
162
526831
2646
Это в два раза больше, чем решают гены.
08:50
We can even have more surprising findings
163
530236
2289
Ещё более неожиданные выводы можно получить,
08:52
as we move from family trees
164
532549
1492
если отойти от родословных
08:54
and we let our genealogists document and crowdsource DNA information.
165
534065
4732
и позволить нашим генеалогам собирать и документировать ДНК-информацию.
08:58
And the results can be amazing.
166
538821
2024
Результаты могут быть потрясающими.
09:01
It might be hard to imagine, but Uncle Bernie and his friends
167
541255
3915
Сложно представить, но дядя Берни и его друзья
09:05
can create DNA forensic capabilities
168
545194
2646
могут создать ДНК-экспертизы,
09:07
that even exceed what the FBI currently has.
169
547864
3559
превосходящие те, что в настоящее время имеет ФБР.
09:12
When you place the DNA on a large family tree,
170
552862
2404
Когда мы помещаем ДНК на большое семейное древо,
09:15
you effectively create a beacon
171
555290
2117
мы фактически создаём маяк,
09:17
that illuminates the hundreds of distant relatives
172
557431
2634
который освещает сотни дальних родственников,
09:20
that are all connected to the person that originated the DNA.
173
560089
3490
связанных одним человеком с этим ДНК.
09:24
By placing multiple beacons on a large family tree,
174
564505
2913
Разместив несколько маяков на большом генеалогическом дереве,
09:27
you can now triangulate the DNA of an unknown person,
175
567442
3720
мы теперь можем отследить ДНК неизвестного человека
09:31
the same way that the GPS system uses multiple satellites
176
571186
3938
так же, как система GPS использует несколько спутников,
09:35
to find a location.
177
575148
1324
чтобы найти местоположение.
09:37
The prime example of the power of this technique
178
577226
3624
Яркий пример эффективности этой техники —
09:40
is capturing the Golden State Killer,
179
580874
2675
поимка Убийцы из Золотого штата,
09:44
one of the most notorious criminals in the history of the US.
180
584612
4528
одного из самых нашумевших преступников в истории США.
09:49
The FBI had been searching for this person for over 40 years.
181
589164
5892
ФБР разыскивало этого человека более 40 лет.
09:55
They had his DNA,
182
595588
1835
У них была его ДНК,
09:57
but he never showed up in any police database.
183
597447
3350
но он не появлялся ни в одной полицейской базе данных.
10:01
About a year ago, the FBI consulted a genetic genealogist,
184
601447
4712
Около года назад ФБР обратилось к генетическому генеалогу
10:06
and she suggested that they submit his DNA to a genealogy service
185
606183
3950
и предложила им предоставить ДНК генеалогической службе,
10:10
that can locate distant relatives.
186
610157
2398
способной найти дальних родственников.
10:13
They did that,
187
613117
1156
Они так и поступили,
10:14
and they found a third cousin of the Golden State Killer.
188
614297
3692
и нашли троюродного брата убийцы.
10:18
They built a large family tree,
189
618013
2344
Они построили большое семейное дерево
10:20
scanned the different branches of that tree,
190
620381
2102
и изучали различные ветви этого дерева,
10:22
until they found a profile that exactly matched
191
622507
2565
пока не нашли профиль, точно соответствующий тому,
10:25
what they knew about the Golden State Killer.
192
625096
2581
что они знали о разыскиваемом убийце.
10:27
They obtained DNA from this person and found a perfect match
193
627701
3592
Они взяли ДНК этого человека, и она идеально совпала с образцом,
10:31
to the DNA they had in hand.
194
631317
2025
который был у них в руках.
10:33
They arrested him and brought him to justice
195
633366
2350
Его арестовали и предали суду
10:35
after all these years.
196
635740
1424
после всех этих лет поисков.
10:38
Since then, genetic genealogists have started working with
197
638172
3241
С тех пор генеалоги начали работать
10:41
local US law enforcement agencies
198
641437
2668
с местными правоохранительными органами,
10:44
to use this technique in order to capture criminals.
199
644129
3362
чтобы использовать эту технику для поимки преступников.
10:47
And only in the past six months,
200
647521
2681
И только за последние шесть месяцев
10:50
they were able to solve over 20 cold cases with this technique.
201
650226
4296
они смогли завершить более 20 незакрытых дел.
10:56
Luckily, we have people like Uncle Bernie and his fellow genealogists
202
656203
4636
К счастью, у нас есть такие люди, как дядя Берни и его генеалоги.
11:01
These are not amateurs with a self-serving hobby.
203
661045
2994
Это не любители с меркантильным хобби.
11:04
These are citizen scientists with a deep passion to tell us who we are.
204
664602
6419
Это добровольцы, горящие идеей помочь нам понять, кто мы.
11:11
And they know that the past can hold a key to the future.
205
671065
4458
Они знают, что прошлое может быть ключом к будущему.
11:16
Thank you very much.
206
676067
1183
Спасибо вам большое!
11:17
(Applause)
207
677314
3469
(Аплодисменты)
Об этом сайте

Этот сайт познакомит вас с видеороликами YouTube, полезными для изучения английского языка. Вы увидите уроки английского языка, преподаваемые высококлассными учителями со всего мира. Дважды щелкните по английским субтитрам, отображаемым на каждой странице видео, чтобы воспроизвести видео оттуда. Субтитры прокручиваются синхронно с воспроизведением видео. Если у вас есть какие-либо комментарии или пожелания, пожалуйста, свяжитесь с нами, используя эту контактную форму.

https://forms.gle/WvT1wiN1qDtmnspy7