How we're building the world's largest family tree | Yaniv Erlich

41,679 views ・ 2019-10-18

TED


Veuillez double-cliquer sur les sous-titres anglais ci-dessous pour lire la vidéo.

Traducteur: March Ella Relecteur: Emmanuel Parfond
00:12
People use the internet for various reasons.
0
12817
3452
Les gens utilisent Internet pour plusieurs raisons.
00:17
It turns out that one of the most popular categories of website
1
17765
3804
Et il se trouve que la catégorie la plus populaire de site web,
00:21
is something that people typically consume in private.
2
21593
2872
c’est quelque chose que les gens tendent à regarder en privé.
00:25
It involves curiosity,
3
25639
2510
Ça concerne notre curiosité,
00:28
non-insignificant levels of self-indulgence
4
28173
3796
des niveaux significatifs de complaisance,
00:31
and is centered around recording the reproductive activities
5
31993
3260
et ça tourne autour de l’enregistrement des activités reproductrices
00:35
of other people.
6
35277
1309
d’autres personnes.
00:36
(Laughter)
7
36610
1032
(Rires)
00:37
Of course, I'm talking about genealogy --
8
37666
2250
Évidemment, je parle de généalogie,
00:39
(Laughter)
9
39940
1214
(Rires)
00:41
the study of family history.
10
41178
1702
l’étude des histoires familiales.
00:43
When it comes to detailing family history,
11
43353
2037
Dans chaque famille,
00:45
in every family, we have this person that is obsessed with genealogy.
12
45414
3943
il y a toujours un membre de la famille obsédé par la généalogie.
00:49
Let's call him Uncle Bernie.
13
49381
1713
On va l’appeler l’oncle Bernie.
00:51
Uncle Bernie is exactly the last person you want to sit next to
14
51118
3782
Il est la personne qu'on ne veut pas à côté de soi
00:54
in Thanksgiving dinner,
15
54924
1599
aux dîners de famille
00:56
because he will bore you to death with peculiar details
16
56547
2814
parce qu’il est ennuyant à mort avec tous ces détails
00:59
about some ancient relatives.
17
59385
1966
d’un parent éloigné.
01:02
But as you know,
18
62462
1262
Mais comme vous le savez,
01:03
there is a scientific side for everything,
19
63748
2872
la science est partout
01:06
and we found that Uncle Bernie's stories
20
66644
2978
et on pense que les histoires d’oncle Bernie
01:09
have immense potential for biomedical research.
21
69646
3168
ont un grand potentiel pour la recherche biomédicale.
01:13
We let Uncle Bernie and his fellow genealogists
22
73306
2714
On laisse l’oncle Bernie et ses amis généalogistes
01:16
document their family trees through a genealogy website called geni.com.
23
76044
4668
rentrer leurs arbres généalogiques sur un site nommé geni.com
01:21
When users upload their trees to the website,
24
81198
2128
Quand les arbres généalogiques sont téléchargés,
01:23
it scans their relatives,
25
83350
1690
le site scanne les membres.
01:25
and if it finds matches to existing trees,
26
85064
2075
S’il y a des concordances
01:27
it merges the existing and the new tree together.
27
87163
3610
avec d’autres arbres, ceux-ci sont fusionnés,
01:31
The result is that large family trees are created,
28
91768
2950
créant ainsi un arbre plus étendu,
01:34
beyond the individual level of each genealogist.
29
94742
3479
qui va au-delà de l’individualité de chaque généalogiste.
01:38
Now, by repeating this process with millions of people
30
98808
4129
En répétant ce processus avec des millions de personnes
01:42
all over the world,
31
102961
1817
à travers le monde,
01:44
we can crowdsource the construction of a family tree of all humankind.
32
104802
5532
on peut assembler un arbre pour toute l’humanité.
01:51
Using this website,
33
111292
1584
Grâce à ce site,
01:52
we were able to connect 125 million people
34
112900
4813
on a pu connecter 125 millions de personnes
01:57
into a single family tree.
35
117737
2521
en un seul arbre généalogique.
02:00
I cannot draw the tree on the screens over here
36
120967
2788
Je ne peux pas vous montrer l’arbre sur ces écrans
02:03
because they have less pixels
37
123779
2165
parce qu’ils ont moins de pixels
02:05
than the number of people in this tree.
38
125968
2513
que le nombre de personnes sur l’arbre.
02:08
But here is an example of a subset of 6,000 individuals.
39
128505
5010
Mais voici un exemple d’un plus petit arbre avec 6 000 individus.
02:14
Each green node is a person.
40
134159
2362
Chaque nœud vert est une personne.
02:17
The red nodes represent marriages,
41
137060
2849
Les nœuds rouges représentent les mariages
02:19
and the connections represent parenthood.
42
139933
2258
et les lignes la relation parent-enfant.
02:22
In the middle of this tree, you see the ancestors.
43
142557
2372
Au milieu de l’arbre se trouvent les ancêtres.
02:24
And as we go to the periphery, you see the descendants.
44
144953
2604
En périphérie se trouvent les descendants.
02:27
This tree has seven generations, approximately.
45
147581
3102
Sur cet arbre, il y a environ sept générations.
02:31
Now, this is what happens when we increase the number of individuals
46
151692
3234
Voici ce qui arrive lorsqu’on augmente le nombre d’individus
02:34
to 70,000 people --
47
154950
1828
à 70 000 personnes.
02:36
still a tiny subset of all the data that we have.
48
156802
4330
Toujours un petit sous-ensemble de nos données.
02:41
Despite that, you can already see the formation of gigantic family trees
49
161629
4813
Malgré tout, vous voyez bien l’assemblage d’un arbre généalogique gigantesque
02:46
with many very distant relatives.
50
166466
2655
avec de la parenté très éloignée.
02:49
Thanks to the hard work of our genealogists,
51
169610
3134
Grâce au travail sans relâche de nos généalogistes,
02:52
we can go back in time hundreds of years ago.
52
172768
3103
on peut reculer dans le temps sur des centaines d’années.
02:56
For example, here is Alexander Hamilton,
53
176418
3441
Par exemple, ici c’est Alexander Hamilton,
02:59
who was born in 1755.
54
179883
2475
né en 1755.
03:02
Alexander was the first US Secretary of the Treasury,
55
182872
3764
Alexander a été le premier secrétaire au Trésor des États-Unis.
03:06
but mostly known today due to a popular Broadway musical.
56
186660
3831
Aujourd’hui, il est populaire à cause d’une comédie musicale de Broadway.
03:11
We found that Alexander has deeper connections in the showbiz industry.
57
191137
4922
Alexander a de bons contacts dans le showbiz.
03:16
In fact, he's a blood relative of ...
58
196083
2111
En fait, il a des liens de parenté avec…
03:18
Kevin Bacon!
59
198781
1220
Kevin Bacon
03:20
(Laughter)
60
200025
2032
(Rires)
03:22
Both of them are descendants of a lady from Scotland
61
202081
2606
Tous les deux sont les descendants d’une dame écossaise
03:24
who lived in the 13th century.
62
204711
2314
ayant vécu au XIIIe siècle.
03:27
So you can say that Alexander Hamilton
63
207049
3102
On peut donc dire qu’Alexander Hamilton
03:30
is 35 degrees of Kevin Bacon genealogy.
64
210175
3188
est à 35 degrés de l’arbre de Kevin Bacon.
03:33
(Laughter)
65
213387
1441
(Rires)
03:34
And our tree has millions of stories like that.
66
214852
3230
Et notre arbre a des millions d’autres histoires.
03:40
We invested significant efforts to validate the quality of our data.
67
220113
4890
On s’est donné du mal pour valider la qualité de ces données.
03:45
Using DNA, we found that .3 percent of the mother-child connections in our data
68
225027
5391
En utilisant de l’ADN, on s’est aperçu que 0,3 % des relations mères-enfants
étaient incongrues dans nos données.
03:50
are wrong,
69
230442
1250
03:51
which could match the adoption rate in the US pre-Second World War.
70
231716
3591
Ce qui correspondrait au taux d’adoption avant la Seconde Guerre mondiale.
03:56
For the father's side,
71
236847
1785
Pour le côté paternel,
03:58
the news is not as good:
72
238656
1961
les nouvelles n’étaient pas bonnes :
04:02
1.9 percent of the father-child connections in our data are wrong.
73
242149
5600
1,9 % des relations père-enfant étaient incongrues.
04:07
And I see some people smirk over here.
74
247773
2363
Je vois quelques-uns avec un sourire en coin,
04:10
It is what you think --
75
250160
1717
c’est exactement ce que vous croyez.
04:11
there are many milkmen out there.
76
251901
1789
Plusieurs facteurs parcourent les rues.
04:13
(Laughter)
77
253714
1064
(Rires)
04:14
However, this 1.9 percent error rate in patrilineal connections
78
254802
3989
Ce 1,9 % d’erreur sur la lignée patriarcale
04:18
is not unique to our data.
79
258815
1769
n’est pas exclusif à nos données.
04:20
Previous studies found a similar error rate
80
260608
3069
Des études antérieures ont trouvé un taux similaire
04:23
using clinical-grade pedigrees.
81
263701
2021
dans les antécédents cliniques.
04:26
So the quality of our data is good,
82
266254
2525
Donc, la qualité de notre travail est bonne
04:28
and that should not be a surprise.
83
268803
2133
et ce n’est pas surprenant.
04:30
Our genealogists have a profound, vested interest
84
270960
3776
L’entrée fidèle des informations familiales est quelque chose
04:34
in correctly documenting their family history.
85
274760
3668
que nos généalogistes tiennent à cœur.
04:40
We can leverage this data to learn quantitative information about humanity,
86
280594
4591
On peut miser sur ces données pour en apprendre plus sur l’humanité,
04:45
for example, questions about demography.
87
285209
2596
par exemple, sur la démographie.
04:47
Here is a look at all our profiles on the map of the world.
88
287829
3857
Voici un aperçu de l’ensemble des profils à travers le monde.
04:52
Each pixel is a person that lived at some point.
89
292250
4481
Chaque pixel représente une personne ayant vécu à un certain moment.
04:56
And since we have so much data,
90
296755
1680
Avec toutes ces données,
04:58
you can see the contours of many countries,
91
298459
2781
on peut voir les frontières de plusieurs pays,
05:01
especially in the Western world.
92
301264
2099
particulièrement dans le monde occidental.
05:03
In this clip, we stratified the map that I've showed you
93
303387
3548
Dans cette séquence, on a segmenté la carte que je vous ai montrée,
05:06
based on the year of births of individuals from 1400 to 1900,
94
306959
5072
selon l’année de naissance d’individus, ayant vécu entre 1400 et 1900
05:12
and we compared it to known migration events.
95
312055
2766
et on a comparé ça aux grandes migrations connues.
05:15
The clip is going to show you that the deepest lineages in our data
96
315482
3165
La séquence montre que les lignées les plus anciennes dans nos données
05:18
go all the way back to the UK,
97
318671
1627
remontent au Royaume-Uni.
05:20
where they had better record keeping,
98
320322
1808
où l’on tenait mieux les registres.
05:22
and then they spread along the routes of Western colonialism.
99
322154
3282
On peut voir ces lignées suivre les routes du colonialisme occidental.
05:25
Let's watch this.
100
325460
1322
Regardons.
05:27
(Music)
101
327143
1609
(Musique)
05:28
[Year of birth: ]
102
328776
2341
[Année de naissance :]
05:31
[1492 - Columbus sails the ocean blue]
103
331705
1836
[1492 : Colomb met le cap sur l’océan]
05:35
[1620 - Mayflower lands in Massachusetts]
104
335661
2000
[1620 : Le Mayflower arrive au Massachusetts]
05:38
[1652 - Dutch settle in South Africa]
105
338726
1775
[1652 : Les Néerlandais colonisent l’Afrique du Sud]
05:44
[1788 - Great Britain penal transportation to Australia starts]
106
344321
3186
[1788 : La Grande-Bretagne initie la déportation pénale vers l’Australie]
05:47
[1836 - First migrants use Oregon Trail]
107
347531
1927
[1836 : Utilisation de la piste de l’Oregon]
05:50
[all activity]
108
350149
3183
[Toutes les activités]
05:55
I love this movie.
109
355851
1543
J’aime ce film.
05:57
Now, since these migration events are giving the context of families,
110
357418
5093
Sachant que ces évènements de migration donnent le contexte familial,
06:02
we can ask questions such as:
111
362535
2183
on peut se demander :
06:04
What is the typical distance between the birth locations
112
364742
3470
quelle est la distance habituelle entre les lieux de naissance
06:08
of husbands and wives?
113
368236
2812
d'un mari et de sa femme ?
06:11
This distance plays a pivotal role in demography,
114
371072
3677
Cette distance est primordiale en démographie,
06:14
because the patterns in which people migrate to form families
115
374773
3681
car les migrations faites dans le but de fonder une famille
06:18
determine how genes spread in geographical areas.
116
378478
3713
déterminent comment les gènes sont répartis géographiquement.
06:22
We analyzed this distance using our data,
117
382706
2328
On a analysé cette distance avec nos données
06:25
and we found that in the old days,
118
385058
2290
et on a découvert qu’autrefois,
06:27
people had it easy.
119
387372
1230
on se la coulait douce.
06:28
They just married someone in the village nearby.
120
388626
2594
On mariait quelqu’un du village voisin tout simplement.
06:31
But the Industrial Revolution really complicated our love life.
121
391958
3705
C’est la révolution industrielle qui a compliqué les amours.
06:35
And today, with affordable flights and online social media,
122
395687
4560
De nos jours, avec des billets d’avion abordables et les médias sociaux,
06:40
people typically migrate more than 100 kilometers from their place of birth
123
400271
4828
les gens sont prêts à migrer à plus de 100 km de leur lieu de naissance,
06:45
to find their soul mate.
124
405123
1504
afin de trouver leur âme sœur.
06:48
So now you might ask:
125
408524
1187
Là vous vous demandez :
06:49
OK, but who does the hard work of migrating from places to places
126
409735
4496
d’accord, mais qui prend la peine d’émigrer
06:54
to form families?
127
414255
1269
pour fonder une famille ?
06:55
Are these the males or the females?
128
415548
3727
Les hommes ou les femmes ?
06:59
We used our data to address this question,
129
419752
2155
On a utilisé nos données pour le découvrir.
07:01
and at least in the last 300 years,
130
421931
2594
On a trouvé qu’au moins depuis les dernières 300 années,
07:04
we found that the ladies do the hard work
131
424549
3883
ce sont les femmes qui se donnent cette peine
07:08
of migrating from places to places to form families.
132
428456
2996
de migrer pour fonder une famille.
07:11
Now, these results are statistically significant,
133
431476
3101
Ces résultats sont significatifs, statistiquement parlant.
07:14
so you can take it as scientific fact that males are lazy.
134
434601
3471
Alors, c’est un fait scientifique : les hommes sont paresseux.
07:18
(Laughter)
135
438096
3156
(Rires)
07:21
We can move from questions about demography
136
441276
2536
On peut laisser de côté les questions démographiques
07:23
and ask questions about human health.
137
443836
2913
et traiter les questions de santé.
07:26
For example, we can ask
138
446773
1487
Par exemple, demandons-nous
07:28
to what extent genetic variations account for differences in life span
139
448284
4963
jusqu’à quel point les variations génétiques affectent la durée de vie
07:33
between individuals.
140
453271
1194
de différents individus.
07:34
Previous studies analyzed the correlation of longevity between twins
141
454988
4530
Par le passé, afin de répondre à cette question, on analysait la corrélation
07:39
to address this question.
142
459542
1442
de longévité entre jumeaux.
07:41
They estimated that the genetic variations account for
143
461411
2667
On estimait que les variations génétiques affectaient
07:44
about a quarter of the differences in life span between individuals.
144
464102
4040
un quart des différences de la durée de vie, à peu près.
07:48
But twins can be correlated due to so many reasons,
145
468688
2598
Cependant, les jumeaux sont corrélés par plusieurs choses
07:51
including various environmental effects
146
471310
2304
dont les effets de l’environnement
07:53
or a shared household.
147
473638
1622
ou une cohabitation.
07:56
Large family trees give us the opportunity to analyze both close relatives,
148
476411
3753
Des arbres plus grands nous donnent l’occasion d’analyser des parents proches
08:00
such as twins,
149
480188
1207
comme des jumeaux,
08:01
all the way to distant relatives, even fourth cousins.
150
481419
2917
aussi bien que des parents très éloignés.
08:04
This way we can build robust models
151
484749
2689
Ainsi, on peut élaborer des modèles solides
08:07
that can tease apart the contribution of genetic variations
152
487462
3708
qui peuvent discriminer la contribution génétique
08:11
from environmental factors.
153
491194
1717
de celle des facteurs environnementaux.
08:13
We conducted this analysis using our data,
154
493379
2899
On a conduit cette analyse avec nos données.
08:16
and we found that genetic variations explain only 15 percent
155
496302
5791
On a trouvé que les variations génétiques n’expliquent que 15 %
08:22
of the differences in life span between individuals.
156
502117
2806
de la différence de la durée de vie entre les individus.
08:26
That is five years, on average.
157
506760
2756
On parle de 5 ans, en moyenne.
08:30
So genes matter less than what we thought before to life span.
158
510316
4708
Donc, les gènes affectent la durée de vie moins qu’on le pensait.
08:35
And I find it great news,
159
515675
2136
C’est une bonne nouvelle,
08:38
because it means that our actions can matter more.
160
518438
3293
parce que ça veut dire que nos actions sont plus importantes.
08:42
Smoking, for example, determines 10 years of our life expectancy --
161
522533
4274
Par exemple, fumer joue sur 10 ans de notre durée de vie,
08:46
twice as much as what genetics determines.
162
526831
2646
le double de la génétique.
08:50
We can even have more surprising findings
163
530236
2289
On a même plus de résultats étonnants
08:52
as we move from family trees
164
532549
1492
en bougeant à travers les arbres
08:54
and we let our genealogists document and crowdsource DNA information.
165
534065
4732
et laissant nos généalogistes rentrer et réunir les infos ADN.
08:58
And the results can be amazing.
166
538821
2024
Les résultats peuvent être fascinants.
09:01
It might be hard to imagine, but Uncle Bernie and his friends
167
541255
3915
Il est peut-être difficile d’y penser, mais l’oncle Bernie et ses amis
09:05
can create DNA forensic capabilities
168
545194
2646
forment une expertise médico-légale d’ADN
09:07
that even exceed what the FBI currently has.
169
547864
3559
qui dépasse même celle du FBI.
09:12
When you place the DNA on a large family tree,
170
552862
2404
Quand on place l’ADN sur un grand arbre,
09:15
you effectively create a beacon
171
555290
2117
on crée une balise
09:17
that illuminates the hundreds of distant relatives
172
557431
2634
qui illumine des centaines de parents éloignés
09:20
that are all connected to the person that originated the DNA.
173
560089
3490
qui sont connectés à la personne de laquelle provient l’ADN.
09:24
By placing multiple beacons on a large family tree,
174
564505
2913
En plaçant plusieurs balises sur des grands arbres,
09:27
you can now triangulate the DNA of an unknown person,
175
567442
3720
on peut trianguler l’ADN d’une personne jusqu’alors inconnue,
09:31
the same way that the GPS system uses multiple satellites
176
571186
3938
de la même façon qu’un système GPS utilise plusieurs satellites
09:35
to find a location.
177
575148
1324
pour trouver un point.
09:37
The prime example of the power of this technique
178
577226
3624
L’exemple par excellence montrant la puissance de ceci
09:40
is capturing the Golden State Killer,
179
580874
2675
est la saisie du tueur de Golden State,
09:44
one of the most notorious criminals in the history of the US.
180
584612
4528
un des criminels les plus connus aux États-Unis.
09:49
The FBI had been searching for this person for over 40 years.
181
589164
5892
Le FBI a cherché cette personne pendant plus de 40 ans.
09:55
They had his DNA,
182
595588
1835
Ils avaient son ADN,
09:57
but he never showed up in any police database.
183
597447
3350
mais il n’y a jamais eu de correspondance avec les données policières.
10:01
About a year ago, the FBI consulted a genetic genealogist,
184
601447
4712
Il y a environ un an, le FBI a consulté un généalogiste génétique
10:06
and she suggested that they submit his DNA to a genealogy service
185
606183
3950
qui leur a suggéré de déposer l’ADN à un service de recherche généalogique
10:10
that can locate distant relatives.
186
610157
2398
qui localise les parents éloignés.
10:13
They did that,
187
613117
1156
Ils l’ont fait.
10:14
and they found a third cousin of the Golden State Killer.
188
614297
3692
Ils ont trouvé un cousin de 3e degré du tueur du Golden State.
10:18
They built a large family tree,
189
618013
2344
Ils ont construit un grand arbre généalogique,
10:20
scanned the different branches of that tree,
190
620381
2102
ont examiné différentes branches de cet arbre,
10:22
until they found a profile that exactly matched
191
622507
2565
jusqu’à trouver un profil qui correspondait exactement
10:25
what they knew about the Golden State Killer.
192
625096
2581
à ce qu’ils connaissaient du tueur du Golden State.
10:27
They obtained DNA from this person and found a perfect match
193
627701
3592
Ils ont récupéré l’ADN de cet individu et ont eu une correspondance parfaite
10:31
to the DNA they had in hand.
194
631317
2025
avec l’ADN qu’ils avaient.
10:33
They arrested him and brought him to justice
195
633366
2350
Il a été arrêté et présenté à la justice
10:35
after all these years.
196
635740
1424
après toutes ces années.
10:38
Since then, genetic genealogists have started working with
197
638172
3241
Depuis, les généalogistes génétiques travaillent
10:41
local US law enforcement agencies
198
641437
2668
avec les forces de l’ordre locales, aux États-Unis,
10:44
to use this technique in order to capture criminals.
199
644129
3362
pour arrêter des criminels.
10:47
And only in the past six months,
200
647521
2681
En l’espace de six mois,
10:50
they were able to solve over 20 cold cases with this technique.
201
650226
4296
cette technique a permis de résoudre 20 cas classés sans suite.
10:56
Luckily, we have people like Uncle Bernie and his fellow genealogists
202
656203
4636
Heureusement qu'on a des gens comme oncle Bernie et ses amis généalogistes.
11:01
These are not amateurs with a self-serving hobby.
203
661045
2994
Ce ne sont pas des amateurs avec un simple passe-temps.
11:04
These are citizen scientists with a deep passion to tell us who we are.
204
664602
6419
Ce sont des citoyens scientifiques passionnés de nous conter qui nous sommes.
11:11
And they know that the past can hold a key to the future.
205
671065
4458
Ils savent que la clé du futur se forge dans le passé.
11:16
Thank you very much.
206
676067
1183
Merci beaucoup.
11:17
(Applause)
207
677314
3469
(Applaudissements)
À propos de ce site Web

Ce site vous présentera des vidéos YouTube utiles pour apprendre l'anglais. Vous verrez des leçons d'anglais dispensées par des professeurs de premier ordre du monde entier. Double-cliquez sur les sous-titres anglais affichés sur chaque page de vidéo pour lire la vidéo à partir de là. Les sous-titres défilent en synchronisation avec la lecture de la vidéo. Si vous avez des commentaires ou des demandes, veuillez nous contacter en utilisant ce formulaire de contact.

https://forms.gle/WvT1wiN1qDtmnspy7