How AI Is Decoding Ancient Scrolls | Julian Schilliger and Youssef Nader | TED

89,320 views

2025-01-30 ・ TED


New videos

How AI Is Decoding Ancient Scrolls | Julian Schilliger and Youssef Nader | TED

89,320 views ・ 2025-01-30

TED


Veuillez double-cliquer sur les sous-titres anglais ci-dessous pour lire la vidéo.

Traducteur: eric vautier Relecteur: Claire Ghyselen
00:04
We always think about the potential of AI changing the future.
0
4020
3880
Youssef Nader : Nous pensons toujours au potentiel de l’IA pour changer l’avenir.
00:08
But what about the potential of AI changing the past?
1
8900
2760
Mais qu’en est-il de la capacitĂ© de l’IA Ă  changer le passĂ© ?
00:12
My name is Youssef Nader.
2
12860
1560
Je m'appelle Youssef Nader.
00:14
I'm an Egyptian AI researcher
3
14460
1960
Je suis un chercheur en IA Ă©gyptien,
00:16
and a PhD student at the Free University in Berlin,
4
16460
3120
et doctorant Ă  l’UniversitĂ© libre de Berlin.
00:19
and last year, I led the Vesuvius Grand Prize winning team
5
19620
4960
L’annĂ©e derniĂšre, j’ai dirigĂ© l’équipe laurĂ©ate du Grand Prix du VĂ©suve
00:24
on exploring this very question.
6
24620
2240
qui a étudié cette question précise.
00:27
You see, the story starts almost 2,000 years ago.
7
27900
3320
L’histoire commence il y a presque 2 000 ans.
00:32
A Greek philosopher that we believe was Philodemus of Gadara
8
32180
4040
Un philosophe grec que nous pensons ĂȘtre PhilodĂšme de Gadara
00:36
sat in one of the many rooms of the Villa dei Papiri.
9
36260
2880
Ă©tait dans l’une des nombreuses piĂšces de la Villa dei Papiri.
00:39
He talked about music, he talked about pleasure,
10
39980
3280
Il parlait de musique, il parlait de plaisir,
00:43
he talked about what makes things enjoyable,
11
43260
2560
il parlait de ce qui rend les choses agréables,
00:45
questions that still plague us until today.
12
45860
2280
des questions qui nous tourmentent encore aujourd’hui.
00:49
One of his scribes wrote down his thoughts on sheets of papyrus.
13
49300
4800
L’un de ses scribes a Ă©crit ses pensĂ©es sur des feuilles de papyrus.
00:54
The sheets were rolled and stowed away for later generations.
14
54660
4320
Les feuilles ont été roulées et rangées pour les générations à venir.
01:00
Fast-forward 150 years, ...
15
60180
3120
Cent cinquante ans plus tard,
01:04
Mount Vesuvius erupts,
16
64380
2160
le VĂ©suve entre en Ă©ruption,
01:06
burying Herculaneum, the villa and the words of the philosopher
17
66540
4800
ensevelissant Herculanum, la villa et les paroles du philosophe
01:11
under a sea of hot mud and ashes.
18
71380
2840
sous une vague de lave et de cendres.
01:15
Now fast-forward again, to the 17th century.
19
75460
2400
Maintenant, avançons au 17e siÚcle.
01:18
People are excavating around the area.
20
78420
2160
Les gens font des fouilles dans la zone.
01:21
They found beautiful statues, breathtaking frescoes
21
81180
4360
Ils ont trouvé de belles statues, des fresques à couper le souffle,
01:25
and some weird-looking pieces of charcoal,
22
85580
3640
et des morceaux de fusain Ă©tranges,
01:29
like you see in this picture.
23
89260
1720
comme vous pouvez le voir sur cette photo.
01:31
This is when the first scrolls were discovered,
24
91700
2880
C’est lĂ  que les premiers parchemins ont Ă©tĂ© dĂ©couverts.
01:34
and people were racing to excavate more of these.
25
94620
3000
Les gens se prĂ©cipitaient pour en extraire d’autres.
01:38
What knowledge is included that is not known to us now?
26
98300
4320
Quelles y sont les connaissances que nous ne connaissons plus aujourd’hui ?
01:42
What things should we know about these scrolls?
27
102660
2920
Que devons-nous savoir Ă  propos de ces parchemins ?
01:48
My name is Julian, and I am a digital archaeologist.
28
108860
5040
Julian Schilliger : Je m’appelle Julian et je suis archĂ©ologue numĂ©rique.
01:55
When the pyroclastic flow hit the scrolls, it had a destructive effect.
29
115660
6920
Lorsque le flux pyroclastique a touché les parchemins, il a eu un effet destructeur.
02:03
It tore into them, shredded off pieces, and it charred them badly.
30
123460
6200
Il les a déchirés, en a arraché des morceaux et les a gravement carbonisés.
02:09
Even the deformation that you can see happened at that point.
31
129700
5120
MĂȘme la dĂ©formation que vous pouvez voir s'est produite Ă  ce moment-lĂ .
02:14
People, 250-something years ago,
32
134860
3920
Il y a environ 250 ans,
02:18
were curious what's lying inside those scrolls,
33
138780
3240
les gens Ă©taient curieux de savoir ce qu’il y avait Ă  l’intĂ©rieur,
02:22
hidden and not accessible anymore.
34
142060
3200
cachés et désormais inaccessibles.
02:26
Because of a lack of technology,
35
146020
1920
Faute de technologie,
02:27
they had to resort to physically unrolling
36
147980
3920
ils ont dû recourir à les dérouler,
02:31
and thereby destroying most of the scrolls.
37
151900
3680
détruisant ainsi la plupart des parchemins.
02:36
To this day,
38
156340
1320
À ce jour,
02:37
only the most damaged and deformed scrolls
39
157700
3000
seuls les rouleaux les plus endommagés et les plus déformés
02:40
remain in their initial, rolled-up configuration.
40
160740
4200
conservent leur configuration initiale, en rouleaux.
02:45
Fast-forwarding a little bit, the computer age arrives.
41
165780
4320
Avançons dans les temps et nous voilà à l’ùre informatique.
02:50
Youssef and I are born.
42
170140
2960
Youssef et moi sommes nés.
02:53
We are going on and getting our education --
43
173100
2840
Nous poursuivons nos Ă©tudes -
02:55
(Laughter)
44
175940
1760
(Rires)
02:57
and at the same time, Brent Seales, a researcher and professor,
45
177700
6080
et Ă  la mĂȘme Ă©poque, Brent Seales, chercheur et professeur,
03:03
had the idea to use CT scan technology to actually digitize the scrolls,
46
183820
6560
a l’idĂ©e d’utiliser la tomodensitomĂ©trie pour numĂ©riser les rouleaux,
03:10
with the hope of, one day, digitally unrolling them.
47
190420
5640
dans l’espoir de les dĂ©rouler numĂ©riquement un jour.
03:16
Behind me, you can see a video of such a CT scan,
48
196100
3520
DerriÚre moi, vous en voyez une vidéo.
03:19
and it goes through the CT scan 3D volume,
49
199660
3400
On parcourt le volume en 3D, couche par couche.
03:23
layer by layer.
50
203100
1200
03:25
The papyrus is visible as a spiral,
51
205020
4080
Le papyrus est enroulé en spirale.
03:29
and you can see it's tightly wound-up,
52
209100
2080
Vous voyez qu’il est trĂšs serrĂ©,
03:31
sometimes touching each other, flaying off.
53
211220
2720
se pliant parfois, s’abümant.
03:33
It's a difficult question, how to unroll this digitally.
54
213980
3640
Le dĂ©rouler numĂ©riquement n’est pas une chose aisĂ©e.
03:38
Nat Friedman, a Silicon Valley investor,
55
218740
3440
Nat Friedman, un investisseur de la Silicon Valley,
03:42
also saw this research, and he wanted to help.
56
222220
3640
a entendu parler de cette recherche et a voulu apporter son aide.
03:46
That was in 2022.
57
226420
2360
C'Ă©tait en 2022.
03:48
He reached out, and together with Brent Seales,
58
228820
3080
Il s’est manifestĂ© et, avec Brent Seales,
03:51
they created the Vesuvius Challenge,
59
231940
2760
ils ont créé le Vesuvius Challenge,
03:54
with the goal to motivate nerds all over the world
60
234740
3720
dans le but de motiver les geeks du monde entier à résoudre ce problÚme.
03:58
to solve this problem.
61
238460
1560
04:00
(Laughter)
62
240020
1920
(Rires)
04:01
They created a grand prize,
63
241980
1800
Ils ont créé un prix,
04:03
promising eternal glory and monetary incentives
64
243820
3560
promettant la gloire éternelle et une récompense financiÚre
04:07
to anyone who could do that.
65
247420
1560
Ă  tous ceux qui y arriveraient.
04:09
(Laughter)
66
249020
1800
(Rires)
04:10
I myself saw that on the internet
67
250860
2280
Je l’ai vu sur Internet
04:13
while writing my master's thesis at ETH Zurich, in robotics,
68
253180
4040
alors que je rĂ©digeais mon mĂ©moire de master en robotique Ă  l’ETH Zurich,
04:17
and I was instantly happy to solve it --
69
257220
3280
et j’ai tout de suite Ă©tĂ© heureux de le rĂ©soudre,
04:20
or at least try, why not, you know?
70
260540
2320
ou du moins d’essayer.
04:22
And I went on, joined the Discord community
71
262900
3880
J’ai ensuite rejoint la communautĂ© Discord
04:26
where all the people that were also contestants
72
266820
2720
oĂč tous les participants jouaient avec les donnĂ©es
04:29
and playing with the scroll data
73
269540
1800
04:31
were exchanging ideas,
74
271340
2080
et échangeaient des idées.
04:33
and I joined there and started working on it.
75
273420
2840
DĂšs que je les ai rejoints, j’ai commencĂ© Ă  travailler dessus.
04:37
Also there, on Discord, I met Youssef and Luke [Farritor],
76
277820
3240
LĂ , j’ai rencontrĂ© Youssef et Luke [Farritor],
04:41
who would become my teammates,
77
281100
1440
avec qui on allait faire Ă©quipe et remporter le prix.
04:42
and with whom I would actually win the grand prize.
78
282580
3360
04:45
Surprisingly, it went on, and made global headline news.
79
285980
3800
Étonnamment, on a rĂ©ussi et ça a fait la une dans le monde entier.
04:50
It even got into the British tabloids.
80
290460
2400
MĂȘme dans les tabloĂŻds en Angleterre.
04:52
(Laughter)
81
292900
3040
(Rires)
04:55
So when we started,
82
295940
1560
Quand nous avons commencé, il restait deux problÚmes principaux.
04:57
there were two main problems still remaining.
83
297500
3400
05:00
One, you had to unroll the scroll.
84
300940
2840
PremiÚrement, il fallait dérouler le parchemin.
05:03
And two, you then had to make the ink visible.
85
303780
3560
Et deuxiùmement, il fallait ensuite rendre l’encre visible.
05:07
Youssef will tell you more about that part.
86
307380
2280
Youssef vous en dira plus sur cette partie.
05:10
For me, the most exciting thing
87
310660
2120
Pour moi, le plus intéressant
05:12
was the computer-vision problem of unrolling those scrolls virtually.
88
312780
4280
Ă©tait d’essayer de dĂ©rouler virtuellement ces parchemins.
05:17
I decided to iterate on a tool
89
317060
2240
J’ai dĂ©cidĂ© d’utiliser un outil crĂ©Ă© par des chercheurs du Kentucky,
05:19
that was created by the Kentucky researchers,
90
319340
2800
05:22
and make it faster, less prone to errors
91
322180
3640
de le rendre plus rapide, moins sujet aux erreurs
05:25
and just iterate on it and make it better.
92
325820
2800
et de simplement l’amĂ©liorer par itĂ©rations successives.
05:29
The Vesuvius Challenge team saw that
93
329380
1840
L’équipe a vu cet outil
05:31
and also implemented a team of 10 people that would use my tool.
94
331220
4680
et a mis en place une Ă©quipe de 10 personnes pour l’utiliser.
05:35
They would annotate scroll data, like you see in this video,
95
335940
3840
Ils annotaient les données du parchemin, comme vous le voyez dans cette vidéo.
05:39
where they created a red line where the surface would lie.
96
339820
3440
Ils traçaient une ligne rouge lĂ  oĂč se trouvait la surface.
05:43
The algorithm then would take it into 3D space,
97
343300
3120
L’algorithme extrapolait ensuite en 3D,
05:46
creating a three-dimensional representation of the surface.
98
346460
4040
créant ainsi une représentation tridimensionnelle de la surface,
05:50
Computer algorithms
99
350860
1240
puis l’aplatissait et crĂ©aient un segment.
05:52
would then flatten it and create a segment.
100
352140
2360
05:55
This all would be called “segmentation”
101
355220
2680
On appelait ça « segmentation »
05:57
in the space of the scrolling and unrolling community.
102
357940
6240
dans la communauté du déroulage des parchemins.
06:04
(Laughter)
103
364940
5200
(Rires)
06:10
So I created open-source commits to this tool
104
370140
5760
J’ai donc crĂ©Ă© des mises Ă  jour open source de cet outil
06:15
and implemented new algorithms from my studies, like Optical Flow,
105
375900
3840
et implémenté de nouveaux algorithmes issus de mes études, comme Optical Flow,
06:19
to better track the sheets through the volume,
106
379780
3560
pour mieux suivre les feuilles dans le volume.
06:23
and we end up with something like what you see behind me.
107
383380
3840
Nous nous sommes retrouvés avec ce que vous voyez derriÚre moi.
06:27
First off, those were really small segments,
108
387260
2920
Au dĂ©but, il s’agissait de trĂšs petits segments.
06:30
and I added improvement,
109
390180
1480
J’ai amĂ©liorĂ©, accĂ©lĂ©rĂ© le code
06:31
made the code faster
110
391700
1440
06:33
and had lots of feedback from the community.
111
393180
2880
et reçu de nombreux commentaires de la communauté.
06:36
They were really happy, and I was happy getting lots of feedback.
112
396100
3400
Ils Ă©taient contents, et je l’étais d’en recevoir beaucoup.
06:39
It was a really positive environment.
113
399540
2120
C'Ă©tait un environnement vraiment positif.
06:43
So in the end,
114
403300
1800
Au final,
06:45
I could track the performance of the algorithms,
115
405140
2720
j’ai pu suivre les performances des algorithmes,
06:47
how the segmentation team performed,
116
407900
2160
celles de l’équipe de segmentation,
06:50
and I could see that my improvements, from start to finish,
117
410100
3560
et j’ai pu constater que, grĂące aux amĂ©liorations,
06:53
would be around a 10,000-fold improvement over the initial version.
118
413660
5560
le logiciel Ă©tait 10 000 fois plus rapide que la version initiale.
07:00
This algorithm was then also used to unroll all the area
119
420580
4320
Cet algorithme a ensuite été utilisé
pour dérouler tout ce que vous pouvez voir dans notre soumission.
07:04
that you can see in our submission.
120
424940
2040
07:07
All the sheets were generated with these methods.
121
427020
3240
Toutes les feuilles ont été générées avec ces méthodes.
07:11
In December, I was looking for teammates.
122
431620
3280
En décembre, je cherchais des coéquipiers.
07:14
I made a blog post,
123
434940
1280
J’ai publiĂ© un billet de blog et prĂ©sentĂ© mes derniers algorithmes,
07:16
and I showcased my newest algorithms,
124
436260
3280
07:19
reaching out to anyone that was willing to team up.
125
439580
3240
en répondant à tous ceux qui souhaitaient me rejoindre.
07:23
Youssef and Luke got into contact with me.
126
443780
3160
Youssef et Luke m’ont contactĂ©.
07:27
They were happy to team up, and I was happy as well.
127
447740
3280
Ils Ă©taient contents de me rejoindre, et moi aussi.
07:31
(Laughter)
128
451740
1400
(Rires)
07:33
So after the virtual unwrapping, the words still are not visible.
129
453820
4720
YN : AprÚs le déroulage virtuel, les mots ne sont toujours pas visibles.
07:39
The main problem is that the ink that was used at the time
130
459100
2920
Le principal problĂšme est que l’encre utilisĂ©e Ă  l’époque
Ă©tait une encre Ă  base de carbone.
07:42
was a carbon-based ink,
131
462020
1840
07:43
and carbon-based ink on carbon-based papyrus in a CT scan
132
463900
3440
Une telle encre sur un papyrus Ă  base de carbone
n’est pas visible par tomodensitomĂ©trie, ou du moins pas Ă  l’Ɠil nu.
07:47
isn’t visible, or at least [not] to the naked eye.
133
467380
2800
07:50
So the same team at the University of Kentucky
134
470860
2200
La mĂȘme Ă©quipe de l’UniversitĂ© du Kentucky
07:53
decided to test whether the ink was present at all
135
473100
2600
a voulu vĂ©rifier si l’encre Ă©tait prĂ©sente dans les tomodensitogrammes.
07:55
in the CT scans.
136
475700
1360
07:57
For this, they took some of the pieces that people broke off the scrolls,
137
477100
5160
Pour cela, ils ont récupéré certains des morceaux qui avaient été arrachés
08:02
and they fed them into the same pipeline of the X-ray CT scanning,
138
482260
5040
et les ont introduits dans le mĂȘme tomodensitomĂštre.
08:07
and this gives us the 3D data that we were working with.
139
487300
3040
Ça a donnĂ© les donnĂ©es 3D avec lesquelles nous travaillions.
08:10
Because you can see the ink and it’s an exposed surface,
140
490380
3840
On voit l’encre, car la surface est exposĂ©e.
08:14
you can even improve it with infrared imaging.
141
494220
2600
C’est encore mieux grñce à une imagerie infrarouge.
08:16
And this gives you a ground truth
142
496820
1640
Cela donne une idĂ©e prĂ©cise des lettres qu’on essayait de trouver.
08:18
of what letters you're actually trying to find.
143
498460
2480
08:21
And then from there,
144
501620
1280
À partir de là,
08:22
you can train a machine-learning model to try to find these letters.
145
502940
3640
on entraüne un modùle d’apprentissage automatique pour trouver ces lettres.
08:27
The way this works
146
507260
1440
Le modĂšle examine de trĂšs petits cubes un par un
08:28
is that the model looks at very small cubes at a single time
147
508740
3440
08:32
and tries to decide whether there is ink present in this area or not.
148
512220
4080
et essaie de dĂ©cider s’il y a de l’encre dans cette zone ou non.
08:36
And then, when you keep moving this cube all around,
149
516300
3360
Ensuite, lorsque vous continuez à déplacer ce cube tout autour,
08:39
the model gets to see different data samples
150
519700
3040
le modÚle voit différents échantillons de données,
08:42
and then tries to understand what ink actually is.
151
522780
3560
puis essaie de comprendre ce qu'est réellement l'encre.
08:47
So this is how it looks while the model is training.
152
527020
2520
Voici à quoi ressemble l’entraünement du modùle.
08:49
It's not perfect, but you can see that, especially around the middle,
153
529580
4640
Ce n'est pas parfait, mais vous pouvez voir que, surtout au milieu,
08:54
the model is starting to see the letters perfectly.
154
534260
2880
le logiciel commence Ă  voir parfaitement les lettres.
Donc, les données sont là,
08:57
So the data is there.
155
537140
2400
08:59
The ink is there.
156
539580
1240
l’encre est là, mais ça reste trùs difficile à trouver et à voir.
09:00
But it’s just very hard to find and see.
157
540820
1960
09:04
Looking at the CT scan raw data on the left here,
158
544020
4960
En observant les données brutes de tomodensitométrie, à gauche ici,
09:09
you can see the fibers,
159
549020
2280
vous pouvez voir les fibres, la structure du papyrus,
09:11
you can see the structure of the papyrus,
160
551340
2960
09:14
but the letters are very, very faint.
161
554340
2640
mais les lettres sont presqu’effacĂ©es.
09:17
The letters from the right image are very, very faint in the CT scans.
162
557020
4400
Comme on le voit sur le tomodensitogramme Ă  droite.
09:21
And they're actually, in this special case,
163
561460
3080
Et dans ce cas précis,
09:24
characterized by a difference of contrast
164
564580
2480
elles se caractérisent par une différence de contraste
09:27
and some speckles, freckles, features that are very hard to see.
165
567100
4520
et par des mouchetures, des taches, des traits trĂšs difficiles Ă  voir.
09:32
So what happens if we try to take a look
166
572340
3360
Que se passe-t-il si nous appliquons ça
09:35
at the segment that Julian was just showing?
167
575740
2720
au segment que Julian vient de montrer ?
09:40
So this is the data that we were working with.
168
580500
2720
Voici les données avec lesquelles nous travaillions.
09:43
And I'm going to give you 10 seconds to try to find the letters yourself.
169
583260
4040
Je vous donne dix secondes pour trouver les lettres vous-mĂȘmes.
09:47
(Laughter)
170
587340
1120
(Rires)
09:48
And as a hint,
171
588500
1640
Je vous donne un indice : il y a trois lettres dans cette image.
09:50
I'll tell you that there are three letters in this image.
172
590180
2720
09:52
Believe me.
173
592900
2080
Croyez-moi.
09:55
Try to find some pattern, some crackle patterns,
174
595980
5160
Essayez de trouver un motif, un motif de craquelure,
un motif de fissure, ici.
10:01
some cracks in there.
175
601140
1520
10:03
If you were able to identify this pattern of these three letters --
176
603420
4160
Si vous avez réussi à identifier ce motif à trois lettres...
10:07
(Laughter)
177
607620
2720
(Rires)(Rit.)
10:10
then congratulations.
178
610380
1200
félicitations, un an en arriÚre, vous auriez pu gagner 40 000 dollars.
10:11
One year ago, you may have won 40,000 dollars.
179
611620
2360
10:14
(Laughter)
180
614020
2000
(Rires)
10:16
However, if you're like me, and you couldn't make sense of this,
181
616060
3720
Cependant, si vous ĂȘtes comme moi et que vous n’arrivez pas Ă  comprendre,
10:19
there's a different way that you can find this ink --
182
619780
2680
il existe une autre façon de trouver cette encre,
10:22
one that actually scales very, very well.
183
622460
2440
une méthode qui le fait trÚs, trÚs bien toute seule.
10:26
So this is where my journey begins with the Vesuvius Challenge.
184
626460
3680
C’est donc là que commence mon aventure avec le Vesuvius Challenge.
10:30
There is this neat idea in computer-vision literature
185
630180
2880
Dans la littérature sur la vision par ordinateur, on dit que,
10:33
where if you don't actually have labels,
186
633060
2120
si tout n’est pas bien balisĂ©,
10:35
if you don't have the goal that you want your AI model to reach,
187
635220
4080
si vous n’avez pas l’objectif que vous souhaitez voir atteint par votre IA,
10:39
you can pick an intermediary goal along the way.
188
639300
2480
vous pouvez choisir un objectif intermédiaire en cours de route.
10:42
So, looking at these two pairs of images,
189
642500
4880
Ainsi, en observant ces images,
10:47
our eyes can identify that these are the same images,
190
647420
3040
nos yeux voient bien qu’elles sont identiques,
10:50
just flipped.
191
650500
1600
simplement inversées.
10:52
And we can do that because we understand
192
652100
2680
Et nous y arrivons parce que nous comprenons
10:54
the structures that are present in the images.
193
654820
2240
les structures présentes dans les images.
Nous voyons ce petit triangle qui est inversé,
10:57
We can see this little triangle, and it's flipped,
194
657060
3040
11:00
so we know this is the same triangle.
195
660140
2240
donc nous savons que c’est le mĂȘme triangle.
11:02
Our eyes already have this feature,
196
662420
2720
Nos yeux possÚdent cette capacité,
11:05
but neural networks don't.
197
665180
2720
mais pas les réseaux neuronaux.
11:07
When they see these images,
198
667940
1320
Quand ils voient ça,
11:09
they can't [tell] that these are the same image.
199
669260
2320
ils ne savent pas dire que c’est la mĂȘme image.
11:11
So one idea, just to let it know about the structures
200
671580
3160
Donc, une idée, pour lui faire comprendre les structures
11:14
and familiarize it with the data,
201
674780
1880
et le familiariser avec les données,
11:16
is to show it different views of the same image
202
676700
3560
est de lui montrer diffĂ©rentes vues de la mĂȘme image
11:20
and tell it that these are the same images.
203
680260
2000
et de lui dire que c’est la mĂȘme image.
11:22
And after that, you take this model
204
682900
2800
Puis vous prenez ce modĂšle
11:25
and you train it like the previous models that the University of Kentucky did.
205
685700
4440
et vous l’entraĂźnez comme ceux de l’UniversitĂ© du Kentucky.
11:30
And while the approach doesn't fully work, it also doesn't fully not work.
206
690180
4360
Et mĂȘme si l’approche ne fonctionne pas totalement,
elle ne dysfonctionne pas totalement non plus.
11:34
And this was the first image that was produced by the model.
207
694580
3840
Voici la premiĂšre image produite par le modĂšle.
11:38
And there was some very faint signal in there.
208
698460
3360
Il y avait de trĂšs faibles traces.
11:41
It seemed like the model was catching on something,
209
701860
2440
Il semblait que le modÚle avait trouvé quelque chose,
11:44
but it wasn't clear, exactly, what the model was catching on.
210
704340
3240
mais on ne savait pas exactement quoi.
11:48
So I decided to take these predictions and create a new ground truth,
211
708180
6440
J’ai donc dĂ©cidĂ© de prendre ces prĂ©dictions
et d’imposer une hypothùse.
11:54
asking the model, "Hey, I think these might be letters.
212
714660
2760
J’ai dit au modĂšle : « Je pense que ce sont des lettres.
11:57
I think there's something in there. Try to find more of this."
213
717420
3360
Je pense qu’il y en a lĂ , essaie d’en trouver davantage. »
12:00
And my ground truth, actually,
214
720820
2000
Et mon hypothĂšse, en fait,
12:02
has four correct letters and four other delusions.
215
722820
3200
Ă©tait juste pour quatre lettres et fausse pour quatre dessins.
12:06
But that was OK.
216
726060
1680
Mais c'Ă©tait OK.
12:07
So training a new model with this data,
217
727780
2320
En entraßnant un nouveau modÚle avec ces données,
12:10
the model started to find more ink, find more letters,
218
730140
2760
il a commencĂ© Ă  trouver plus d’encre, plus de lettres.
12:12
and the lines even looked complete.
219
732940
2520
Des lignes semblaient mĂȘme complĂštes.
12:16
So I thought, "What are the chances that if I do this again,
220
736140
3920
Je me suis alors dit : « Quelle est la probabilité, si je recommence,
12:20
the models keep improving?"
221
740100
1480
que le modĂšle continue de s’amĂ©liorer ? »
12:22
And this was the core behind our grand prize-winning solution.
222
742220
4400
Et c’est ce principe qui nous a permis de remporter le grand prix.
12:27
Repeating this process over and over, the models kept improving.
223
747380
3480
En rĂ©pĂ©tant ce processus encore et encore, le modĂšle n’a pas cessĂ© de s’amĂ©liorer.
12:31
The main trick was you needed to prevent the models from memorizing
224
751740
4440
L’astuce principale Ă©tait d’empĂȘcher le modĂšle de mĂ©moriser
12:36
what the previous models have learned.
225
756220
2000
ce qu’il avait prĂ©cĂ©demment appris.
12:38
You're essentially asking the model to learn
226
758260
2080
Vous lui demandez essentiellement d’apprendre ce qu’il a dĂ©jĂ  appris.
12:40
what the other model has learned.
227
760340
1880
12:42
So overfitting was a serious problem that required a lot of experiments.
228
762260
4760
Cet ajustement a nécessité de nombreuses expériences.
12:47
But in the end, getting the recipe right,
229
767020
3440
Mais au final, en trouvant la bonne recette,
12:50
we were able to predict all of these letters
230
770460
3320
nous avons pu prédire toutes ces lettres
12:53
without the models ever seeing them.
231
773780
2080
sans que le modĂšle ne les voie jamais.
12:55
These were the first 10 letters.
232
775860
1640
Voici les 10 premiĂšres lettres - il y en a environ 20 ici -
12:57
There are, like, 20 in there,
233
777540
1600
12:59
but this was the first coherent word read from an unopened papyrus sheet.
234
779180
5640
mais c’est le premier mot cohĂ©rent lu sur une feuille de papyrus non dĂ©roulĂ©e.
13:05
From there, scaling the process,
235
785860
1800
À partir de lĂ , en itĂ©rant,
13:07
within weeks, we had, now, columns of text,
236
787700
3440
en quelques semaines, nous avions obtenu des colonnes de texte,
13:11
even special characters
237
791180
1320
et mĂȘme dĂ©couvert des caractĂšres spĂ©ciaux qui ont intĂ©ressĂ© les papyrologues.
13:12
that papyrologists found very interesting that the model was able to find.
238
792540
3840
13:17
The approach was open-sourced,
239
797660
1720
L'approche Ă©tait open source,
13:19
and the data and the code were out there,
240
799420
2520
les données et le code étaient disponibles,
13:21
and the race for the grand prize was on.
241
801980
2120
et la course pour le grand prix était lancée.
13:24
Recovering four paragraphs at an 85-percent clarity.
242
804900
4160
On a produit quatre paragraphes avec une clarté de 85 %.
13:29
And the key to our success was perfecting the data and the model
243
809100
3760
La clé de notre succÚs a été de perfectionner les données et le modÚle
13:32
with so many iterations and so many experiments.
244
812900
2440
Ă  l’aide de tant d’itĂ©rations et d’expĂ©riences.
13:36
In the end, we were able to recover
245
816020
2080
Au final, nous avons pu récupérer
13:38
more than 14 columns of text, and 2,000 letters.
246
818140
4000
plus de 14 colonnes de texte et 2 000 lettres.
13:44
(Applause)
247
824260
7000
(Applaudissements)
13:51
2,000 characters safely stored away two millennia ago.
248
831820
5240
JS : Deux mille caractÚres conservés en toute sécurité pendant deux millénaires.
13:57
In just nine months, we discovered them again.
249
837940
4080
En seulement neuf mois, nous les avons redécouverts.
14:02
AI helped us, in large portions,
250
842460
2600
L’IA nous a aidĂ©s, dans une large mesure, Ă  Ă©crire un meilleur programme.
14:05
writing better code and even being part in our algorithms.
251
845060
4280
Elle a mĂȘme influencĂ© nos algorithmes.
14:10
It opened a window into the past.
252
850060
2320
Cela a ouvert une fenĂȘtre sur le passĂ©.
14:12
What's next?
253
852980
1520
Et maintenant ?
14:14
Let's open this window more.
254
854500
2000
Ouvrons davantage cette fenĂȘtre.
14:16
AI will help us access information that was so far safely locked away.
255
856540
5960
L’IA nous aidera Ă  accĂ©der Ă  des informations
qui Ă©taient jusqu’à prĂ©sent totalement inaccessibles.
14:24
In the words of the author,
256
864180
1800
Pour reprendre les termes de l'auteur,
14:27
"We do not refrain from questioning nor understanding,
257
867660
5960
« ne nous abstenons pas de poser des questions ni de comprendre,
14:35
and may it be evident to say true things as they appear."
258
875380
6680
et qu’il soit Ă©vident de dire les choses telles qu’elles apparaissent. »
14:43
(Applause)
259
883220
1960
(Applaudissements)
À propos de ce site Web

Ce site vous présentera des vidéos YouTube utiles pour apprendre l'anglais. Vous verrez des leçons d'anglais dispensées par des professeurs de premier ordre du monde entier. Double-cliquez sur les sous-titres anglais affichés sur chaque page de vidéo pour lire la vidéo à partir de là. Les sous-titres défilent en synchronisation avec la lecture de la vidéo. Si vous avez des commentaires ou des demandes, veuillez nous contacter en utilisant ce formulaire de contact.

https://forms.gle/WvT1wiN1qDtmnspy7