How AI Is Decoding Ancient Scrolls | Julian Schilliger and Youssef Nader | TED

88,519 views ・ 2025-01-30

TED


Vă rugăm să faceți dublu clic pe subtitrările în limba engleză de mai jos pentru a reda videoclipul.

Traducător: ANDREEA-MAGDALENA MARES Corector: Claudia Pravat
00:04
We always think about the potential of AI changing the future.
0
4020
3880
Ne gândim mereu la potențialul AI de a schimba viitorul.
00:08
But what about the potential of AI changing the past?
1
8900
2760
Dar ce ziceți despre potențialul AI de a schimba trecutul?
00:12
My name is Youssef Nader.
2
12860
1560
Mă numesc Youssef Nader.
00:14
I'm an Egyptian AI researcher
3
14460
1960
Sunt un cercetător din Egipt în domeniul AI
00:16
and a PhD student at the Free University in Berlin,
4
16460
3120
și doctorand la Universitatea Liberă din Berlin.
00:19
and last year, I led the Vesuvius Grand Prize winning team
5
19620
4960
Anul trecut, cu echipa învingătoare de la Marele Premiu Vezuviu,
00:24
on exploring this very question.
6
24620
2240
am explorat această problemă.
00:27
You see, the story starts almost 2,000 years ago.
7
27900
3320
Povestea începe acum aproape 2.000 de ani.
00:32
A Greek philosopher that we believe was Philodemus of Gadara
8
32180
4040
Un filozof grec, probabil Philodemus din Gadara,
00:36
sat in one of the many rooms of the Villa dei Papiri.
9
36260
2880
stătea într-una din numeroasele camere ale Villa dei Papiri.
00:39
He talked about music, he talked about pleasure,
10
39980
3280
Vorbea despre muzică, despre plăcere,
00:43
he talked about what makes things enjoyable,
11
43260
2560
despre ce anume face lucrurile plăcute,
00:45
questions that still plague us until today.
12
45860
2280
întrebări care ne preocupă și pe noi azi.
00:49
One of his scribes wrote down his thoughts on sheets of papyrus.
13
49300
4800
Unul dintre scribi i-a scris gândurile pe foi de papirus.
00:54
The sheets were rolled and stowed away for later generations.
14
54660
4320
Foile au fost rulate și păstrate pentru generațiile următoare.
01:00
Fast-forward 150 years, ...
15
60180
3120
La distanță de 150 de ani,
01:04
Mount Vesuvius erupts,
16
64380
2160
Muntele Vezuviu erupe,
01:06
burying Herculaneum, the villa and the words of the philosopher
17
66540
4800
îngropând Herculaneum, vila și cuvintele filosofului
01:11
under a sea of hot mud and ashes.
18
71380
2840
sub o mare de lavă și cenușă.
01:15
Now fast-forward again, to the 17th century.
19
75460
2400
Mai târziu, în secolul al XVII-lea,
01:18
People are excavating around the area.
20
78420
2160
se fac excavări în acea zonă.
01:21
They found beautiful statues, breathtaking frescoes
21
81180
4360
Se găsesc statui frumoase, fresce uimitoare,
01:25
and some weird-looking pieces of charcoal,
22
85580
3640
bucăți de cărbune cu aspect ciudat,
01:29
like you see in this picture.
23
89260
1720
după cum vedeți în această imagine.
01:31
This is when the first scrolls were discovered,
24
91700
2880
Acesta e momentul când sunt descoperite primele papirusuri
01:34
and people were racing to excavate more of these.
25
94620
3000
și se accelerează excavările.
01:38
What knowledge is included that is not known to us now?
26
98300
4320
Ce informații sunt acolo care nu ne sunt cunoscute astăzi?
01:42
What things should we know about these scrolls?
27
102660
2920
Ce ar trebui să știm despre aceste manuscrise?
01:48
My name is Julian, and I am a digital archaeologist.
28
108860
5040
Numele meu este Julian și sunt arheolog digital.
01:55
When the pyroclastic flow hit the scrolls, it had a destructive effect.
29
115660
6920
Când fluxul piroclastic a lovit sulurile, a avut un efect distructiv.
02:03
It tore into them, shredded off pieces, and it charred them badly.
30
123460
6200
Le-a rupt, le-a făcut bucăți și le-a carbonizat.
02:09
Even the deformation that you can see happened at that point.
31
129700
5120
Chiar și deformarea pe care o vedeți s-a întâmplat tot în acel moment.
02:14
People, 250-something years ago,
32
134860
3920
Cu 250 de ani în urmă,
02:18
were curious what's lying inside those scrolls,
33
138780
3240
oamenii erau curioși să știe ce conțin aceste manuscrise,
02:22
hidden and not accessible anymore.
34
142060
3200
ascunse și inaccesibile.
02:26
Because of a lack of technology,
35
146020
1920
Din cauza lipsei tehnologiei,
02:27
they had to resort to physically unrolling
36
147980
3920
a fost necesară derularea manuală,
02:31
and thereby destroying most of the scrolls.
37
151900
3680
lucru ce a distrus majoritatea sulurilor.
02:36
To this day,
38
156340
1320
Până în prezent,
02:37
only the most damaged and deformed scrolls
39
157700
3000
doar cele mai deteriorate și deformate
02:40
remain in their initial, rolled-up configuration.
40
160740
4200
rămân în configurația inițială, rulate.
02:45
Fast-forwarding a little bit, the computer age arrives.
41
165780
4320
Mai înaintăm puțin și ajungem la epoca computerului.
02:50
Youssef and I are born.
42
170140
2960
Eu și Youssef venim pe lume.
02:53
We are going on and getting our education --
43
173100
2840
Creștem și mergem la școală.
02:55
(Laughter)
44
175940
1760
(Râsete)
02:57
and at the same time, Brent Seales, a researcher and professor,
45
177700
6080
Și în același timp, Brent Seales, cercetător și profesor, a avut ideea
03:03
had the idea to use CT scan technology to actually digitize the scrolls,
46
183820
6560
de a folosi tehnologia de scanare CT pentru a digitaliza papirusurile,
03:10
with the hope of, one day, digitally unrolling them.
47
190420
5640
cu speranța că într-o zi le va derula digital.
03:16
Behind me, you can see a video of such a CT scan,
48
196100
3520
În spatele meu, vedeți un video de la o scanare CT,
03:19
and it goes through the CT scan 3D volume,
49
199660
3400
care trece prin volumul 3D al scanării,
03:23
layer by layer.
50
203100
1200
strat după strat.
03:25
The papyrus is visible as a spiral,
51
205020
4080
Papirusul se vede ca o spirală
03:29
and you can see it's tightly wound-up,
52
209100
2080
și puteți vedea că e rulat strâns,
03:31
sometimes touching each other, flaying off.
53
211220
2720
se atinge uneori, dezlipindu-se.
03:33
It's a difficult question, how to unroll this digitally.
54
213980
3640
E greu de explicat cum se derulează digital.
03:38
Nat Friedman, a Silicon Valley investor,
55
218740
3440
Nat Friedman, un investitor din Silicon Valley,
03:42
also saw this research, and he wanted to help.
56
222220
3640
a aflat despre această cercetare și a dorit să se implice.
03:46
That was in 2022.
57
226420
2360
Asta a fost în 2022.
03:48
He reached out, and together with Brent Seales,
58
228820
3080
Ne-a contactat și împreună cu Brent Seales
03:51
they created the Vesuvius Challenge,
59
231940
2760
a creat Provocarea Vesuvius,
03:54
with the goal to motivate nerds all over the world
60
234740
3720
cu scopul de a-i motiva pe pasionații din întreaga lume
03:58
to solve this problem.
61
238460
1560
să rezolve această problemă.
04:00
(Laughter)
62
240020
1920
(Râsete)
04:01
They created a grand prize,
63
241980
1800
Au stabilit un premiu mare,
04:03
promising eternal glory and monetary incentives
64
243820
3560
promițând glorie eternă și stimulente monetare
04:07
to anyone who could do that.
65
247420
1560
oricui ar putea face asta.
04:09
(Laughter)
66
249020
1800
(Râsete)
04:10
I myself saw that on the internet
67
250860
2280
Am văzut și eu pe internet,
04:13
while writing my master's thesis at ETH Zurich, in robotics,
68
253180
4040
când îmi scriam teza de master la ETH Zurich, în robotică,
04:17
and I was instantly happy to solve it --
69
257220
3280
și am fost fericit să o rezolv
04:20
or at least try, why not, you know?
70
260540
2320
sau cel puțin să încerc.
04:22
And I went on, joined the Discord community
71
262900
3880
M-am alăturat comunității Discord,
04:26
where all the people that were also contestants
72
266820
2720
unde erau toți cei care concurau,
04:29
and playing with the scroll data
73
269540
1800
și cercetând datele de pe papirusuri
04:31
were exchanging ideas,
74
271340
2080
făceau schimb de idei.
04:33
and I joined there and started working on it.
75
273420
2840
Am început să lucrez la asta.
04:37
Also there, on Discord, I met Youssef and Luke [Farritor],
76
277820
3240
La Discord i-am întâlnit pe Youssef și pe Luke [Farritor],
04:41
who would become my teammates,
77
281100
1440
care mi-au fost coechipieri
04:42
and with whom I would actually win the grand prize.
78
282580
3360
și cu care am câștigat marele premiu.
04:45
Surprisingly, it went on, and made global headline news.
79
285980
3800
Surprinzător, a devenit o știre globală.
04:50
It even got into the British tabloids.
80
290460
2400
A apărut chiar și în tabloidele britanice.
04:52
(Laughter)
81
292900
3040
(Râsete)
04:55
So when we started,
82
295940
1560
Când am început,
04:57
there were two main problems still remaining.
83
297500
3400
erau două probleme principale.
05:00
One, you had to unroll the scroll.
84
300940
2840
Prima, sulul trebuia derulat.
05:03
And two, you then had to make the ink visible.
85
303780
3560
Și a doua, trebuia apoi să facem cerneala vizibilă.
05:07
Youssef will tell you more about that part.
86
307380
2280
Youssef vă poate vorbi mai mult despre asta.
05:10
For me, the most exciting thing
87
310660
2120
Pentru mine, cel mai interesant lucru
05:12
was the computer-vision problem of unrolling those scrolls virtually.
88
312780
4280
a fost problema viziunii computerizate de a desface aceste suluri virtual.
05:17
I decided to iterate on a tool
89
317060
2240
Am decis să iterez pe un instrument
05:19
that was created by the Kentucky researchers,
90
319340
2800
care a fost creat de cercetătorii din Kentucky
05:22
and make it faster, less prone to errors
91
322180
3640
și să-l fac mai rapid, cu mai puține erori
05:25
and just iterate on it and make it better.
92
325820
2800
și apoi să-l iterez și să-l îmbunătățesc.
05:29
The Vesuvius Challenge team saw that
93
329380
1840
Echipa Vesuvius a analizat
05:31
and also implemented a team of 10 people that would use my tool.
94
331220
4680
și a adus o echipă de 10 persoane care să folosească instrumentul meu.
05:35
They would annotate scroll data, like you see in this video,
95
335940
3840
Au adnotat datele sulului, așa cum vedeți în acest videoclip,
05:39
where they created a red line where the surface would lie.
96
339820
3440
și au creat o linie roșie unde s-ar fi aflat suprafața.
05:43
The algorithm then would take it into 3D space,
97
343300
3120
Algoritmul l-a dus apoi într-un spațiu 3D,
05:46
creating a three-dimensional representation of the surface.
98
346460
4040
creând o reprezentare tridimensională a suprafeței.
05:50
Computer algorithms
99
350860
1240
Algoritmii computerizați
05:52
would then flatten it and create a segment.
100
352140
2360
l-au aplatizat și au creat un segment.
05:55
This all would be called “segmentation”
101
355220
2680
Toate acestea se numesc „segmentare”
05:57
in the space of the scrolling and unrolling community.
102
357940
6240
în activitatea de rulare și derulare.
06:04
(Laughter)
103
364940
5200
(Râsete)
06:10
So I created open-source commits to this tool
104
370140
5760
Așa că am creat angajamente open-source pentru acest instrument
06:15
and implemented new algorithms from my studies, like Optical Flow,
105
375900
3840
și am implementat noi algoritmi, cum ar fi Optical Flow,
06:19
to better track the sheets through the volume,
106
379780
3560
pentru a urmări mai bine foile prin volum.
06:23
and we end up with something like what you see behind me.
107
383380
3840
Așa am ajuns la ceva asemănător cu ceea ce vedeți în spatele meu.
06:27
First off, those were really small segments,
108
387260
2920
În primul rând, aceste segmente erau foarte mici
06:30
and I added improvement,
109
390180
1480
și am adus îmbunătățiri,
06:31
made the code faster
110
391700
1440
am făcut codul mai rapid
06:33
and had lots of feedback from the community.
111
393180
2880
și am primit o mulțime de sfaturi din partea comunității.
06:36
They were really happy, and I was happy getting lots of feedback.
112
396100
3400
Erau foarte fericiți și eu eram bucuros să primesc reacțiile lor.
06:39
It was a really positive environment.
113
399540
2120
Era un mediu foarte pozitiv.
06:43
So in the end,
114
403300
1800
În cele din urmă,
06:45
I could track the performance of the algorithms,
115
405140
2720
am putut urmări performanța algoritmilor,
06:47
how the segmentation team performed,
116
407900
2160
am văzut cum funcționa echipa de segmentare
06:50
and I could see that my improvements, from start to finish,
117
410100
3560
și am putut vedea că îmbunătățirile mele, de la început până la sfârșit,
06:53
would be around a 10,000-fold improvement over the initial version.
118
413660
5560
erau cu 10.000 mai multe față de versiunea inițială.
07:00
This algorithm was then also used to unroll all the area
119
420580
4320
Acest algoritm a fost apoi folosit pentru a derula toată zona
07:04
that you can see in our submission.
120
424940
2040
pe care o vedeți.
07:07
All the sheets were generated with these methods.
121
427020
3240
Toate foile au fost generate cu aceste metode.
07:11
In December, I was looking for teammates.
122
431620
3280
În decembrie, căutam colegi de echipă.
07:14
I made a blog post,
123
434940
1280
Am făcut o postare pe blog
07:16
and I showcased my newest algorithms,
124
436260
3280
și am prezentat cei mai noi algoritmi,
07:19
reaching out to anyone that was willing to team up.
125
439580
3240
căutând pe cineva dispus să ajute.
07:23
Youssef and Luke got into contact with me.
126
443780
3160
Youssef și Luke m-au contactat.
07:27
They were happy to team up, and I was happy as well.
127
447740
3280
Erau fericiți să se alăture, iar eu am fost fericit să accept.
07:31
(Laughter)
128
451740
1400
(Râsete)
07:33
So after the virtual unwrapping, the words still are not visible.
129
453820
4720
După derularea virtuală, cuvintele tot nu erau vizibile.
07:39
The main problem is that the ink that was used at the time
130
459100
2920
Principala problemă era că cerneala folosită la acea vreme
07:42
was a carbon-based ink,
131
462020
1840
era o cerneală pe bază de carbon,
07:43
and carbon-based ink on carbon-based papyrus in a CT scan
132
463900
3440
iar într-o scanare CT, cerneala pe un papirus pe bază de carbon
07:47
isn’t visible, or at least [not] to the naked eye.
133
467380
2800
nu e vizibilă sau cel puțin nu cu ochiul liber.
07:50
So the same team at the University of Kentucky
134
470860
2200
Așa că echipa de la Universitatea din Kentucky
07:53
decided to test whether the ink was present at all
135
473100
2600
a decis să testeze dacă cerneala era măcar prezentă
07:55
in the CT scans.
136
475700
1360
în scanările CT.
07:57
For this, they took some of the pieces that people broke off the scrolls,
137
477100
5160
Au luat câteva bucăți rupte de suluri
08:02
and they fed them into the same pipeline of the X-ray CT scanning,
138
482260
5040
și le-au introdus în aceeași conductă a scanării CT cu raze X,
08:07
and this gives us the 3D data that we were working with.
139
487300
3040
lucru care ne-a oferit datele 3D cu care lucram.
08:10
Because you can see the ink and it’s an exposed surface,
140
490380
3840
Deoarece cerneala se poate vedea și este o suprafață expusă,
08:14
you can even improve it with infrared imaging.
141
494220
2600
poate fi îmbunătățită chiar cu imagini infraroșu.
08:16
And this gives you a ground truth
142
496820
1640
Și asta oferă un adevăr real
08:18
of what letters you're actually trying to find.
143
498460
2480
despre ce litere încercăm să găsim.
08:21
And then from there,
144
501620
1280
Și din acest punct,
08:22
you can train a machine-learning model to try to find these letters.
145
502940
3640
putem antrena mașina cu învățare automată să găsească aceste litere.
08:27
The way this works
146
507260
1440
Felul în care funcționează
08:28
is that the model looks at very small cubes at a single time
147
508740
3440
e că modelul se uită la cuburi foarte mici, unul câte unul,
08:32
and tries to decide whether there is ink present in this area or not.
148
512220
4080
și încearcă să decidă dacă există sau nu cerneală în acea zonă.
08:36
And then, when you keep moving this cube all around,
149
516300
3360
Continuând să mișcăm acest cub peste tot,
08:39
the model gets to see different data samples
150
519700
3040
modelul ajunge să vadă diferite mostre de date
08:42
and then tries to understand what ink actually is.
151
522780
3560
și apoi încearcă să înțeleagă ce este de fapt cerneală.
08:47
So this is how it looks while the model is training.
152
527020
2520
Iată cum arată modelul în timp ce se antrenează.
08:49
It's not perfect, but you can see that, especially around the middle,
153
529580
4640
Nu e perfect, dar puteți vedea, mai ales pe la mijloc,
08:54
the model is starting to see the letters perfectly.
154
534260
2880
cum modelul începe să recunoască literele perfect.
08:57
So the data is there.
155
537140
2400
Deci datele sunt acolo.
08:59
The ink is there.
156
539580
1240
Cerneala este acolo.
09:00
But it’s just very hard to find and see.
157
540820
1960
Dar e greu de găsit și de văzut.
09:04
Looking at the CT scan raw data on the left here,
158
544020
4960
Dacă ne uităm în stânga, la datele brute ale scanării CT,
09:09
you can see the fibers,
159
549020
2280
putem vedea fibrele,
09:11
you can see the structure of the papyrus,
160
551340
2960
putem vedea structura papirusului,
09:14
but the letters are very, very faint.
161
554340
2640
dar literele sunt foarte, foarte șterse.
09:17
The letters from the right image are very, very faint in the CT scans.
162
557020
4400
Literele din imaginea din dreapta sunt foarte șterse în scanările CT.
09:21
And they're actually, in this special case,
163
561460
3080
Și în special în acest caz,
09:24
characterized by a difference of contrast
164
564580
2480
sunt caracterizate prin diferența de contrast,
09:27
and some speckles, freckles, features that are very hard to see.
165
567100
4520
iar unele pete sunt foarte greu de văzut.
09:32
So what happens if we try to take a look
166
572340
3360
Ce se întâmplă dacă încercăm
09:35
at the segment that Julian was just showing?
167
575740
2720
să privim segmentul pe care îl arată Julian?
09:40
So this is the data that we were working with.
168
580500
2720
Acestea sunt datele cu care am lucrat.
09:43
And I'm going to give you 10 seconds to try to find the letters yourself.
169
583260
4040
Și vă dau 10 secunde pentru a încerca să găsiți singuri literele.
09:47
(Laughter)
170
587340
1120
(Râsete)
09:48
And as a hint,
171
588500
1640
Drept indiciu,
09:50
I'll tell you that there are three letters in this image.
172
590180
2720
vă spun că sunt trei litere în această imagine.
09:52
Believe me.
173
592900
2080
Credeți-mă.
09:55
Try to find some pattern, some crackle patterns,
174
595980
5160
Încercați să găsiți niște caractere
10:01
some cracks in there.
175
601140
1520
în acele fisuri.
10:03
If you were able to identify this pattern of these three letters --
176
603420
4160
Dacă ați reușit să identificați modelul acestor trei litere,
10:07
(Laughter)
177
607620
2720
(Râsete)
10:10
then congratulations.
178
610380
1200
vă felicit.
10:11
One year ago, you may have won 40,000 dollars.
179
611620
2360
Cu un an în urmă, ați fi putut câștiga 40.000 USD.
10:14
(Laughter)
180
614020
2000
(Râsete)
10:16
However, if you're like me, and you couldn't make sense of this,
181
616060
3720
Cu toate astea, dacă n-ați găsit nimic, cum n-am găsit nici eu,
10:19
there's a different way that you can find this ink --
182
619780
2680
există un mod diferit pentru a găsi această cerneală,
10:22
one that actually scales very, very well.
183
622460
2440
unul care merge foarte bine.
10:26
So this is where my journey begins with the Vesuvius Challenge.
184
626460
3680
Aici începe călătoria mea cu Provocarea Vezuvius.
10:30
There is this neat idea in computer-vision literature
185
630180
2880
E o idee extraordinară în viziunea literaturii computerizate,
10:33
where if you don't actually have labels,
186
633060
2120
care spune că dacă nu ai o etichetă,
10:35
if you don't have the goal that you want your AI model to reach,
187
635220
4080
dacă nu ai obiectivul pe care modelul AI să-l atingă,
10:39
you can pick an intermediary goal along the way.
188
639300
2480
poți alege pe parcurs un obiectiv intermediar.
10:42
So, looking at these two pairs of images,
189
642500
4880
Uitându-ne la aceste două imagini,
10:47
our eyes can identify that these are the same images,
190
647420
3040
ochii noștri pot recunoaște că sunt una și aceeași imagine,
10:50
just flipped.
191
650500
1600
doar că răsturnată.
10:52
And we can do that because we understand
192
652100
2680
Putem face asta pentru că înțelegem
10:54
the structures that are present in the images.
193
654820
2240
structurile prezente în aceste imagini.
10:57
We can see this little triangle, and it's flipped,
194
657060
3040
Vedem că acest mic triunghi e răsturnat,
11:00
so we know this is the same triangle.
195
660140
2240
așa că știm că e același triunghi.
11:02
Our eyes already have this feature,
196
662420
2720
Ochii noștri au deja această funcție,
11:05
but neural networks don't.
197
665180
2720
dar rețelele neuronale nu.
11:07
When they see these images,
198
667940
1320
Când văd aceste imagini,
11:09
they can't [tell] that these are the same image.
199
669260
2320
nu știu că sunt una și aceeași imagine.
11:11
So one idea, just to let it know about the structures
200
671580
3160
Pentru a o familiariza cu structurile
11:14
and familiarize it with the data,
201
674780
1880
și cu datele,
11:16
is to show it different views of the same image
202
676700
3560
trebuie să-i arătăm unghiuri diferite ale aceleiași imagini
11:20
and tell it that these are the same images.
203
680260
2000
și să-i spunem că sunt aceeași imagine.
11:22
And after that, you take this model
204
682900
2800
După aceea, se ia acest model
11:25
and you train it like the previous models that the University of Kentucky did.
205
685700
4440
și e antrenat ca modelele anterioare făcute de Universitatea din Kentucky.
11:30
And while the approach doesn't fully work, it also doesn't fully not work.
206
690180
4360
Deși abordarea nu funcționează pe deplin, nu e ca și cum nu merge.
11:34
And this was the first image that was produced by the model.
207
694580
3840
Aici e prima imagine produsă de model.
11:38
And there was some very faint signal in there.
208
698460
3360
Era un semnal foarte slab acolo.
11:41
It seemed like the model was catching on something,
209
701860
2440
Părea că modelul detectează ceva,
11:44
but it wasn't clear, exactly, what the model was catching on.
210
704340
3240
dar nu era clar exact ce detectează.
11:48
So I decided to take these predictions and create a new ground truth,
211
708180
6440
Așa că am decis să iau aceste predicții și să creez un nou adevăr de bază.
11:54
asking the model, "Hey, I think these might be letters.
212
714660
2760
I-am spus modelului: „Cred că acestea ar putea fi litere.
11:57
I think there's something in there. Try to find more of this."
213
717420
3360
Cred că e ceva acolo. Încearcă să găsești mai mult.”
12:00
And my ground truth, actually,
214
720820
2000
Și adevărul meu de bază
12:02
has four correct letters and four other delusions.
215
722820
3200
avea patru litere corecte și alte patru presupuneri.
12:06
But that was OK.
216
726060
1680
Dar era în regulă.
12:07
So training a new model with this data,
217
727780
2320
Antrenând un model nou cu aceste date,
12:10
the model started to find more ink, find more letters,
218
730140
2760
a început să găsească mai multă cerneală, mai multe litere,
12:12
and the lines even looked complete.
219
732940
2520
chiar și liniile păreau complete.
12:16
So I thought, "What are the chances that if I do this again,
220
736140
3920
M-am gândit: „Dacă repet asta, care sunt șansele
12:20
the models keep improving?"
221
740100
1480
ca modelele să continue să se îmbunătățească?”
12:22
And this was the core behind our grand prize-winning solution.
222
742220
4400
Aceasta a fost ideea principală din spatele soluției câștigătoare.
12:27
Repeating this process over and over, the models kept improving.
223
747380
3480
Repetând acest proces, modelele s-au îmbunătățit.
12:31
The main trick was you needed to prevent the models from memorizing
224
751740
4440
Secretul e să împiedici modelele din a memora
12:36
what the previous models have learned.
225
756220
2000
ce au învățat modelele anterioare.
12:38
You're essentially asking the model to learn
226
758260
2080
În esență, îi ceri modelului să învețe
12:40
what the other model has learned.
227
760340
1880
ce a învățat celălalt model.
12:42
So overfitting was a serious problem that required a lot of experiments.
228
762260
4760
Suprapunerea a fost o problemă serioasă care a necesitat multe experimente.
12:47
But in the end, getting the recipe right,
229
767020
3440
În cele din urmă, cu metoda corectă,
12:50
we were able to predict all of these letters
230
770460
3320
am reușit să prezicem toate literele
12:53
without the models ever seeing them.
231
773780
2080
fără ca modelele să le vadă măcar.
12:55
These were the first 10 letters.
232
775860
1640
Acestea au fost primele 10 litere.
12:57
There are, like, 20 in there,
233
777540
1600
Sunt vreo 20 acolo,
12:59
but this was the first coherent word read from an unopened papyrus sheet.
234
779180
5640
dar acesta a fost primul cuvânt coerent citit dintr-o foaie de papirus nedeschisă.
13:05
From there, scaling the process,
235
785860
1800
De aici, extinzând procesul,
13:07
within weeks, we had, now, columns of text,
236
787700
3440
în câteva săptămâni aveam coloane de text,
13:11
even special characters
237
791180
1320
chiar și caractere speciale
13:12
that papyrologists found very interesting that the model was able to find.
238
792540
3840
despre care papirologii consideră foarte interesant că modelul le-a putut găsi.
13:17
The approach was open-sourced,
239
797660
1720
Abordarea a fost publică,
13:19
and the data and the code were out there,
240
799420
2520
datele și codul erau acolo,
13:21
and the race for the grand prize was on.
241
801980
2120
iar cursa pentru marele premiu a început.
13:24
Recovering four paragraphs at an 85-percent clarity.
242
804900
4160
S-au recuperat patru paragrafe la o claritate de 85%.
13:29
And the key to our success was perfecting the data and the model
243
809100
3760
Cheia succesului nostru a fost perfecționarea datelor și a modelului
13:32
with so many iterations and so many experiments.
244
812900
2440
cu atât de multe iterații și experimente.
13:36
In the end, we were able to recover
245
816020
2080
În cele din urmă, am reușit să recuperăm
13:38
more than 14 columns of text, and 2,000 letters.
246
818140
4000
peste 14 coloane de text și 2.000 de litere.
13:44
(Applause)
247
824260
7000
(Aplauze)
13:51
2,000 characters safely stored away two millennia ago.
248
831820
5240
2.000 de caractere stocate în siguranță acum două milenii.
13:57
In just nine months, we discovered them again.
249
837940
4080
În doar nouă luni, le-am redescoperit.
14:02
AI helped us, in large portions,
250
842460
2600
AI ne-a ajutat, în mare parte,
14:05
writing better code and even being part in our algorithms.
251
845060
4280
să scriem un cod mai bun și să facă parte din algoritmii noștri.
14:10
It opened a window into the past.
252
850060
2320
A deschis o fereastră către trecut.
14:12
What's next?
253
852980
1520
Ce urmează?
14:14
Let's open this window more.
254
854500
2000
Să deschidem mai mult această fereastră.
14:16
AI will help us access information that was so far safely locked away.
255
856540
5960
AI ne va ajuta să accesăm informații care au fost până acum inaccesibile.
14:24
In the words of the author,
256
864180
1800
În cuvintele autorului,
14:27
"We do not refrain from questioning nor understanding,
257
867660
5960
„Nu ne vom opri să punem întrebări și să înțelegem,
14:35
and may it be evident to say true things as they appear."
258
875380
6680
să spunem adevărul pe măsură ce-l descoperim.”
14:43
(Applause)
259
883220
1960
(Aplauze)
Despre acest site

Acest site vă va prezenta videoclipuri de pe YouTube care sunt utile pentru a învăța limba engleză. Veți vedea lecții de engleză predate de profesori de top din întreaga lume. Faceți dublu clic pe subtitrările în limba engleză afișate pe fiecare pagină video pentru a reda videoclipul de acolo. Subtitrările se derulează în sincron cu redarea videoclipului. Dacă aveți comentarii sau solicitări, vă rugăm să ne contactați folosind acest formular de contact.

https://forms.gle/WvT1wiN1qDtmnspy7