How AI Is Decoding Ancient Scrolls | Julian Schilliger and Youssef Nader | TED

9,554 views ・ 2025-01-30

TED


Haga doble clic en los subtítulos en inglés para reproducir el vídeo.

Traductor: Fabiana Salces Vaca Revisor: Sebastian Betti
00:04
We always think about the potential of AI changing the future.
0
4020
3880
Siempre pensamos en el potencial de la IA para cambiar el futuro.
00:08
But what about the potential of AI changing the past?
1
8900
2760
Pero, ¿qué hay del potencial de la IA para cambiar el pasado?
00:12
My name is Youssef Nader.
2
12860
1560
Me llamo Youssef Nader.
00:14
I'm an Egyptian AI researcher
3
14460
1960
Soy un investigador egipcio de IA
00:16
and a PhD student at the Free University in Berlin,
4
16460
3120
y estoy haciendo un doctorado en la Universidad Libre de Berlín,
00:19
and last year, I led the Vesuvius Grand Prize winning team
5
19620
4960
y el año pasado
dirigí al equipo ganador del Gran Premio del Vesubio
00:24
on exploring this very question.
6
24620
2240
para explorar esta misma cuestión.
00:27
You see, the story starts almost 2,000 years ago.
7
27900
3320
Verán, la historia comienza hace casi 2000 años.
00:32
A Greek philosopher that we believe was Philodemus of Gadara
8
32180
4040
Un filósofo griego que creemos que era Filodemo de Gadara
00:36
sat in one of the many rooms of the Villa dei Papiri.
9
36260
2880
se sentó en una de las muchas habitaciones de la Villa dei Papiri.
00:39
He talked about music, he talked about pleasure,
10
39980
3280
Habló de música, habló de placer,
00:43
he talked about what makes things enjoyable,
11
43260
2560
habló de lo que hace que las cosas sean agradables,
00:45
questions that still plague us until today.
12
45860
2280
preguntas que aún nos atormentan hasta el día de hoy.
00:49
One of his scribes wrote down his thoughts on sheets of papyrus.
13
49300
4800
Uno de sus escribas escribió sus pensamientos en hojas de papiro.
00:54
The sheets were rolled and stowed away for later generations.
14
54660
4320
Las hojas se enrollaban
y se guardaban para las generaciones posteriores.
01:00
Fast-forward 150 years, ...
15
60180
3120
Pasan 150 años...
01:04
Mount Vesuvius erupts,
16
64380
2160
El monte Vesubio entra en erupción,
01:06
burying Herculaneum, the villa and the words of the philosopher
17
66540
4800
enterrando a Herculano, la villa y las palabras del filósofo
01:11
under a sea of hot mud and ashes.
18
71380
2840
bajo un mar de barro caliente y cenizas.
01:15
Now fast-forward again, to the 17th century.
19
75460
2400
Ahora volvemos a avanzar rápidamente, hasta el siglo XVII.
01:18
People are excavating around the area.
20
78420
2160
La gente está excavando en la zona.
01:21
They found beautiful statues, breathtaking frescoes
21
81180
4360
Encontraron hermosas estatuas,
impresionantes frescos
01:25
and some weird-looking pieces of charcoal,
22
85580
3640
y algunos trozos de carbón de aspecto extraño,
01:29
like you see in this picture.
23
89260
1720
como se ve en esta imagen.
01:31
This is when the first scrolls were discovered,
24
91700
2880
Fue entonces cuando se descubrieron los primeros pergaminos,
01:34
and people were racing to excavate more of these.
25
94620
3000
y la gente se apresuró a excavar más de estos.
01:38
What knowledge is included that is not known to us now?
26
98300
4320
¿Qué conocimiento se incluye que no conozcamos ahora?
01:42
What things should we know about these scrolls?
27
102660
2920
¿Qué cosas debemos saber sobre estos pergaminos?
01:48
My name is Julian, and I am a digital archaeologist.
28
108860
5040
Me llamo Julian y soy arqueólogo digital.
01:55
When the pyroclastic flow hit the scrolls, it had a destructive effect.
29
115660
6920
Cuando el flujo piroclástico chocó contra los rollos,
tuvo un efecto destructivo.
02:03
It tore into them, shredded off pieces, and it charred them badly.
30
123460
6200
Los desgarró, los hizo pedazos y los carbonizó gravemente.
02:09
Even the deformation that you can see happened at that point.
31
129700
5120
Incluso la deformación que se puede ver ocurrió en ese punto.
02:14
People, 250-something years ago,
32
134860
3920
La gente, 250 y pico años atrás,
02:18
were curious what's lying inside those scrolls,
33
138780
3240
tenía curiosidad por saber qué había dentro de esos pergaminos,
02:22
hidden and not accessible anymore.
34
142060
3200
ocultos e inaccesibles.
02:26
Because of a lack of technology,
35
146020
1920
Debido a la falta de tecnología,
02:27
they had to resort to physically unrolling
36
147980
3920
tuvieron que recurrir a desenrollarlos físicamente
02:31
and thereby destroying most of the scrolls.
37
151900
3680
y, por lo tanto, a destruir la mayoría de los pergaminos.
02:36
To this day,
38
156340
1320
Hasta el día de hoy,
02:37
only the most damaged and deformed scrolls
39
157700
3000
solo los pergaminos más dañados y deformados
02:40
remain in their initial, rolled-up configuration.
40
160740
4200
permanecen en su configuración inicial, enrollados.
02:45
Fast-forwarding a little bit, the computer age arrives.
41
165780
4320
Avanzando un poco más,
llega la era de los ordenadores.
02:50
Youssef and I are born.
42
170140
2960
Nacemos Youssef y yo.
Seguimos adelante y recibimos nuestra educación.
02:53
We are going on and getting our education --
43
173100
2840
02:55
(Laughter)
44
175940
1760
(Risas)
02:57
and at the same time, Brent Seales, a researcher and professor,
45
177700
6080
Y, al mismo tiempo,
Brent Seales,
un investigador y profesor,
03:03
had the idea to use CT scan technology to actually digitize the scrolls,
46
183820
6560
tuvo la idea de usar la tecnología de tomografía computarizada
para digitalizar los pergaminos,
03:10
with the hope of, one day, digitally unrolling them.
47
190420
5640
con la esperanza de, algún día,
desenrollarlos digitalmente.
03:16
Behind me, you can see a video of such a CT scan,
48
196100
3520
Detrás de mí, pueden ver un vídeo
de una tomografía computarizada de este tipo,
03:19
and it goes through the CT scan 3D volume,
49
199660
3400
que pasa por la tomografía computarizada en 3D en volumen,
03:23
layer by layer.
50
203100
1200
capa por capa.
03:25
The papyrus is visible as a spiral,
51
205020
4080
El papiro se ve en forma de espiral,
03:29
and you can see it's tightly wound-up,
52
209100
2080
y se puede ver que está bien enrollado,
03:31
sometimes touching each other, flaying off.
53
211220
2720
a veces tocándose y desprendiéndose.
03:33
It's a difficult question, how to unroll this digitally.
54
213980
3640
Cómo desenrollar esto digitalmente es una pregunta difícil.
03:38
Nat Friedman, a Silicon Valley investor,
55
218740
3440
Nat Friedman,
un inversor de Silicon Valley,
03:42
also saw this research, and he wanted to help.
56
222220
3640
también vio esta investigación y quiso ayudar.
03:46
That was in 2022.
57
226420
2360
Eso fue en 2022.
03:48
He reached out, and together with Brent Seales,
58
228820
3080
Se acercó y,
junto con Brent Seales,
03:51
they created the Vesuvius Challenge,
59
231940
2760
crearon el Reto Vesubio,
03:54
with the goal to motivate nerds all over the world
60
234740
3720
con el objetivo de motivar
a nerds de todo el mundo a resolver este problema.
03:58
to solve this problem.
61
238460
1560
04:00
(Laughter)
62
240020
1920
(Risas)
04:01
They created a grand prize,
63
241980
1800
Crearon un gran premio,
04:03
promising eternal glory and monetary incentives
64
243820
3560
prometiendo gloria eterna e incentivos monetarios
04:07
to anyone who could do that.
65
247420
1560
a cualquiera que pudiera lograrlo.
04:09
(Laughter)
66
249020
1800
(Risas)
04:10
I myself saw that on the internet
67
250860
2280
Yo mismo lo vi en Internet
04:13
while writing my master's thesis at ETH Zurich, in robotics,
68
253180
4040
mientras escribía mi tesis de maestría en robótica en la ETH de Zúrich,
04:17
and I was instantly happy to solve it --
69
257220
3280
y al instante tuve ganas de resolverlo,
04:20
or at least try, why not, you know?
70
260540
2320
o al menos intentarlo, ¿por qué no?
04:22
And I went on, joined the Discord community
71
262900
3880
Y me uní a una comunidad de Discord,
04:26
where all the people that were also contestants
72
266820
2720
donde todas las personas que también participaban
04:29
and playing with the scroll data
73
269540
1800
y jugaban con los datos de los pergaminos
04:31
were exchanging ideas,
74
271340
2080
intercambiaban ideas,
04:33
and I joined there and started working on it.
75
273420
2840
y me uní allí y empecé a trabajar en ello.
04:37
Also there, on Discord, I met Youssef and Luke [Farritor],
76
277820
3240
También allí, en Discord, conocí a Youssef y Luke,
que se convertirían en mis compañeros
04:41
who would become my teammates,
77
281100
1440
04:42
and with whom I would actually win the grand prize.
78
282580
3360
y con quienes ganaría el gran premio.
04:45
Surprisingly, it went on, and made global headline news.
79
285980
3800
Sorprendentemente, continuó y llegó a los titulares mundiales.
04:50
It even got into the British tabloids.
80
290460
2400
Incluso llegó a los tabloides británicos.
04:52
(Laughter)
81
292900
3040
(Risas)
04:55
So when we started,
82
295940
1560
Así que cuando empezamos,
04:57
there were two main problems still remaining.
83
297500
3400
aún quedaban dos problemas principales.
05:00
One, you had to unroll the scroll.
84
300940
2840
En primer lugar,
había que desenrollar el pergamino.
05:03
And two, you then had to make the ink visible.
85
303780
3560
Y dos, luego tenías que hacer que la tinta fuera visible.
05:07
Youssef will tell you more about that part.
86
307380
2280
Youssef contará más sobre esa parte.
05:10
For me, the most exciting thing
87
310660
2120
Para mí, lo más emocionante
05:12
was the computer-vision problem of unrolling those scrolls virtually.
88
312780
4280
era el problema de la visión artificial
de desenrollar esos pergaminos de forma virtual.
05:17
I decided to iterate on a tool
89
317060
2240
Decidí utilizar una herramienta
05:19
that was created by the Kentucky researchers,
90
319340
2800
que habían creado los investigadores de Kentucky
05:22
and make it faster, less prone to errors
91
322180
3640
y hacerla más rápida y menos propensa a errores,
05:25
and just iterate on it and make it better.
92
325820
2800
y simplemente repetirla y mejorarla.
05:29
The Vesuvius Challenge team saw that
93
329380
1840
El equipo del Reto Vesubio vio esto
05:31
and also implemented a team of 10 people that would use my tool.
94
331220
4680
y también contrató a un equipo de 10 personas que utilizarían mi herramienta
05:35
They would annotate scroll data, like you see in this video,
95
335940
3840
Anotaban los datos del pergamino,
como pueden ver en este vídeo,
05:39
where they created a red line where the surface would lie.
96
339820
3440
donde creaban una línea roja donde quedaría la superficie.
05:43
The algorithm then would take it into 3D space,
97
343300
3120
Luego, el algoritmo lo llevaría al espacio 3D,
05:46
creating a three-dimensional representation of the surface.
98
346460
4040
creando una representación tridimensional de la superficie.
05:50
Computer algorithms
99
350860
1240
Los algoritmos informáticos
05:52
would then flatten it and create a segment.
100
352140
2360
luego lo aplanarían y crearían un segmento.
05:55
This all would be called “segmentation”
101
355220
2680
Todo esto se denominaría ″segmentación″
05:57
in the space of the scrolling and unrolling community.
102
357940
6240
en el espacio de la comunidad de desplazar y desenrollar.
06:04
(Laughter)
103
364940
5200
(Risas)
06:10
So I created open-source commits to this tool
104
370140
5760
Así que creé aplicaciones de código abierto con esta herramienta
06:15
and implemented new algorithms from my studies, like Optical Flow,
105
375900
3840
e implementé nuevos algoritmos derivados de mis estudios,
como Optical Flow,
06:19
to better track the sheets through the volume,
106
379780
3560
para hacer un mejor seguimiento de las hojas a lo largo del volumen,
06:23
and we end up with something like what you see behind me.
107
383380
3840
y terminamos con algo parecido a lo que se ve detrás de mí.
06:27
First off, those were really small segments,
108
387260
2920
En primer lugar, se trataba de segmentos muy pequeños,
06:30
and I added improvement,
109
390180
1480
y añadí mejoras,
06:31
made the code faster
110
391700
1440
hice que el código fuera más rápido
06:33
and had lots of feedback from the community.
111
393180
2880
y recibí muchos comentarios de la comunidad.
06:36
They were really happy, and I was happy getting lots of feedback.
112
396100
3400
Estaban muy contentos y yo estaba feliz de recibir muchos comentarios.
06:39
It was a really positive environment.
113
399540
2120
Fue un ambiente muy positivo.
06:43
So in the end,
114
403300
1800
Al final,
pude hacer un seguimiento del rendimiento de los algoritmos,
06:45
I could track the performance of the algorithms,
115
405140
2720
06:47
how the segmentation team performed,
116
407900
2160
del rendimiento del equipo de segmentación,
06:50
and I could see that my improvements, from start to finish,
117
410100
3560
y me di cuenta de que mis mejoras, de principio a fin,
06:53
would be around a 10,000-fold improvement over the initial version.
118
413660
5560
serían unas 10 000 veces superiores a las de la versión inicial.
07:00
This algorithm was then also used to unroll all the area
119
420580
4320
Luego, este algoritmo también se usó para desenrollar toda el área
07:04
that you can see in our submission.
120
424940
2040
que puedes ver en nuestra presentación.
07:07
All the sheets were generated with these methods.
121
427020
3240
Todas las hojas se generaron con estos métodos.
07:11
In December, I was looking for teammates.
122
431620
3280
En diciembre,
estaba buscando compañeros de equipo.
07:14
I made a blog post,
123
434940
1280
Publiqué en un blog
07:16
and I showcased my newest algorithms,
124
436260
3280
y mostré mis algoritmos más recientes
07:19
reaching out to anyone that was willing to team up.
125
439580
3240
poniéndome en contacto con cualquiera que estuviera dispuesto a trabajar en equipo.
07:23
Youssef and Luke got into contact with me.
126
443780
3160
Youssef y Luke se pusieron en contacto conmigo.
07:27
They were happy to team up, and I was happy as well.
127
447740
3280
Estaban felices de formar equipo, y yo también estaba feliz.
07:31
(Laughter)
128
451740
1400
07:33
So after the virtual unwrapping, the words still are not visible.
129
453820
4720
Así que, después del desenvolvimiento virtual,
las palabras siguen sin ser visibles.
El principal problema es que la tinta utilizada en aquella época
07:39
The main problem is that the ink that was used at the time
130
459100
2920
07:42
was a carbon-based ink,
131
462020
1840
era una tinta a base de carbono,
07:43
and carbon-based ink on carbon-based papyrus in a CT scan
132
463900
3440
y esta sobre papiros a base de carbono
en una tomografía computarizada
07:47
isn’t visible, or at least [not] to the naked eye.
133
467380
2800
no es visible,
o al menos no a simple vista.
07:50
So the same team at the University of Kentucky
134
470860
2200
Por eso, el mismo equipo de la Universidad de Kentucky
07:53
decided to test whether the ink was present at all
135
473100
2600
decidió comprobar si la tinta estaba presente
07:55
in the CT scans.
136
475700
1360
en las tomografías computarizadas.
07:57
For this, they took some of the pieces that people broke off the scrolls,
137
477100
5160
Para ello, tomaron algunos fragmentos
de los pergaminos que la gente había desprendido
y los pusieron
08:02
and they fed them into the same pipeline of the X-ray CT scanning,
138
482260
5040
en el mismo conducto en el que se hizo la tomografía computarizada con rayos X,
lo que nos dio los datos tridimensionales con los que estábamos trabajando.
08:07
and this gives us the 3D data that we were working with.
139
487300
3040
08:10
Because you can see the ink and it’s an exposed surface,
140
490380
3840
Ya que podemos ver la tinta y es una superficie expuesta,
08:14
you can even improve it with infrared imaging.
141
494220
2600
podemos incluso mejorarla con imágenes infrarrojas.
08:16
And this gives you a ground truth
142
496820
1640
Y esto te da una verdad fundamental
08:18
of what letters you're actually trying to find.
143
498460
2480
de las letras que realmente se están intentando encontrar.
08:21
And then from there,
144
501620
1280
Y a partir de ahí,
08:22
you can train a machine-learning model to try to find these letters.
145
502940
3640
se puede entrenar un modelo de aprendizaje automático
para tratar de encontrar estas letras.
08:27
The way this works
146
507260
1440
La forma en que esto funciona
08:28
is that the model looks at very small cubes at a single time
147
508740
3440
es que el modelo observa cubos muy pequeños a la vez
08:32
and tries to decide whether there is ink present in this area or not.
148
512220
4080
e intenta decidir si hay tinta en esta área o no.
08:36
And then, when you keep moving this cube all around,
149
516300
3360
Y luego, al mover el cubo por todas partes,
08:39
the model gets to see different data samples
150
519700
3040
el modelo ve diferentes muestras de datos
08:42
and then tries to understand what ink actually is.
151
522780
3560
y trata de entender qué es realmente la tinta.
08:47
So this is how it looks while the model is training.
152
527020
2520
Así es como se ve mientras el modelo se entrena.
08:49
It's not perfect, but you can see that, especially around the middle,
153
529580
4640
No es perfecto, pero puede verse que, sobre todo en la parte central,
08:54
the model is starting to see the letters perfectly.
154
534260
2880
el modelo empieza a ver las letras perfectamente.
08:57
So the data is there.
155
537140
2400
Así que los datos están ahí.
08:59
The ink is there.
156
539580
1240
La tinta está ahí.
09:00
But it’s just very hard to find and see.
157
540820
1960
Pero es muy difícil de encontrar y ver.
09:04
Looking at the CT scan raw data on the left here,
158
544020
4960
Al observar los datos sin procesar de la tomografía computarizada de la izquierda,
09:09
you can see the fibers,
159
549020
2280
pueden ver las fibras,
09:11
you can see the structure of the papyrus,
160
551340
2960
la estructura del papiro,
09:14
but the letters are very, very faint.
161
554340
2640
pero las letras son muy, muy tenues.
09:17
The letters from the right image are very, very faint in the CT scans.
162
557020
4400
Las letras de la imagen derecha son muy tenues en las tomografías computarizadas.
09:21
And they're actually, in this special case,
163
561460
3080
Y en realidad, en este caso especial,
09:24
characterized by a difference of contrast
164
564580
2480
se caracterizan por una diferencia de contraste
09:27
and some speckles, freckles, features that are very hard to see.
165
567100
4520
y algunas manchas, pecas, rasgos que son muy difíciles de ver.
09:32
So what happens if we try to take a look
166
572340
3360
Entonces, ¿qué pasa si intentamos echar
09:35
at the segment that Julian was just showing?
167
575740
2720
un vistazo al segmento que Julian acaba de mostrar?
09:40
So this is the data that we were working with.
168
580500
2720
Así que estos son los datos con los que estábamos trabajando.
09:43
And I'm going to give you 10 seconds to try to find the letters yourself.
169
583260
4040
Voy a dar 10 segundos para que intenten encontrar las letras.
09:47
(Laughter)
170
587340
1120
(Risas)
09:48
And as a hint,
171
588500
1640
Y a modo de pista,
09:50
I'll tell you that there are three letters in this image.
172
590180
2720
les diré que hay tres letras en esta imagen.
09:52
Believe me.
173
592900
2080
Créanme.
09:55
Try to find some pattern, some crackle patterns,
174
595980
5160
Intenten encontrar algún patrón en el agrietamiento,
10:01
some cracks in there.
175
601140
1520
algunas grietas ahí.
10:03
If you were able to identify this pattern of these three letters --
176
603420
4160
Si pudieron identificar el patrón de estas tres letras...
10:07
(Laughter)
177
607620
2720
(Risas)
10:10
then congratulations.
178
610380
1200
entonces felicidades.
10:11
One year ago, you may have won 40,000 dollars.
179
611620
2360
Hace un año, podrían haber ganado USD 40 000.
10:14
(Laughter)
180
614020
2000
(Risas)
10:16
However, if you're like me, and you couldn't make sense of this,
181
616060
3720
Sin embargo, si son como yo y no pueden encontrarle sentido a esto,
10:19
there's a different way that you can find this ink --
182
619780
2680
hay una forma diferente de encontrar esta tinta,
10:22
one that actually scales very, very well.
183
622460
2440
una que realmente escala muy, muy bien.
10:26
So this is where my journey begins with the Vesuvius Challenge.
184
626460
3680
Así que aquí es donde comienza mi viaje con el Reto Vesubio.
10:30
There is this neat idea in computer-vision literature
185
630180
2880
Hay una idea muy clara
en la literatura sobre visión artificial
10:33
where if you don't actually have labels,
186
633060
2120
según la cual, si no tienes etiquetas,
10:35
if you don't have the goal that you want your AI model to reach,
187
635220
4080
si no tienes el objetivo que quieres que alcance tu modelo de IA,
10:39
you can pick an intermediary goal along the way.
188
639300
2480
puedes elegir un objetivo intermedio en el camino.
10:42
So, looking at these two pairs of images,
189
642500
4880
Por lo tanto, al observar estos dos pares de imágenes,
nuestros ojos pueden identificar que se trata de las mismas imágenes,
10:47
our eyes can identify that these are the same images,
190
647420
3040
10:50
just flipped.
191
650500
1600
simplemente invertidas.
10:52
And we can do that because we understand
192
652100
2680
Y podemos hacerlo porque entendemos
10:54
the structures that are present in the images.
193
654820
2240
las estructuras presentes en las imágenes.
10:57
We can see this little triangle, and it's flipped,
194
657060
3040
Podemos ver este pequeño triángulo y está invertido,
11:00
so we know this is the same triangle.
195
660140
2240
así que sabemos que es el mismo triángulo.
11:02
Our eyes already have this feature,
196
662420
2720
Nuestros ojos ya tienen esta función,
11:05
but neural networks don't.
197
665180
2720
pero las redes neuronales no.
11:07
When they see these images,
198
667940
1320
Cuando ven estas imágenes,
11:09
they can't [tell] that these are the same image.
199
669260
2320
no saben que son la misma imagen.
11:11
So one idea, just to let it know about the structures
200
671580
3160
Por lo que una idea, simplemente para que conozca las estructuras
11:14
and familiarize it with the data,
201
674780
1880
y se familiarice con los datos,
11:16
is to show it different views of the same image
202
676700
3560
es mostrarle diferentes vistas de la misma imagen
11:20
and tell it that these are the same images.
203
680260
2000
y decirle que se trata de las mismas imágenes.
11:22
And after that, you take this model
204
682900
2800
Y después de eso, tomas este modelo
11:25
and you train it like the previous models that the University of Kentucky did.
205
685700
4440
y lo entrenas como los modelos anteriores de la Universidad de Kentucky.
11:30
And while the approach doesn't fully work, it also doesn't fully not work.
206
690180
4360
Y aunque el enfoque no funciona del todo,
tampoco deja de funcionar.
11:34
And this was the first image that was produced by the model.
207
694580
3840
Y esta fue la primera imagen que produjo el modelo.
11:38
And there was some very faint signal in there.
208
698460
3360
Y había una señal muy débil ahí.
11:41
It seemed like the model was catching on something,
209
701860
2440
Parecía que el modelo estaba captando algo,
11:44
but it wasn't clear, exactly, what the model was catching on.
210
704340
3240
pero no estaba claro exactamente qué estaba captando.
11:48
So I decided to take these predictions and create a new ground truth,
211
708180
6440
Así que decidí tomar estas predicciones y crear una nueva verdad fundamental,
11:54
asking the model, "Hey, I think these might be letters.
212
714660
2760
preguntando al modelo:
″Oye, creo que pueden ser letras.
11:57
I think there's something in there. Try to find more of this."
213
717420
3360
Creo que hay algo ahí dentro. Intenta encontrar más de esto″.
12:00
And my ground truth, actually,
214
720820
2000
Y de hecho, mi verdad fundamental
12:02
has four correct letters and four other delusions.
215
722820
3200
tiene cuatro letras correctas y otras cuatro ilusiones.
12:06
But that was OK.
216
726060
1680
Pero eso estuvo bien.
12:07
So training a new model with this data,
217
727780
2320
Así que al entrenar un nuevo modelo con estos datos,
12:10
the model started to find more ink, find more letters,
218
730140
2760
el modelo empezó a encontrar más tinta,
12:12
and the lines even looked complete.
219
732940
2520
más letras e incluso las líneas parecían completas.
Así que pensé:
12:16
So I thought, "What are the chances that if I do this again,
220
736140
3920
″¿Qué posibilidades hay de que, si vuelvo a hacer esto,
12:20
the models keep improving?"
221
740100
1480
los modelos sigan mejorando?″.
12:22
And this was the core behind our grand prize-winning solution.
222
742220
4400
Y este fue el núcleo de nuestra solución ganadora del gran premio.
12:27
Repeating this process over and over, the models kept improving.
223
747380
3480
Repitiendo este proceso una y otra vez, los modelos siguieron mejorando.
12:31
The main trick was you needed to prevent the models from memorizing
224
751740
4440
El truco principal consistía en evitar que los modelos memorizaran
lo que habían aprendido los modelos anteriores.
12:36
what the previous models have learned.
225
756220
2000
12:38
You're essentially asking the model to learn
226
758260
2080
Básicamente, pidiendo al modelo que aprenda
12:40
what the other model has learned.
227
760340
1880
lo que el otro modelo ha aprendido.
12:42
So overfitting was a serious problem that required a lot of experiments.
228
762260
4760
Por lo tanto, el sobreajuste fue un problema grave
que requirió muchos experimentos.
12:47
But in the end, getting the recipe right,
229
767020
3440
Pero al final, con la receta correcta,
12:50
we were able to predict all of these letters
230
770460
3320
pudimos predecir todas estas letras
12:53
without the models ever seeing them.
231
773780
2080
sin que los modelos las vieran.
12:55
These were the first 10 letters.
232
775860
1640
Estas fueron las 10 primeras letras.
12:57
There are, like, 20 in there,
233
777540
1600
Hay como 20 ahí,
12:59
but this was the first coherent word read from an unopened papyrus sheet.
234
779180
5640
pero esta fue la primera palabra coherente leída de una hoja de papiro sin abrir.
13:05
From there, scaling the process,
235
785860
1800
A partir de ahí, escalando el proceso,
13:07
within weeks, we had, now, columns of text,
236
787700
3440
en cuestión de semanas,
ya teníamos columnas de texto
13:11
even special characters
237
791180
1320
e incluso caracteres especiales
13:12
that papyrologists found very interesting that the model was able to find.
238
792540
3840
que los papirólogos encontraron muy interesante
que el modelo fue capaz de encontrar.
13:17
The approach was open-sourced,
239
797660
1720
El enfoque era de código abierto,
13:19
and the data and the code were out there,
240
799420
2520
y los datos y el código estaban disponibles,
13:21
and the race for the grand prize was on.
241
801980
2120
y la carrera por el gran premio había comenzado.
13:24
Recovering four paragraphs at an 85-percent clarity.
242
804900
4160
Recuperando cuatro párrafos con una claridad del 85 %.
13:29
And the key to our success was perfecting the data and the model
243
809100
3760
Y la clave de nuestro éxito fue perfeccionar los datos y el modelo
13:32
with so many iterations and so many experiments.
244
812900
2440
con muchas iteraciones y muchos experimentos.
13:36
In the end, we were able to recover
245
816020
2080
Al final, pudimos recuperar
13:38
more than 14 columns of text, and 2,000 letters.
246
818140
4000
más de 14 columnas de texto y 2000 letras.
13:44
(Applause)
247
824260
7000
(Aplausos)
13:51
2,000 characters safely stored away two millennia ago.
248
831820
5240
2000 caracteres se almacenaron de forma segura hace dos milenios.
13:57
In just nine months, we discovered them again.
249
837940
4080
En solo nueve meses, los volvimos a descubrir.
14:02
AI helped us, in large portions,
250
842460
2600
La IA nos ayudó, en gran medida,
14:05
writing better code and even being part in our algorithms.
251
845060
4280
a escribir mejor código e incluso a formar parte de nuestros algoritmos.
14:10
It opened a window into the past.
252
850060
2320
Abrió una ventana al pasado.
14:12
What's next?
253
852980
1520
¿Qué sigue?
14:14
Let's open this window more.
254
854500
2000
Vamos a abrir más esta ventana.
14:16
AI will help us access information that was so far safely locked away.
255
856540
5960
La IA nos ayudará a acceder a la información
que hasta ahora estaba guardada de forma segura.
14:24
In the words of the author,
256
864180
1800
En palabras del autor:
14:27
"We do not refrain from questioning nor understanding,
257
867660
5960
″Nosotros no nos abstenemos de cuestionar
ni de comprender,
14:35
and may it be evident to say true things as they appear."
258
875380
6680
y que sea evidente decir las cosas verdaderas tal como aparecen″.
14:43
(Applause)
259
883220
1960
(Aplausos)
Acerca de este sitio web

Este sitio le presentará vídeos de YouTube útiles para aprender inglés. Verá lecciones de inglés impartidas por profesores de primera categoría de todo el mundo. Haz doble clic en los subtítulos en inglés que aparecen en cada página de vídeo para reproducir el vídeo desde allí. Los subtítulos se desplazan en sincronía con la reproducción del vídeo. Si tiene algún comentario o petición, póngase en contacto con nosotros mediante este formulario de contacto.

https://forms.gle/WvT1wiN1qDtmnspy7