How AI Is Decoding Ancient Scrolls | Julian Schilliger and Youssef Nader | TED

88,449 views ・ 2025-01-30

TED


Por favor, faça duplo clique nas legendas em inglês abaixo para reproduzir o vídeo.

Tradutor: Margarida Ferreira Revisora: Isabel M. Vaz Belchior
Pensamos sempre no potencial que a IA tem para mudar o futuro.
00:04
We always think about the potential of AI changing the future.
0
4020
3880
00:08
But what about the potential of AI changing the past?
1
8900
2760
Mas e quanto ao potencial da IA para mudar o passado?
00:12
My name is Youssef Nader.
2
12860
1560
Chamo-me Youssef Nader.
00:14
I'm an Egyptian AI researcher
3
14460
1960
Sou um investigador egípcio de IA
00:16
and a PhD student at the Free University in Berlin,
4
16460
3120
e estudante de doutoramento na Universidade Livre de Berlim.
00:19
and last year, I led the Vesuvius Grand Prize winning team
5
19620
4960
No ano passado, liderei a equipa vencedora do Grande Prémio Vesúvio
00:24
on exploring this very question.
6
24620
2240
que explorava este mesmo tema.
00:27
You see, the story starts almost 2,000 years ago.
7
27900
3320
A história começa há quase 2000 anos.
Um filósofo grego, que pensamos ter sido Filodemo de Gádara,
00:32
A Greek philosopher that we believe was Philodemus of Gadara
8
32180
4040
usava uma das muitas salas da Villa dei Papiri.
00:36
sat in one of the many rooms of the Villa dei Papiri.
9
36260
2880
00:39
He talked about music, he talked about pleasure,
10
39980
3280
Falava da música, falava do prazer,
00:43
he talked about what makes things enjoyable,
11
43260
2560
falava do que torna as coisas agradáveis,
00:45
questions that still plague us until today.
12
45860
2280
questões que ainda hoje nos atormentam.
00:49
One of his scribes wrote down his thoughts on sheets of papyrus.
13
49300
4800
Um dos seus escribas anotou o pensamento dele em folhas de papiro.
00:54
The sheets were rolled and stowed away for later generations.
14
54660
4320
Essas folhas foram enroladas e guardadas para as gerações posteriores.
Avançando 150 anos...
01:00
Fast-forward 150 years, ...
15
60180
3120
o Monte Vesúvio entra em erupção,
01:04
Mount Vesuvius erupts,
16
64380
2160
01:06
burying Herculaneum, the villa and the words of the philosopher
17
66540
4800
enterrando Herculano, a vila e as palavras do filósofo
01:11
under a sea of hot mud and ashes.
18
71380
2840
sob um mar de lama quente e de cinzas.
01:15
Now fast-forward again, to the 17th century.
19
75460
2400
Agora avancemos de novo, para o século XVII.
01:18
People are excavating around the area.
20
78420
2160
As pessoas andam a escavar em volta dessa área.
01:21
They found beautiful statues, breathtaking frescoes
21
81180
4360
Encontraram belas estátuas, frescos de tirar a respiração
01:25
and some weird-looking pieces of charcoal,
22
85580
3640
e alguns pedaços de carvão vegetal de aspeto estranho,
01:29
like you see in this picture.
23
89260
1720
como vemos nesta fotografia.
01:31
This is when the first scrolls were discovered,
24
91700
2880
Foi quando foram descobertos os primeiros pergaminhos,
01:34
and people were racing to excavate more of these.
25
94620
3000
e as pessoas acorriam para encontrar mais.
Que conhecimentos estarão ali que não conhecemos hoje?
01:38
What knowledge is included that is not known to us now?
26
98300
4320
01:42
What things should we know about these scrolls?
27
102660
2920
Que coisas devíamos saber sobre estes pergaminhos?
01:48
My name is Julian, and I am a digital archaeologist.
28
108860
5040
Chamo-me Julian e sou arqueólogo digital.
Quando o fluxo piroclástico atingiu os pergaminhos,
01:55
When the pyroclastic flow hit the scrolls, it had a destructive effect.
29
115660
6920
o efeito foi destrutivo.
02:03
It tore into them, shredded off pieces, and it charred them badly.
30
123460
6200
Rasgou-os, despedaçou-os e carbonizou-os gravemente.
02:09
Even the deformation that you can see happened at that point.
31
129700
5120
A deformação que vemos aconteceu nessa altura.
02:14
People, 250-something years ago,
32
134860
3920
Há 250 anos, as pessoas sentiam curiosidade em saber
02:18
were curious what's lying inside those scrolls,
33
138780
3240
o que estava escondido nesses pergaminhos,
02:22
hidden and not accessible anymore.
34
142060
3200
e já não estava acessível.
Por falta de tecnologia,
02:26
Because of a lack of technology,
35
146020
1920
02:27
they had to resort to physically unrolling
36
147980
3920
recorreram a desenrolá-los fisicamente
02:31
and thereby destroying most of the scrolls.
37
151900
3680
e assim destruíram a maior parte dos pergaminhos.
02:36
To this day,
38
156340
1320
Até hoje, só os pergaminhos mais danificados e deformados
02:37
only the most damaged and deformed scrolls
39
157700
3000
02:40
remain in their initial, rolled-up configuration.
40
160740
4200
permaneceram enrolados na sua configuração inicial.
02:45
Fast-forwarding a little bit, the computer age arrives.
41
165780
4320
Avançando um pouco mais, chegamos à era do computador.
02:50
Youssef and I are born.
42
170140
2960
O Youssef e eu nascemos.
02:53
We are going on and getting our education --
43
173100
2840
Vamos avançando nos nossos estudos...
02:55
(Laughter)
44
175940
1760
(Risos)
02:57
and at the same time, Brent Seales, a researcher and professor,
45
177700
6080
e, ao mesmo tempo, Brent Seales, investigador e professor,
03:03
had the idea to use CT scan technology to actually digitize the scrolls,
46
183820
6560
teve a ideia de usar a tecnologia de tomografia computadorizada
para digitalizar os pergaminhos,
03:10
with the hope of, one day, digitally unrolling them.
47
190420
5640
na esperança de, um dia, poder desenrolá-los digitalmente.
Atrás de mim, vemos um vídeo dessa tomografia computadorizada,
03:16
Behind me, you can see a video of such a CT scan,
48
196100
3520
03:19
and it goes through the CT scan 3D volume,
49
199660
3400
que passa pelo volume da tomografia computadorizada a 3D,
03:23
layer by layer.
50
203100
1200
camada por camada.
Vemos o papiro como uma espiral,
03:25
The papyrus is visible as a spiral,
51
205020
4080
03:29
and you can see it's tightly wound-up,
52
209100
2080
e vemos que está bem enrolado,
03:31
sometimes touching each other, flaying off.
53
211220
2720
por vezes tocando-se uns aos outros, escondendo-se.
03:33
It's a difficult question, how to unroll this digitally.
54
213980
3640
É uma pergunta difícil, como desenrolar isto digitalmente.
03:38
Nat Friedman, a Silicon Valley investor,
55
218740
3440
Nat Friedman, um investidor de Silicon Valley,
03:42
also saw this research, and he wanted to help.
56
222220
3640
também viu esta pesquisa e quis ajudar.
03:46
That was in 2022.
57
226420
2360
Isto foi em 2022.
03:48
He reached out, and together with Brent Seales,
58
228820
3080
Foi ter com eles e, juntamente com Brent Seales,
03:51
they created the Vesuvius Challenge,
59
231940
2760
criaram o Vesuvius Challenge,
03:54
with the goal to motivate nerds all over the world
60
234740
3720
com o objetivo de motivar nerds de todo o mundo
03:58
to solve this problem.
61
238460
1560
a resolver este problema.
04:00
(Laughter)
62
240020
1920
(Risos)
04:01
They created a grand prize,
63
241980
1800
Criaram um grande prémio,
04:03
promising eternal glory and monetary incentives
64
243820
3560
prometendo glória eterna e incentivos monetários
04:07
to anyone who could do that.
65
247420
1560
a qualquer um que conseguisse fazer isso.
04:09
(Laughter)
66
249020
1800
(Risos)
04:10
I myself saw that on the internet
67
250860
2280
Eu próprio vi isso na Internet
enquanto escrevia a minha tese de mestrado, em robótica,
04:13
while writing my master's thesis at ETH Zurich, in robotics,
68
253180
4040
no Instituto Federal de Tecnologia de Zurique,
04:17
and I was instantly happy to solve it --
69
257220
3280
e fiquei logo com vontade de o resolver
04:20
or at least try, why not, you know?
70
260540
2320
ou pelo menos, de tentar.
04:22
And I went on, joined the Discord community
71
262900
3880
E juntei-me à comunidade Discord
04:26
where all the people that were also contestants
72
266820
2720
onde todas as pessoas que também eram concorrentes
04:29
and playing with the scroll data
73
269540
1800
brincavam com os dados dos pergaminhos
04:31
were exchanging ideas,
74
271340
2080
e trocavam ideias.
04:33
and I joined there and started working on it.
75
273420
2840
Entrei lá, comecei a trabalhar nisso.
04:37
Also there, on Discord, I met Youssef and Luke [Farritor],
76
277820
3240
Também ali, no Discord, conheci o Youssef e o Luke Farritor,
que se tornariam os meus companheiros de equipa
04:41
who would become my teammates,
77
281100
1440
04:42
and with whom I would actually win the grand prize.
78
282580
3360
e com quem ganharia o grande prémio.
04:45
Surprisingly, it went on, and made global headline news.
79
285980
3800
Surpreendentemente, tornou-se notícia em todo o mundo.
Até apareceu nos tabloides britânicos.
04:50
It even got into the British tabloids.
80
290460
2400
04:52
(Laughter)
81
292900
3040
(Risos)
04:55
So when we started,
82
295940
1560
Quando começámos,
04:57
there were two main problems still remaining.
83
297500
3400
ainda se mantinham dois problemas principais.
05:00
One, you had to unroll the scroll.
84
300940
2840
Primeiro, era preciso desenrolar o pergaminho.
05:03
And two, you then had to make the ink visible.
85
303780
3560
E segundo, tínhamos de tornar visível a tinta.
05:07
Youssef will tell you more about that part.
86
307380
2280
Youssef contar-vos-á mais coisas sobre essa parte.
05:10
For me, the most exciting thing
87
310660
2120
Para mim, o mais importante
05:12
was the computer-vision problem of unrolling those scrolls virtually.
88
312780
4280
era o problema da visão por computador
para desenrolar virtualmente esses pergaminhos.
05:17
I decided to iterate on a tool
89
317060
2240
Decidi utilizar uma ferramenta
05:19
that was created by the Kentucky researchers,
90
319340
2800
criada pelos investigadores de Kentucky,
05:22
and make it faster, less prone to errors
91
322180
3640
e torná-la mais rápida, menos propensa a erros
05:25
and just iterate on it and make it better.
92
325820
2800
usá-la tal como era e melhorá-la.
05:29
The Vesuvius Challenge team saw that
93
329380
1840
A equipa do Vesuvius Challenge viu isso
05:31
and also implemented a team of 10 people that would use my tool.
94
331220
4680
e também implementou uma equipa de 10 pessoas
que iam usar a minha ferramenta.
05:35
They would annotate scroll data, like you see in this video,
95
335940
3840
Faziam anotações dos dados dos pergaminhos,
como se vê neste vídeo.
05:39
where they created a red line where the surface would lie.
96
339820
3440
Criavam uma linha vermelha onde ficaria a superfície.
05:43
The algorithm then would take it into 3D space,
97
343300
3120
Depois, o algoritmo levava-o para o espaço 3D,
05:46
creating a three-dimensional representation of the surface.
98
346460
4040
criando uma representação tridimensional da superfície.
05:50
Computer algorithms
99
350860
1240
Depois, os algoritmos informáticos
05:52
would then flatten it and create a segment.
100
352140
2360
achatavam-na e criavam um segmento.
05:55
This all would be called “segmentation”
101
355220
2680
Tudo isso seria chamado de “segmentação”
05:57
in the space of the scrolling and unrolling community.
102
357940
6240
na comunidade dos pergaminhos, enrolados e desenrolados.
06:04
(Laughter)
103
364940
5200
(Risos)
06:10
So I created open-source commits to this tool
104
370140
5760
Assim, criei commits de código aberto para esta ferramenta
06:15
and implemented new algorithms from my studies, like Optical Flow,
105
375900
3840
e implementei novos algoritmos dos meus estudos, como o Optical Flow,
06:19
to better track the sheets through the volume,
106
379780
3560
para melhor rastrear as folhas através do volume,
06:23
and we end up with something like what you see behind me.
107
383380
3840
e acabámos com uma coisa como o que veem atrás de mim.
06:27
First off, those were really small segments,
108
387260
2920
Em primeiro lugar, eram segmentos muito pequenos,
06:30
and I added improvement,
109
390180
1480
e acrescentei melhorias,
06:31
made the code faster
110
391700
1440
tornei o código mais rápido
06:33
and had lots of feedback from the community.
111
393180
2880
e recebi muito feedback da comunidade.
06:36
They were really happy, and I was happy getting lots of feedback.
112
396100
3400
Ficaram muito contentes,
e eu senti-me feliz por receber muito feedback.
06:39
It was a really positive environment.
113
399540
2120
Foi um ambiente muito positivo.
06:43
So in the end,
114
403300
1800
No final,
06:45
I could track the performance of the algorithms,
115
405140
2720
consegui acompanhar o desempenho dos algoritmos,
06:47
how the segmentation team performed,
116
407900
2160
o desempenho da equipa de segmentação,
06:50
and I could see that my improvements, from start to finish,
117
410100
3560
e pude ver que as minhas melhorias, do princípio até ao fim,
06:53
would be around a 10,000-fold improvement over the initial version.
118
413660
5560
seriam cerca de 10 000 vezes superiores à versão inicial.
07:00
This algorithm was then also used to unroll all the area
119
420580
4320
Este algoritmo também foi usado para desenrolar toda a área
07:04
that you can see in our submission.
120
424940
2040
que veem na nossa apresentação.
07:07
All the sheets were generated with these methods.
121
427020
3240
Todas as folhas foram geradas com estes métodos.
07:11
In December, I was looking for teammates.
122
431620
3280
Em dezembro, eu andava à procura de companheiros de equipa.
07:14
I made a blog post,
123
434940
1280
Fiz uma publicação no blogue
07:16
and I showcased my newest algorithms,
124
436260
3280
e mostrei os meus algoritmos mais novos,
07:19
reaching out to anyone that was willing to team up.
125
439580
3240
estendendo a mão a qualquer pessoa
que estivesse disposta a fazer equipa comigo.
07:23
Youssef and Luke got into contact with me.
126
443780
3160
O Youssef e o Luke entraram em contacto comigo.
07:27
They were happy to team up, and I was happy as well.
127
447740
3280
Ficaram contentes por se juntarem a mim e eu também fiquei contente.
07:31
(Laughter)
128
451740
1400
(Risos)
07:33
So after the virtual unwrapping, the words still are not visible.
129
453820
4720
Depois de desenrolar virtualmente, as palavras continuam a não ser visíveis.
07:39
The main problem is that the ink that was used at the time
130
459100
2920
O principal problema é que a tinta que era usada na altura
07:42
was a carbon-based ink,
131
462020
1840
era uma tinta à base de carbono
07:43
and carbon-based ink on carbon-based papyrus in a CT scan
132
463900
3440
e a tinta à base de carbono
num papiro à base de carbono numa TAC,
07:47
isn’t visible, or at least [not] to the naked eye.
133
467380
2800
não é visível, pelo menos a olho nu.
07:50
So the same team at the University of Kentucky
134
470860
2200
A mesma equipa da Universidade do Kentucky
07:53
decided to test whether the ink was present at all
135
473100
2600
decidiu testar se a tinta estava presente nas TAC.
07:55
in the CT scans.
136
475700
1360
07:57
For this, they took some of the pieces that people broke off the scrolls,
137
477100
5160
Para isso, pegaram em pedaços
que as pessoas tinham quebrado nos pergaminhos
08:02
and they fed them into the same pipeline of the X-ray CT scanning,
138
482260
5040
e expuseram-nos no mesmo canal da TAC de raios-X.
08:07
and this gives us the 3D data that we were working with.
139
487300
3040
Isso deu-nos os dados 3D com que estivemos a trabalhar.
08:10
Because you can see the ink and it’s an exposed surface,
140
490380
3840
Como conseguimos ver a tinta e é uma superfície exposta,
08:14
you can even improve it with infrared imaging.
141
494220
2600
podemos até melhorá-la com imagens infravermelhas.
08:16
And this gives you a ground truth
142
496820
1640
Isto dá-nos uma verdade básica
08:18
of what letters you're actually trying to find.
143
498460
2480
quanto às letras que estamos a tentar encontrar.
08:21
And then from there,
144
501620
1280
E a partir daí,
08:22
you can train a machine-learning model to try to find these letters.
145
502940
3640
podemos treinar um modelo de aprendizagem automática
para tentar encontrar essas letras.
08:27
The way this works
146
507260
1440
A forma como isto funciona
08:28
is that the model looks at very small cubes at a single time
147
508740
3440
é que o modelo olha para cubos muito pequenos de uma só vez
08:32
and tries to decide whether there is ink present in this area or not.
148
512220
4080
e tenta decidir se há tinta presente nesta área ou não.
08:36
And then, when you keep moving this cube all around,
149
516300
3360
Depois, quando continuamos a mover este cubo por toda a parte.
08:39
the model gets to see different data samples
150
519700
3040
o modelo consegue ver diferentes amostras de dados
08:42
and then tries to understand what ink actually is.
151
522780
3560
e tenta perceber o que é a tinta.
08:47
So this is how it looks while the model is training.
152
527020
2520
Portanto, é assim que fica enquanto o modelo está a treinar.
08:49
It's not perfect, but you can see that, especially around the middle,
153
529580
4640
Não é perfeito, mas como veem, especialmente no meio,
08:54
the model is starting to see the letters perfectly.
154
534260
2880
o modelo começa a ver as letras perfeitamente.
08:57
So the data is there.
155
537140
2400
Portanto, os dados estão lá.
08:59
The ink is there.
156
539580
1240
A tinta está lá.
09:00
But it’s just very hard to find and see.
157
540820
1960
Mas é muito difícil encontrá-la e vê-la.
09:04
Looking at the CT scan raw data on the left here,
158
544020
4960
Olhando para os dados brutos da TAC à esquerda,
09:09
you can see the fibers,
159
549020
2280
vemos as fibras, vemos a estrutura do papiro,
09:11
you can see the structure of the papyrus,
160
551340
2960
09:14
but the letters are very, very faint.
161
554340
2640
mas as letras são muito, muito ténues.
09:17
The letters from the right image are very, very faint in the CT scans.
162
557020
4400
As letras da imagem à direita são muito ténues nas TACs.
09:21
And they're actually, in this special case,
163
561460
3080
E, neste caso em especial,
09:24
characterized by a difference of contrast
164
564580
2480
são caracterizadas por uma diferença de contraste
09:27
and some speckles, freckles, features that are very hard to see.
165
567100
4520
por algumas manchas, por sardas,
características que são muito difíceis de ver.
09:32
So what happens if we try to take a look
166
572340
3360
Então, o que acontece, se tentarmos dar uma olhadela
09:35
at the segment that Julian was just showing?
167
575740
2720
ao segmento que o Julian estava a mostrar?
09:40
So this is the data that we were working with.
168
580500
2720
Estes são os dados com que estávamos a trabalhar.
09:43
And I'm going to give you 10 seconds to try to find the letters yourself.
169
583260
4040
Vou dar-vos 10 segundos para tentarem encontrar as letras.
09:47
(Laughter)
170
587340
1120
(Risos)
09:48
And as a hint,
171
588500
1640
E, para vos ajudar,
09:50
I'll tell you that there are three letters in this image.
172
590180
2720
vou dizer-vos que há três letras nesta imagem.
09:52
Believe me.
173
592900
2080
Acreditem em mim.
09:55
Try to find some pattern, some crackle patterns,
174
595980
5160
Tentem encontrar um padrão, quaisquer padrões,
10:01
some cracks in there.
175
601140
1520
algumas rachas ali dentro.
10:03
If you were able to identify this pattern of these three letters --
176
603420
4160
Se conseguirem identificar este padrão destas três letras...
10:07
(Laughter)
177
607620
2720
(Risos),
10:10
then congratulations.
178
610380
1200
parabéns!
10:11
One year ago, you may have won 40,000 dollars.
179
611620
2360
Há um ano, talvez tivessem ganho 40 000 dólares.
10:14
(Laughter)
180
614020
2000
(Risos)
10:16
However, if you're like me, and you couldn't make sense of this,
181
616060
3720
No entanto, se são como eu sou, e não conseguem perceber isto,
10:19
there's a different way that you can find this ink --
182
619780
2680
há uma forma diferente de encontrar esta tinta,
10:22
one that actually scales very, very well.
183
622460
2440
uma forma que é muito bem dimensionada.
10:26
So this is where my journey begins with the Vesuvius Challenge.
184
626460
3680
É aqui que começa o meu percurso com o Vesuvius Challenge.
10:30
There is this neat idea in computer-vision literature
185
630180
2880
Há uma ideia interessante na literatura sobre visão computacional
10:33
where if you don't actually have labels,
186
633060
2120
em que, se não tivermos rótulos,
10:35
if you don't have the goal that you want your AI model to reach,
187
635220
4080
se não tivermos o objetivo que queremos que o nosso modelo de IA atinja,
10:39
you can pick an intermediary goal along the way.
188
639300
2480
podemos escolher um objetivo intermédio ao longo do caminho.
10:42
So, looking at these two pairs of images,
189
642500
4880
Depois, olhando para estes dois pares de imagens,
10:47
our eyes can identify that these are the same images,
190
647420
3040
os nossos olhos podem identificar que estas são as mesmas imagens,
10:50
just flipped.
191
650500
1600
mas invertidas.
10:52
And we can do that because we understand
192
652100
2680
E podemos fazer isso porque compreendemos
10:54
the structures that are present in the images.
193
654820
2240
as estruturas que estão presentes nas imagens.
10:57
We can see this little triangle, and it's flipped,
194
657060
3040
Vemos este pequeno triângulo, que está invertido,
11:00
so we know this is the same triangle.
195
660140
2240
e sabemos que é o mesmo triângulo.
11:02
Our eyes already have this feature,
196
662420
2720
Os nossos olhos já têm esta característica,
11:05
but neural networks don't.
197
665180
2720
mas as redes neurais não.
11:07
When they see these images,
198
667940
1320
Quando veem estas imagens,
11:09
they can't [tell] that these are the same image.
199
669260
2320
não conseguem perceber que são a mesma imagem.
11:11
So one idea, just to let it know about the structures
200
671580
3160
Portanto, uma ideia, só para o informar quanto às estruturas
11:14
and familiarize it with the data,
201
674780
1880
e familiarizá-lo com os dados,
11:16
is to show it different views of the same image
202
676700
3560
é mostrar-lhe diferentes visões da mesma imagem
11:20
and tell it that these are the same images.
203
680260
2000
e dizer-lhe que são a mesma imagem.
11:22
And after that, you take this model
204
682900
2800
Depois disso, pegamos neste modelo
11:25
and you train it like the previous models that the University of Kentucky did.
205
685700
4440
e treinamo-lo como os modelos anteriores da Universidade do Kentucky.
11:30
And while the approach doesn't fully work, it also doesn't fully not work.
206
690180
4360
Embora esta abordagem não funcione totalmente,
também não deixa totalmente de funcionar.
11:34
And this was the first image that was produced by the model.
207
694580
3840
Esta foi a primeira imagem que foi produzida pelo modelo.
11:38
And there was some very faint signal in there.
208
698460
3360
Havia um sinal muito fraco no interior.
11:41
It seemed like the model was catching on something,
209
701860
2440
Parecia que o modelo estava a captar qualquer coisa,
11:44
but it wasn't clear, exactly, what the model was catching on.
210
704340
3240
mas não se percebia bem o que o modelo estava a captar.
11:48
So I decided to take these predictions and create a new ground truth,
211
708180
6440
Então decidi pegar nestas previsões e criar uma nova verdade básica,
11:54
asking the model, "Hey, I think these might be letters.
212
714660
2760
perguntando ao modelo: “Acho que isto podem ser letras.
11:57
I think there's something in there. Try to find more of this."
213
717420
3360
“Acho que há algo aí dentro. Tenta encontrar mais disto.”
12:00
And my ground truth, actually,
214
720820
2000
Na verdade, a minha verdade base
12:02
has four correct letters and four other delusions.
215
722820
3200
tem quatro letras corretas e quatro outras erradas.
12:06
But that was OK.
216
726060
1680
Mas tudo bem.
12:07
So training a new model with this data,
217
727780
2320
Ao treinar um novo modelo com estes dados,
12:10
the model started to find more ink, find more letters,
218
730140
2760
o modelo começou a encontrar mais tinta, mais letras,
12:12
and the lines even looked complete.
219
732940
2520
e as linhas até pareciam completas.
12:16
So I thought, "What are the chances that if I do this again,
220
736140
3920
Então, pensei: “Quais são as hipóteses, se eu voltar a fazer isso,
12:20
the models keep improving?"
221
740100
1480
“de os modelos continuarem a melhorar?”
12:22
And this was the core behind our grand prize-winning solution.
222
742220
4400
Este era o núcleo por trás da solução vencedora de grandes prémios.
12:27
Repeating this process over and over, the models kept improving.
223
747380
3480
Repetindo este processo vezes sem conta, os modelos continuaram a melhorar.
12:31
The main trick was you needed to prevent the models from memorizing
224
751740
4440
O truque principal era evitar que os modelos memorizassem
o que os modelos anteriores tinham aprendido.
12:36
what the previous models have learned.
225
756220
2000
12:38
You're essentially asking the model to learn
226
758260
2080
Essencialmente, estávamos a pedir ao modelo
12:40
what the other model has learned.
227
760340
1880
que aprendesse o que o outro modelo tinha aprendido.
12:42
So overfitting was a serious problem that required a lot of experiments.
228
762260
4760
Portanto, o sobreajuste era um problema sério que exigia muitas experiências.
12:47
But in the end, getting the recipe right,
229
767020
3440
Mas no final, acertando a receita,
12:50
we were able to predict all of these letters
230
770460
3320
conseguimos prever todas as letras
12:53
without the models ever seeing them.
231
773780
2080
sem que os modelos as vissem.
12:55
These were the first 10 letters.
232
775860
1640
Estas foram as primeiras 10 letras.
12:57
There are, like, 20 in there,
233
777540
1600
Há aqui umas 20,
12:59
but this was the first coherent word read from an unopened papyrus sheet.
234
779180
5640
mas esta foi a primeira palavra coerente
lida numa folha de papiro sem estar aberta.
13:05
From there, scaling the process,
235
785860
1800
A partir daí, alargando o processo,
13:07
within weeks, we had, now, columns of text,
236
787700
3440
em poucas semanas, tínhamos colunas de texto,
até mesmo caracteres especiais
13:11
even special characters
237
791180
1320
13:12
that papyrologists found very interesting that the model was able to find.
238
792540
3840
que os papirologistas acharam muito interessantes
e que o modelo conseguiu encontrar.
13:17
The approach was open-sourced,
239
797660
1720
A abordagem era de código aberto,
13:19
and the data and the code were out there,
240
799420
2520
os dados e o código estavam disponíveis,
13:21
and the race for the grand prize was on.
241
801980
2120
e começou a corrida pelo grande prémio.
13:24
Recovering four paragraphs at an 85-percent clarity.
242
804900
4160
Recuperando quatro parágrafos com uma clareza de 85%.
13:29
And the key to our success was perfecting the data and the model
243
809100
3760
A chave para o nosso êxito foi aperfeiçoar os dados e o modelo
13:32
with so many iterations and so many experiments.
244
812900
2440
com muitas iterações e muitas experiências.
13:36
In the end, we were able to recover
245
816020
2080
No final, conseguimos recuperar
13:38
more than 14 columns of text, and 2,000 letters.
246
818140
4000
mais de 14 colunas de texto e 2000 letras.
13:44
(Applause)
247
824260
7000
(Aplausos)
13:51
2,000 characters safely stored away two millennia ago.
248
831820
5240
2000 caracteres guardados com segurança há dois milénios.
13:57
In just nine months, we discovered them again.
249
837940
4080
Apenas em nove meses, descobrimo-los de novo.
14:02
AI helped us, in large portions,
250
842460
2600
A IA ajudou-nos, em muito,
14:05
writing better code and even being part in our algorithms.
251
845060
4280
a escrever um código melhor e até a fazer parte dos nossos algoritmos.
Abriu uma janela para o passado.
14:10
It opened a window into the past.
252
850060
2320
14:12
What's next?
253
852980
1520
O que vem a seguir?
14:14
Let's open this window more.
254
854500
2000
Vamos abrir mais esta janela.
14:16
AI will help us access information that was so far safely locked away.
255
856540
5960
A IA ajudar-nos-á a aceder a informações
que até agora estavam bloqueadas com segurança.
14:24
In the words of the author,
256
864180
1800
Nas palavras do autor,
14:27
"We do not refrain from questioning nor understanding,
257
867660
5960
“Não nos abstemos de questionar nem de compreender,
14:35
and may it be evident to say true things as they appear."
258
875380
6680
“e oxalá seja evidente dizer coisas verdadeiras à medida que aparecem”.
(Aplausos)
14:43
(Applause)
259
883220
1960
Sobre este site

Este sítio irá apresentar-lhe vídeos do YouTube que são úteis para a aprendizagem do inglês. Verá lições de inglês ensinadas por professores de primeira linha de todo o mundo. Faça duplo clique nas legendas em inglês apresentadas em cada página de vídeo para reproduzir o vídeo a partir daí. As legendas deslocam-se em sincronia com a reprodução do vídeo. Se tiver quaisquer comentários ou pedidos, por favor contacte-nos utilizando este formulário de contacto.

https://forms.gle/WvT1wiN1qDtmnspy7