How AI Is Decoding Ancient Scrolls | Julian Schilliger and Youssef Nader | TED

89,084 views ・ 2025-01-30

TED


Пожалуйста, дважды щелкните на английские субтитры ниже, чтобы воспроизвести видео.

Переводчик: Nailya Agdeeva Редактор: Alena Chernykh
00:04
We always think about the potential of AI changing the future.
0
4020
3880
Мы всегда думаем о том, как ИИ может изменить будущее.
00:08
But what about the potential of AI changing the past?
1
8900
2760
Но как насчёт того, как ИИ может изменить прошлое?
00:12
My name is Youssef Nader.
2
12860
1560
Меня зовут Юсеф Надер.
00:14
I'm an Egyptian AI researcher
3
14460
1960
Я исследователь ИИ из Египта
00:16
and a PhD student at the Free University in Berlin,
4
16460
3120
и аспирант Свободного университета в Берлине.
00:19
and last year, I led the Vesuvius Grand Prize winning team
5
19620
4960
В прошлом году я возглавил команду победителей Гран-при «Везувий»,
00:24
on exploring this very question.
6
24620
2240
которая изучала именно этот вопрос.
00:27
You see, the story starts almost 2,000 years ago.
7
27900
3320
Эта история началась почти 2000 лет назад.
00:32
A Greek philosopher that we believe was Philodemus of Gadara
8
32180
4040
Греческий философ, по нашему убеждению, это был Филодем Гадарский,
00:36
sat in one of the many rooms of the Villa dei Papiri.
9
36260
2880
сидел в одной из многих комнат Виллы папирусов.
00:39
He talked about music, he talked about pleasure,
10
39980
3280
Он рассуждал о музыке, об удовольствиях,
00:43
he talked about what makes things enjoyable,
11
43260
2560
о том, что делает что-то приносящим удовольствие,
00:45
questions that still plague us until today.
12
45860
2280
о вопросах, которые беспокоят нас до сих пор.
00:49
One of his scribes wrote down his thoughts on sheets of papyrus.
13
49300
4800
Один из его писарей перенёс его мысли на листы папируса.
00:54
The sheets were rolled and stowed away for later generations.
14
54660
4320
Листы были свёрнуты и убраны для будущих поколений.
01:00
Fast-forward 150 years, ...
15
60180
3120
Перенесёмся на 150 лет вперёд...
01:04
Mount Vesuvius erupts,
16
64380
2160
В результате извержения Везувия
01:06
burying Herculaneum, the villa and the words of the philosopher
17
66540
4800
Геркуланум был погребён, вместе с виллой и словами философа,
01:11
under a sea of hot mud and ashes.
18
71380
2840
под слоем горячей лавы и пепла.
01:15
Now fast-forward again, to the 17th century.
19
75460
2400
А теперь снова перенесёмся в XVII век.
01:18
People are excavating around the area.
20
78420
2160
В этом районе ведутся раскопки.
01:21
They found beautiful statues, breathtaking frescoes
21
81180
4360
Там нашли красивые статуи, потрясающие фрески
01:25
and some weird-looking pieces of charcoal,
22
85580
3640
и несколько странных на вид кусков угля,
01:29
like you see in this picture.
23
89260
1720
вроде того, что вы видите на фото.
01:31
This is when the first scrolls were discovered,
24
91700
2880
Именно тогда были обнаружены первые свитки,
01:34
and people were racing to excavate more of these.
25
94620
3000
и люди бросились откапывать ещё больше таких же.
01:38
What knowledge is included that is not known to us now?
26
98300
4320
Какие знания заключены в них, о которых мы даже не подозреваем?
01:42
What things should we know about these scrolls?
27
102660
2920
Что нам нужно знать об этих свитках?
01:48
My name is Julian, and I am a digital archaeologist.
28
108860
5040
Меня зовут Джулиан, я цифровой археолог.
01:55
When the pyroclastic flow hit the scrolls, it had a destructive effect.
29
115660
6920
Когда пирокластический поток попал на свитки, он оказал разрушительный эффект.
02:03
It tore into them, shredded off pieces, and it charred them badly.
30
123460
6200
Он разрывал, измельчал на кусочки и сильно обугливал их.
02:09
Even the deformation that you can see happened at that point.
31
129700
5120
В этот момент произошла именно та деформация, которую вы видите.
02:14
People, 250-something years ago,
32
134860
3920
Людям 250 с лишним лет назад
02:18
were curious what's lying inside those scrolls,
33
138780
3240
стало интересно, что спрятано в этих свитках,
02:22
hidden and not accessible anymore.
34
142060
3200
скрыто и больше недоступно.
02:26
Because of a lack of technology,
35
146020
1920
Из-за отсутствия технологий
02:27
they had to resort to physically unrolling
36
147980
3920
им пришлось физически разворачивать их,
02:31
and thereby destroying most of the scrolls.
37
151900
3680
тем самым уничтожая большинство свитков.
02:36
To this day,
38
156340
1320
До наших дней
02:37
only the most damaged and deformed scrolls
39
157700
3000
только самые повреждённые и деформированные свитки
02:40
remain in their initial, rolled-up configuration.
40
160740
4200
сохранились в исходном свёрнутом виде.
02:45
Fast-forwarding a little bit, the computer age arrives.
41
165780
4320
Перенесёмся ещё немного вперёд. Наступила компьютерная эра.
02:50
Youssef and I are born.
42
170140
2960
Родились мы с Юсефом.
02:53
We are going on and getting our education --
43
173100
2840
Мы растём, получаем образование...
02:55
(Laughter)
44
175940
1760
(Смех)
02:57
and at the same time, Brent Seales, a researcher and professor,
45
177700
6080
И в это же время Бренту Силсу, исследователю и профессору,
03:03
had the idea to use CT scan technology to actually digitize the scrolls,
46
183820
6560
приходит в голову идея оцифровать свитки, использую компьютерную томографию
03:10
with the hope of, one day, digitally unrolling them.
47
190420
5640
с надеждой, что однажды получится развернуть их в цифровом виде.
03:16
Behind me, you can see a video of such a CT scan,
48
196100
3520
Позади меня видео такого КТ-сканирования,
03:19
and it goes through the CT scan 3D volume,
49
199660
3400
оно просматривает трёхмерный объём при помощи компьютерной томографии
03:23
layer by layer.
50
203100
1200
слой за слоем.
03:25
The papyrus is visible as a spiral,
51
205020
4080
Папирус виден как спираль,
03:29
and you can see it's tightly wound-up,
52
209100
2080
видите, как плотно он смотан,
03:31
sometimes touching each other, flaying off.
53
211220
2720
слои иногда касаются друг друга и повреждаются.
03:33
It's a difficult question, how to unroll this digitally.
54
213980
3640
Как развернуть всё это в цифровом виде — сложный вопрос.
03:38
Nat Friedman, a Silicon Valley investor,
55
218740
3440
Нат Фридман, инвестор Кремниевой долины,
03:42
also saw this research, and he wanted to help.
56
222220
3640
узнал об этом исследовании и захотел помочь.
03:46
That was in 2022.
57
226420
2360
Это было в 2022 году.
03:48
He reached out, and together with Brent Seales,
58
228820
3080
Он связался с Брентом Силсом,
03:51
they created the Vesuvius Challenge,
59
231940
2760
и вместе они придумали испытание «Везувий»,
03:54
with the goal to motivate nerds all over the world
60
234740
3720
целью которого было привлечь заучек со всего мира
03:58
to solve this problem.
61
238460
1560
к решению этой проблемы.
04:00
(Laughter)
62
240020
1920
(Смех)
04:01
They created a grand prize,
63
241980
1800
Они установили главный приз,
04:03
promising eternal glory and monetary incentives
64
243820
3560
пообещав вечную славу и денежное вознаграждение всем,
04:07
to anyone who could do that.
65
247420
1560
кто сможет это сделать.
04:09
(Laughter)
66
249020
1800
(Смех)
04:10
I myself saw that on the internet
67
250860
2280
Я узнал об этом из интернета,
04:13
while writing my master's thesis at ETH Zurich, in robotics,
68
253180
4040
когда писал диссертацию по робототехнике в Швейцарской технической школе Цюриха,
04:17
and I was instantly happy to solve it --
69
257220
3280
и с радостью решил бы эту задачу
04:20
or at least try, why not, you know?
70
260540
2320
или хотя бы попробовал, почему нет?
04:22
And I went on, joined the Discord community
71
262900
3880
И вот я вступил в сообщество в Discord,
04:26
where all the people that were also contestants
72
266820
2720
где все, кто тоже участвовал в испытании
04:29
and playing with the scroll data
73
269540
1800
и исследовал данные о свитках,
04:31
were exchanging ideas,
74
271340
2080
обменивались идеями,
04:33
and I joined there and started working on it.
75
273420
2840
и я тоже к ним присоединился и приступил к работе.
04:37
Also there, on Discord, I met Youssef and Luke [Farritor],
76
277820
3240
Там же, в Discord, я познакомился с Юсефом и Люком [Фарритором],
04:41
who would become my teammates,
77
281100
1440
мы стали командой,
04:42
and with whom I would actually win the grand prize.
78
282580
3360
и вместе с ними я в последствии выиграл главный приз.
04:45
Surprisingly, it went on, and made global headline news.
79
285980
3800
Удивительно, но это получило огласку и попало в заголовки мировых новостей.
04:50
It even got into the British tabloids.
80
290460
2400
Даже в британские таблоиды.
04:52
(Laughter)
81
292900
3040
(Смех)
04:55
So when we started,
82
295940
1560
Когда мы начинали,
04:57
there were two main problems still remaining.
83
297500
3400
были две основные проблемы.
05:00
One, you had to unroll the scroll.
84
300940
2840
Во-первых, нужно было развернуть свиток.
05:03
And two, you then had to make the ink visible.
85
303780
3560
А во-вторых, нужно было сделать чернила видимыми.
05:07
Youssef will tell you more about that part.
86
307380
2280
Юсеф расскажет об этом подробнее.
05:10
For me, the most exciting thing
87
310660
2120
Меня же больше всего волновала
05:12
was the computer-vision problem of unrolling those scrolls virtually.
88
312780
4280
проблема виртуального разворачивания свитков с помощью машинного зрения.
05:17
I decided to iterate on a tool
89
317060
2240
Я решил доработать инструмент,
05:19
that was created by the Kentucky researchers,
90
319340
2800
созданный исследователями из Кентукки,
05:22
and make it faster, less prone to errors
91
322180
3640
сделать его более быстрым, менее подверженным ошибкам,
05:25
and just iterate on it and make it better.
92
325820
2800
улучшить его.
05:29
The Vesuvius Challenge team saw that
93
329380
1840
Люди из команды «Везувия» увидели это
05:31
and also implemented a team of 10 people that would use my tool.
94
331220
4680
и собрали команду из 10 человек, которые пользовались бы моим инструментом.
05:35
They would annotate scroll data, like you see in this video,
95
335940
3840
Они аннотируют данные из свитка, как показано на этом видео,
05:39
where they created a red line where the surface would lie.
96
339820
3440
где они создают красную линию, на которой находится поверхность.
05:43
The algorithm then would take it into 3D space,
97
343300
3120
Затем алгоритм переносит данные в трёхмерное пространство
05:46
creating a three-dimensional representation of the surface.
98
346460
4040
и создаёт 3-D макет поверхности.
05:50
Computer algorithms
99
350860
1240
Компьютерные алгоритмы
05:52
would then flatten it and create a segment.
100
352140
2360
затем сплющивают его и создают сегмент.
05:55
This all would be called “segmentation”
101
355220
2680
Это назовут «сегментацией»
05:57
in the space of the scrolling and unrolling community.
102
357940
6240
в сообществе, которое занималось скруткой и раскруткой,
06:04
(Laughter)
103
364940
5200
(Смех)
06:10
So I created open-source commits to this tool
104
370140
5760
Для этого инструмента я создал коммиты с открытым исходным кодом
06:15
and implemented new algorithms from my studies, like Optical Flow,
105
375900
3840
и внедрил новые алгоритмы из моих исследований, такие как Optical Flow,
06:19
to better track the sheets through the volume,
106
379780
3560
чтобы лучше отслеживать содержимое листов по всему объему,
06:23
and we end up with something like what you see behind me.
107
383380
3840
и в итоге мы получили нечто похожее на то, что вы видите позади меня.
06:27
First off, those were really small segments,
108
387260
2920
Во-первых, это были очень маленькие сегменты,
06:30
and I added improvement,
109
390180
1480
и я внёс улучшения,
06:31
made the code faster
110
391700
1440
ускорил код
06:33
and had lots of feedback from the community.
111
393180
2880
и получил множество отзывов от сообщества.
06:36
They were really happy, and I was happy getting lots of feedback.
112
396100
3400
Они были очень довольны, а я был доволен множеством отзывов.
06:39
It was a really positive environment.
113
399540
2120
Атмосфера была очень позитивная.
06:43
So in the end,
114
403300
1800
В результате
06:45
I could track the performance of the algorithms,
115
405140
2720
я смог отслеживать производительность алгоритмов,
06:47
how the segmentation team performed,
116
407900
2160
как справляется команда сегментации,
06:50
and I could see that my improvements, from start to finish,
117
410100
3560
а также видеть, что мои доработки, от начала до конца,
06:53
would be around a 10,000-fold improvement over the initial version.
118
413660
5560
улучшили первоначальную версию примерно в 10 000 раз.
07:00
This algorithm was then also used to unroll all the area
119
420580
4320
Затем этот алгоритм использовали для раскрытия всей области,
07:04
that you can see in our submission.
120
424940
2040
которая была в нашей заявке.
07:07
All the sheets were generated with these methods.
121
427020
3240
Все листы были сгенерированы с помощью этих методов.
07:11
In December, I was looking for teammates.
122
431620
3280
В декабре я искал партнёров по команде.
07:14
I made a blog post,
123
434940
1280
Я написал пост в блоге
07:16
and I showcased my newest algorithms,
124
436260
3280
и показал мои новейшие алгоритмы,
07:19
reaching out to anyone that was willing to team up.
125
439580
3240
обратившись ко всем, кто хотел объединиться.
07:23
Youssef and Luke got into contact with me.
126
443780
3160
Юсеф и Люк связались со мной.
07:27
They were happy to team up, and I was happy as well.
127
447740
3280
Они были рады объединиться, я тоже был счастлив.
07:31
(Laughter)
128
451740
1400
(Смех)
07:33
So after the virtual unwrapping, the words still are not visible.
129
453820
4720
После виртуального развёртывания слов так и не было видно.
07:39
The main problem is that the ink that was used at the time
130
459100
2920
Проблема в том, что чернила, которыми тогда пользовались,
07:42
was a carbon-based ink,
131
462020
1840
делались на основе углерода,
07:43
and carbon-based ink on carbon-based papyrus in a CT scan
132
463900
3440
а такие чернила на углеродном папирусе при компьютерной томографии
07:47
isn’t visible, or at least [not] to the naked eye.
133
467380
2800
не видны, по крайней мере, невооружённым глазом.
07:50
So the same team at the University of Kentucky
134
470860
2200
Та же команда из Университета Кентукки
07:53
decided to test whether the ink was present at all
135
473100
2600
решила проверить, присутствовали ли вообще чернила
07:55
in the CT scans.
136
475700
1360
на компьютерной томографии.
07:57
For this, they took some of the pieces that people broke off the scrolls,
137
477100
5160
Для этого они взяли часть отколовшихся от свитков кусочков
08:02
and they fed them into the same pipeline of the X-ray CT scanning,
138
482260
5040
и отправили их в тот же конвейер рентгеновской КТ,
08:07
and this gives us the 3D data that we were working with.
139
487300
3040
и так мы получили трёхмерные данные, с которыми можно работать.
08:10
Because you can see the ink and it’s an exposed surface,
140
490380
3840
Поскольку чернила видны на открытой поверхности,
08:14
you can even improve it with infrared imaging.
141
494220
2600
их видимость можно улучшить инфракрасным изображением.
08:16
And this gives you a ground truth
142
496820
1640
Это даёт полное представление
08:18
of what letters you're actually trying to find.
143
498460
2480
о буквах, которые вы и пытаетесь обнаружить.
08:21
And then from there,
144
501620
1280
Из этой точки
08:22
you can train a machine-learning model to try to find these letters.
145
502940
3640
вы можете натренировать модель машинного обучения искать буквы.
08:27
The way this works
146
507260
1440
Работает это так:
08:28
is that the model looks at very small cubes at a single time
147
508740
3440
модель за один отрезок времени изучает очень маленькие кубики
08:32
and tries to decide whether there is ink present in this area or not.
148
512220
4080
и пытается определить, есть ли в этой области чернила.
08:36
And then, when you keep moving this cube all around,
149
516300
3360
Затем, когда вы перемещаете этот куб по всему периметру,
08:39
the model gets to see different data samples
150
519700
3040
модель видит разные образцы данных
08:42
and then tries to understand what ink actually is.
151
522780
3560
и пытается определить, что такое чернила на самом деле.
08:47
So this is how it looks while the model is training.
152
527020
2520
Вот как выглядит обучение модели.
08:49
It's not perfect, but you can see that, especially around the middle,
153
529580
4640
Это не идеально, но видите, особенно в середине,
08:54
the model is starting to see the letters perfectly.
154
534260
2880
модель начинает хорошо различать буквы.
08:57
So the data is there.
155
537140
2400
Итак, данные есть.
08:59
The ink is there.
156
539580
1240
Чернила есть.
09:00
But it’s just very hard to find and see.
157
540820
1960
Но найти и разглядеть очень сложно.
09:04
Looking at the CT scan raw data on the left here,
158
544020
4960
Посмотрите на необработанные данные компьютерной томографии слева,
09:09
you can see the fibers,
159
549020
2280
вы видите волокна,
09:11
you can see the structure of the papyrus,
160
551340
2960
видите структуру папируса,
09:14
but the letters are very, very faint.
161
554340
2640
но буквы очень и очень бледные.
09:17
The letters from the right image are very, very faint in the CT scans.
162
557020
4400
Буквы на изображении справа очень бледные на компьютерной томографии.
09:21
And they're actually, in this special case,
163
561460
3080
И на самом деле, в данном конкретном случае,
09:24
characterized by a difference of contrast
164
564580
2480
они характеризуются разницей в контрасте
09:27
and some speckles, freckles, features that are very hard to see.
165
567100
4520
и некоторыми пятнышками, точечками — чертами, которые очень трудно разглядеть.
09:32
So what happens if we try to take a look
166
572340
3360
Что же произойдёт, если мы попробуем
09:35
at the segment that Julian was just showing?
167
575740
2720
взглянуть на фрагмент, который показывал Джулиан?
09:40
So this is the data that we were working with.
168
580500
2720
Это данные, с которыми мы работали.
09:43
And I'm going to give you 10 seconds to try to find the letters yourself.
169
583260
4040
Я дам вам 10 секунд, попытайтесь сами найти буквы.
09:47
(Laughter)
170
587340
1120
(Смех)
09:48
And as a hint,
171
588500
1640
Подскажу:
09:50
I'll tell you that there are three letters in this image.
172
590180
2720
на этом изображении три буквы.
09:52
Believe me.
173
592900
2080
Поверьте мне.
09:55
Try to find some pattern, some crackle patterns,
174
595980
5160
Попробуйте найти какой-нибудь узор, какие-то трещины,
10:01
some cracks in there.
175
601140
1520
какие-то углубления.
10:03
If you were able to identify this pattern of these three letters --
176
603420
4160
Если вы смогли распознать узор из этих трех букв,
10:07
(Laughter)
177
607620
2720
(Смех)
10:10
then congratulations.
178
610380
1200
тогда поздравляю.
10:11
One year ago, you may have won 40,000 dollars.
179
611620
2360
Год назад вы могли бы выиграть 40 000 долларов.
10:14
(Laughter)
180
614020
2000
(Смех)
10:16
However, if you're like me, and you couldn't make sense of this,
181
616060
3720
Однако, если вы, так же как и я, не смогли ничего разобрать,
10:19
there's a different way that you can find this ink --
182
619780
2680
есть другой способ найти чернила,
10:22
one that actually scales very, very well.
183
622460
2440
тот, который на самом деле отлично масштабируется.
10:26
So this is where my journey begins with the Vesuvius Challenge.
184
626460
3680
Именно здесь начинается моё путешествие с испытанием «Везувий».
10:30
There is this neat idea in computer-vision literature
185
630180
2880
В книгах по машинному зрению есть интересная идея:
10:33
where if you don't actually have labels,
186
633060
2120
если у вас нет идентификаторов,
10:35
if you don't have the goal that you want your AI model to reach,
187
635220
4080
если нет цели, которую вы хотите поставить модели ИИ,
10:39
you can pick an intermediary goal along the way.
188
639300
2480
можно выбрать промежуточную цель.
10:42
So, looking at these two pairs of images,
189
642500
4880
Глядя на эти две пары изображений,
10:47
our eyes can identify that these are the same images,
190
647420
3040
наши глаза могут распознать, что это одни и те же изображения,
10:50
just flipped.
191
650500
1600
только перевёрнутые.
10:52
And we can do that because we understand
192
652100
2680
Мы это распознаём, потому что понимаем
10:54
the structures that are present in the images.
193
654820
2240
структуры, присутствующие на этих изображениях.
10:57
We can see this little triangle, and it's flipped,
194
657060
3040
Мы видим этот маленький треугольник, он перевёрнут,
11:00
so we know this is the same triangle.
195
660140
2240
и мы знаем, что это тот же треугольник.
11:02
Our eyes already have this feature,
196
662420
2720
В наших глазах эта функция уже есть,
11:05
but neural networks don't.
197
665180
2720
а в нейронной сети её нет.
11:07
When they see these images,
198
667940
1320
Когда она это видит,
11:09
they can't [tell] that these are the same image.
199
669260
2320
она не знает, что это — одно и то же изображение.
11:11
So one idea, just to let it know about the structures
200
671580
3160
Одна из идей, как рассказать ей о структурах
11:14
and familiarize it with the data,
201
674780
1880
и познакомить с данными, —
11:16
is to show it different views of the same image
202
676700
3560
это показать ей разные виды одного и того же изображения
11:20
and tell it that these are the same images.
203
680260
2000
и рассказать, что это одно изображение.
11:22
And after that, you take this model
204
682900
2800
После этого можно взять эту модель
11:25
and you train it like the previous models that the University of Kentucky did.
205
685700
4440
и обучить так же, как предыдущие модели, сделанные Университетом Кентукки.
11:30
And while the approach doesn't fully work, it also doesn't fully not work.
206
690180
4360
И хотя этот подход работает не идеально, он всё же работает.
11:34
And this was the first image that was produced by the model.
207
694580
3840
И это было первое изображение, созданное моделью.
11:38
And there was some very faint signal in there.
208
698460
3360
И там был очень слабый сигнал.
11:41
It seemed like the model was catching on something,
209
701860
2440
Казалось, что модель за что-то зацепилась,
11:44
but it wasn't clear, exactly, what the model was catching on.
210
704340
3240
но было непонятно, за что именно.
11:48
So I decided to take these predictions and create a new ground truth,
211
708180
6440
Поэтому я решил воспользоваться этими прогнозами и придумать новую истину,
11:54
asking the model, "Hey, I think these might be letters.
212
714660
2760
сказав модели: «Думаю, это могут быть буквы.
11:57
I think there's something in there. Try to find more of this."
213
717420
3360
Думаю, в этом что-то есть. Попробуй узнать больше».
12:00
And my ground truth, actually,
214
720820
2000
На самом деле, моя истина
12:02
has four correct letters and four other delusions.
215
722820
3200
состоит из четырёх правильных букв и четырёх заблуждений.
12:06
But that was OK.
216
726060
1680
Но это хорошо.
12:07
So training a new model with this data,
217
727780
2320
Обучившись на этих данных,
12:10
the model started to find more ink, find more letters,
218
730140
2760
модель начала находить больше чернил, находить больше букв,
12:12
and the lines even looked complete.
219
732940
2520
а линии даже выглядели законченными.
12:16
So I thought, "What are the chances that if I do this again,
220
736140
3920
И я подумал: «Какова вероятность того, что если я сделаю это снова,
12:20
the models keep improving?"
221
740100
1480
модели продолжат улучшаться?»
12:22
And this was the core behind our grand prize-winning solution.
222
742220
4400
Именно это и стало основой нашего решения, получившего Гран-при.
12:27
Repeating this process over and over, the models kept improving.
223
747380
3480
Повторяя этот процесс раз за разом, модели продолжали совершенствоваться.
12:31
The main trick was you needed to prevent the models from memorizing
224
751740
4440
Основная сложность была в том, чтобы не дать моделям запомнить то,
12:36
what the previous models have learned.
225
756220
2000
чему обучились предыдущие модели.
12:38
You're essentially asking the model to learn
226
758260
2080
По сути, вы просите модель выучить то,
12:40
what the other model has learned.
227
760340
1880
чему научилась другая модель.
12:42
So overfitting was a serious problem that required a lot of experiments.
228
762260
4760
Переобучение стало серьёзной проблемой, требующей множества экспериментов.
12:47
But in the end, getting the recipe right,
229
767020
3440
В итоге, правильно подобрав рецепт,
12:50
we were able to predict all of these letters
230
770460
3320
мы смогли спрогнозировать все эти буквы таким образом,
12:53
without the models ever seeing them.
231
773780
2080
что модели их даже не увидели.
12:55
These were the first 10 letters.
232
775860
1640
Это были первые 10 букв.
12:57
There are, like, 20 in there,
233
777540
1600
Здесь их, кажется, 20,
12:59
but this was the first coherent word read from an unopened papyrus sheet.
234
779180
5640
но это было первое связное слово, прочитанное с неразвёрнутого папируса.
13:05
From there, scaling the process,
235
785860
1800
Потом, масштабируя процесс,
13:07
within weeks, we had, now, columns of text,
236
787700
3440
течение нескольких недель, мы получили целые колонки текста,
13:11
even special characters
237
791180
1320
даже специальные символы,
13:12
that papyrologists found very interesting that the model was able to find.
238
792540
3840
папирологи сочли очень любопытным то, что модель смогла их найти.
13:17
The approach was open-sourced,
239
797660
1720
Исходном код был открытым,
13:19
and the data and the code were out there,
240
799420
2520
и данные, и код были выложены,
13:21
and the race for the grand prize was on.
241
801980
2120
гонка за Гран-при продолжилась.
13:24
Recovering four paragraphs at an 85-percent clarity.
242
804900
4160
Восстановление четырёх абзацев с четкостью в 85%.
13:29
And the key to our success was perfecting the data and the model
243
809100
3760
Ключом к нашему успеху стало усовершенствование данных и модели
13:32
with so many iterations and so many experiments.
244
812900
2440
с помощью множества попыток и экспериментов.
13:36
In the end, we were able to recover
245
816020
2080
В итоге нам удалось восстановить
13:38
more than 14 columns of text, and 2,000 letters.
246
818140
4000
более 14 столбцов текста и 2000 букв.
13:44
(Applause)
247
824260
7000
(Аплодисменты)
13:51
2,000 characters safely stored away two millennia ago.
248
831820
5240
2000 символов были надёжно сохранены два тысячелетия назад.
13:57
In just nine months, we discovered them again.
249
837940
4080
Всего за девять месяцев мы заново их раскрыли.
14:02
AI helped us, in large portions,
250
842460
2600
ИИ во многом помогал нам,
14:05
writing better code and even being part in our algorithms.
251
845060
4280
писал более качественный код и даже участвовал в наших алгоритмах.
14:10
It opened a window into the past.
252
850060
2320
Он открыл окно в прошлое.
14:12
What's next?
253
852980
1520
Что дальше?
14:14
Let's open this window more.
254
854500
2000
Давайте раскроем это окно ещё больше.
14:16
AI will help us access information that was so far safely locked away.
255
856540
5960
ИИ поможет нам добраться до информации, которая до сих пор была надёжно спрятана.
14:24
In the words of the author,
256
864180
1800
Цитируя автора:
14:27
"We do not refrain from questioning nor understanding,
257
867660
5960
«Мы не воздерживаемся от вопросов и понимания,
14:35
and may it be evident to say true things as they appear."
258
875380
6680
и пусть будет очевидным говорить истинные вещи такими, какими они кажутся».
14:43
(Applause)
259
883220
1960
(Аплодисменты)
Об этом сайте

Этот сайт познакомит вас с видеороликами YouTube, полезными для изучения английского языка. Вы увидите уроки английского языка, преподаваемые высококлассными учителями со всего мира. Дважды щелкните по английским субтитрам, отображаемым на каждой странице видео, чтобы воспроизвести видео оттуда. Субтитры прокручиваются синхронно с воспроизведением видео. Если у вас есть какие-либо комментарии или пожелания, пожалуйста, свяжитесь с нами, используя эту контактную форму.

https://forms.gle/WvT1wiN1qDtmnspy7