Frederic Kaplan: How I built an information time machine

Как я построил информационную машину времени

78,548 views

2014-01-09 ・ TED


New videos

Frederic Kaplan: How I built an information time machine

Как я построил информационную машину времени

78,548 views ・ 2014-01-09

TED


Пожалуйста, дважды щелкните на английские субтитры ниже, чтобы воспроизвести видео.

Переводчик: Alina Siluyanova Редактор: Elena Krotova
00:12
This is an image of the planet Earth.
0
12285
2893
Это изображение планеты Земля.
00:15
It looks very much like the Apollo pictures
1
15178
3093
Оно очень похоже на известные всем снимки,
00:18
that are very well known.
2
18271
1611
сделанные в рамках космической программы Аполлон.
00:19
There is something different;
3
19882
2070
Но есть отличие —
00:21
you can click on it,
4
21952
1447
по данному изображению можно щёлкнуть,
00:23
and if you click on it,
5
23399
1198
и, если вы сделаете,
00:24
you can zoom in on almost any place on the Earth.
6
24597
3072
то сможете рассмотреть практически любое место на Земле.
00:27
For instance, this is a bird's-eye view
7
27669
1999
Например, это вид с высоты птичьего полёта
00:29
of the EPFL campus.
8
29668
2666
на кампус Федеральной политехнической школы в Лозанне (ФПШЛ).
00:32
In many cases, you can also see
9
32334
2108
В большинстве случаев вы также можете увидеть,
00:34
how a building looks from a nearby street.
10
34442
3740
как выглядит здание с соседней улицы.
00:38
This is pretty amazing.
11
38182
1422
Весьма впечатляюще.
00:39
But there's something missing in this wonderful tour:
12
39604
3427
Но чего-то не хватает в этой замечательной экскурсии:
00:43
It's time.
13
43031
2188
указания времени.
00:45
i'm not really sure when this picture was taken.
14
45219
3070
Я, на самом деле, не уверен, когда была сделана эта фотография.
00:48
I'm not even sure it was taken
15
48289
1412
Я даже не уверен соответствует
00:49
at the same moment as the bird's-eye view.
16
49701
6083
ли эта фотография действительности.
00:55
In my lab, we develop tools
17
55784
2209
В моей лаборатории мы разрабатываем инструменты
00:57
to travel not only in space
18
57993
1764
для путешествий не только в пространстве,
00:59
but also through time.
19
59757
2558
но также и во времени.
01:02
The kind of question we're asking is
20
62315
1870
Вопрос, который нас интересует:
01:04
Is it possible to build something
21
64185
1393
Возможно ли сконструировать нечто,
01:05
like Google Maps of the past?
22
65578
2178
похожее на Карты Гугл прошлого?
01:07
Can I add a slider on top of Google Maps
23
67756
3310
Могу ли я добавить бегунок к Картам Гугл
01:11
and just change the year,
24
71066
1803
и просто поменять год,
01:12
seeing how it was 100 years before,
25
72869
1791
чтобы посмотреть, как выглядела местность 100 лет назад,
01:14
1,000 years before?
26
74660
1669
1000 лет назад?
01:16
Is that possible?
27
76329
2123
Возможно ли это?
01:18
Can I reconstruct social networks of the past?
28
78452
2252
Могу ли я воспроизвести социальную сеть прошлого?
01:20
Can I make a Facebook of the Middle Ages?
29
80704
3049
Могу ли сделать Фейсбук Средневековья?
01:23
So, can I build time machines?
30
83753
3776
Могу ли построить машину времени?
01:27
Maybe we can just say, "No, it's not possible."
31
87529
2565
Может быть, проще сказать: «Нет, это невозможно».
01:30
Or, maybe, we can think of it from an information point of view.
32
90094
3810
Или же мы можем подумать об этом с информационной точки зрения.
01:33
This is what I call the information mushroom.
33
93904
3190
Это то, что я называю «информационный гриб».
01:37
Vertically, you have the time.
34
97094
1583
На вертикальной оси задано время.
01:38
and horizontally, the amount of digital information available.
35
98677
2740
На горизонтальной — объём доступной цифровой информации.
01:41
Obviously, in the last 10 years, we have much information.
36
101417
3482
Очевидно, что последние 10 лет мы владеем большим объёмом информации.
01:44
And obviously the more we go in the past, the less information we have.
37
104899
3548
И так же очевидно, что чем больше мы уходим в прошлое, тем меньше информации доступно.
01:48
If we want to build something like Google Maps of the past,
38
108447
2318
Если мы хотим создать что-то вроде Карты Гугл прошлого
01:50
or Facebook of the past,
39
110765
1494
или Фейсбук прошлого,
01:52
we need to enlarge this space,
40
112259
1574
нам нужно расширить эту область,
01:53
we need to make that like a rectangle.
41
113833
1938
задать ей форму вроде прямоугольника.
01:55
How do we do that?
42
115771
1510
Как это сделать?
01:57
One way is digitization.
43
117281
2098
Один из способов — оцифровывание.
01:59
There's a lot of material available --
44
119395
1779
Существует множество материалов —
02:01
newspaper, printed books, thousands of printed books.
45
121190
6270
газеты, печатные книги, тысячи печатных книг.
02:07
I can digitize all these.
46
127460
1768
Я всё это могу перевести в цифровой формат
02:09
I can extract information from these.
47
129228
2737
Я могу извлечь из этих источников информацию.
02:11
Of course, the more you go in the past, the less information you will have.
48
131965
3543
Конечно, чем дальше мы будем заглядывать в прошлое, тем меньше информации будет доступно.
02:15
So, it might not be enough.
49
135508
2646
Таким образом, этих действий может быть недостаточно.
02:18
So, I can do what historians do.
50
138154
2408
Я могу поступить так, как поступают историки.
02:20
I can extrapolate.
51
140562
1524
Я могу экстраполировать.
02:22
This is what we call, in computer science, simulation.
52
142086
4470
Это то, что в информатике мы называем «моделированием».
02:26
If I take a log book,
53
146556
1751
Если взять журнал,
02:28
I can consider, it's not just a log book
54
148307
2404
то можно предположить, что это не просто журнал путевых заметок
02:30
of a Venetian captain going to a particular journey.
55
150711
2972
некоего венецианского капитана, отправившегося в конкретное путешествие.
02:33
I can consider it is actually a log book
56
153683
1643
Я могу предположить, что это журнал,
02:35
which is representative of many journeys of that period.
57
155326
2582
описывающий типичное путешествие тех времён.
02:37
I'm extrapolating.
58
157908
2245
Я экстраполирую.
02:40
If I have a painting of a facade,
59
160153
2038
Если у меня есть картина фасада,
02:42
I can consider it's not just that particular building,
60
162191
2751
я могу предположить, что она содержит изображение не только одного конкретного здания,
02:44
but probably it also shares the same grammar
61
164942
3932
но, скорее всего, она включает в себя элементы зданий,
02:48
of buildings where we lost any information.
62
168874
4041
информация о которых утеряна.
02:52
So if we want to construct a time machine,
63
172915
2858
Таким образом, если мы хотим создать машину времени,
02:55
we need two things.
64
175773
1339
нам нужны две вещи.
02:57
We need very large archives,
65
177112
2234
Нам нужны весьма большие архивы
02:59
and we need excellent specialists.
66
179346
2742
и отличные специалисты.
03:02
The Venice Time Machine,
67
182088
1874
Венецианская Машина Времени —
03:03
the project I'm going to talk to you about,
68
183962
1805
проект, о котором я собираюсь вам рассказать —
03:05
is a joint project between the EPFL
69
185767
3020
это совместный проект ФПШЛ
03:08
and the University of Venice Ca'Foscari.
70
188787
2978
и Венецианского Университета Ка' Фоскари.
03:11
There's something very peculiar about Venice,
71
191765
2165
У Венеции есть одна особенность —
03:13
that its administration has been
72
193930
2674
её система управления
03:16
very, very bureaucratic.
73
196604
2194
очень и очень бюрократична.
03:18
They've been keeping track of everything,
74
198798
2193
Они отслеживают абсолютно всё,
03:20
almost like Google today.
75
200991
2915
почти как Гугл сегодня.
03:23
At the Archivio di Stato,
76
203906
1514
Государственный Архив представляет собой
03:25
you have 80 kilometers of archives
77
205420
1764
80 километров полок с документами,
03:27
documenting every aspect
78
207184
2009
содержащими информацию обо всех аспектах
03:29
of the life of Venice over more than 1,000 years.
79
209193
2246
жизни Венеции более чем за 1000 лет.
03:31
You have every boat that goes out,
80
211439
1920
Здесь учтено каждое отшвартовавшееся
03:33
every boat that comes in.
81
213359
1076
и каждое вошедшее в порт судно.
03:34
You have every change that was made in the city.
82
214435
2797
Записано каждое изменение, произведённое в городе.
03:37
This is all there.
83
217232
3291
Вся эта информация содержится в Архиве.
03:40
We are setting up a 10-year digitization program
84
220523
3908
Мы начинаем 10-летнюю программу по оцифровыванию,
03:44
which has the objective of transforming
85
224431
1677
цель которой — трансформация
03:46
this immense archive
86
226108
1384
этого необъятного архива
03:47
into a giant information system.
87
227492
2426
в гигантскую информационную систему.
03:49
The type of objective we want to reach
88
229918
1857
Результат, к которому мы стремимся, —
03:51
is 450 books a day that can be digitized.
89
231775
4726
это 450 оцифрованных книг в день.
03:56
Of course, when you digitize, that's not enough,
90
236501
2247
Конечно, когда занимаешься оцифровкой, этого недостаточно,
03:58
because these documents,
91
238748
1287
потому большинство документов написаны
04:00
most of them are in Latin, in Tuscan,
92
240035
2639
на латинском, тосканском,
04:02
in Venetian dialect,
93
242689
1515
венецианском диалектах.
04:04
so you need to transcribe them,
94
244204
1675
То есть нужно их транскрибировать,
04:05
to translate them in some cases,
95
245879
1681
в некоторых случаях — перевести,
04:07
to index them,
96
247560
1120
занести в алфавитный указатель,
04:08
and this is obviously not easy.
97
248680
2164
а это, очевидно, непросто.
04:10
In particular, traditional optical character recognition method
98
250844
3844
В частности, традиционный метод оптического распознавания текста,
04:14
that can be used for printed manuscripts,
99
254688
1424
который может применяться для печатных манускриптов,
04:16
they do not work well on the handwritten document.
100
256112
4004
не так хорошо работает для рукописных документов.
04:20
So the solution is actually to take inspiration
101
260116
2130
И тогда решением будет воспользоваться методами
04:22
from another domain: speech recognition.
102
262246
2901
из другой области: распознавания речи.
04:25
This is a domain of something that seems impossible,
103
265147
2055
Учитывая специфику данной области используемые в ней методы кажутся неприменимыми
04:27
which can actually be done,
104
267202
2537
но, на самом деле, всё разрешается
04:29
simply by putting additional constraints.
105
269739
2194
путём введения дополнительных ограничений.
04:31
If you have a very good model
106
271933
1586
Если у вас есть очень хорошая модель
04:33
of a language which is used,
107
273519
1526
используемого языка,
04:35
if you have a very good model of a document,
108
275045
2086
есть очень хороший образец документа,
04:37
how well they are structured.
109
277131
1432
как хорошо они структурированы.
04:38
And these are administrative documents.
110
278563
1353
И это все административные документы.
04:39
They are well structured in many cases.
111
279931
2132
Они хорошо структурированы в большинстве случаев.
04:42
If you divide this huge archive into smaller subsets
112
282063
3308
Если разделить этот огромный архив на меньшие «подархивы»,
04:45
where a smaller subset actually shares similar features,
113
285371
2877
где меньшая подгруппа несёт те же характерные черты,
04:48
then there's a chance of success.
114
288248
4031
тогда есть шанс на успех.
04:54
If we reach that stage, then there's something else:
115
294761
2435
Если мы дойдём до этого этапа, то появится возможность сделать ещё одну вещь:
04:57
we can extract from this document events.
116
297196
3522
извлечь из такого документа события.
05:00
Actually probably 10 billion events
117
300718
2298
Фактически, около 10 миллиардов событий
05:03
can be extracted from this archive.
118
303016
1931
могут быть извлечены из такого архива.
05:04
And this giant information system
119
304947
1724
Поиск по этой огромной информационной системе
05:06
can be searched in many ways.
120
306671
1816
можно проводить различными методами.
05:08
You can ask questions like,
121
308487
1368
Можно задавать такие вопросы как:
05:09
"Who lived in this palazzo in 1323?"
122
309855
2760
«Кто жил в этом палаццо в 1323 году?»
05:12
"How much cost a sea bream at the Realto market
123
312615
2222
«Сколько стоил морской лещ на рынке Реальто
05:14
in 1434?"
124
314837
1724
в 1434 году?»
05:16
"What was the salary
125
316561
1460
«Каково было жалованье
05:18
of a glass maker in Murano
126
318021
2045
стекловара в Мурано,
05:20
maybe over a decade?"
127
320066
1406
например, за последние десять лет?»
05:21
You can ask even bigger questions
128
321472
1422
Можно даже задавать более открытые вопросы,
05:22
because it will be semantically coded.
129
322894
2738
потому как они будут семантически закодированы.
05:25
And then what you can do is put that in space,
130
325632
2140
Далее — можно согласовать информацию в пространстве,
05:27
because much of this information is spatial.
131
327772
2173
так как большая её часть является пространственной.
05:29
And from that, you can do things like
132
329945
1935
Затем можно предпринимать такие действия, как
05:31
reconstructing this extraordinary journey
133
331880
2113
воссоздание необыкновенного пути развития
05:33
of that city that managed to have a sustainable development
134
333993
3356
города, которому удалось поддерживать устойчивое развитие
05:37
over a thousand years,
135
337349
2126
на протяжении более 1000 лет,
05:39
managing to have all the time
136
339475
1620
оставаясь при этом
05:41
a form of equilibrium with its environment.
137
341095
2861
в постоянной гармонии с окружающей средой.
05:43
You can reconstruct that journey,
138
343956
1248
Вы можете воссоздать этот путь развития,
05:45
visualize it in many different ways.
139
345204
2896
представить различные его варианты.
05:48
But of course, you cannot understand Venice if you just look at the city.
140
348100
2699
Хотя, конечно, нельзя понять Венецию, просто взглянув на город.
05:50
You have to put it in a larger European context.
141
350799
2396
Необходимо рассматривать его в более широком европейском контексте.
05:53
So the idea is also to document all the things
142
353195
2821
Таким образом, идея заключается в документировании всего,
05:56
that worked at the European level.
143
356016
2423
что происходило на европейском уровне.
05:58
We can reconstruct also the journey
144
358439
1964
Можно также воссоздать развитие
06:00
of the Venetian maritime empire,
145
360403
1990
Венецианской морской империи —
06:02
how it progressively controlled the Adriatic Sea,
146
362393
3166
то как она постепенно взяла под контроль Адриатическое море,
06:05
how it became the most powerful medieval empire
147
365559
3746
как стала самой мощной средневековой империей
06:09
of its time,
148
369305
1561
средневековой империей,
06:10
controlling most of the sea routes
149
370866
2172
контролируя большинство морских путей
06:13
from the east to the south.
150
373038
2933
от востока на юг.
06:17
But you can even do other things,
151
377305
2316
Также можно делать и другие вещи,
06:19
because in these maritime routes,
152
379621
2277
потому что на этих морских путях
06:21
there are regular patterns.
153
381898
1975
есть свои закономерности.
06:23
You can go one step beyond
154
383889
2493
Можно пойти ещё дальше
06:26
and actually create a simulation system,
155
386382
2120
и создать систему моделирования,
06:28
create a Mediterranean simulator
156
388502
2815
Средиземноморский симулятор,
06:31
which is capable actually of reconstructing
157
391317
2593
который способен воссоздать
06:33
even the information we are missing,
158
393910
2202
даже ту информацию, которой не хватает,
06:36
which would enable us to have questions you could ask
159
396112
2988
что даёт нам возможность задавать такие вопросы,
06:39
like if you were using a route planner.
160
399100
2988
как если бы мы воспользовались планировщиком маршрута.
06:42
"If I am in Corfu in June 1323
161
402088
3071
«Если я сейчас на Корфу в июне 1323 года
06:45
and want to go to Constantinople,
162
405159
2526
и хочу отправиться в Константинополь,
06:47
where can I take a boat?"
163
407685
2143
где я могу взять лодку?»
06:49
Probably we can answer this question
164
409828
1367
Мы можем ответить на этот вопрос, вероятно,
06:51
with one or two or three days' precision.
165
411195
4473
с точностью в день-два-три.
06:55
"How much will it cost?"
166
415668
1607
«Сколько это будет стоить?»
06:57
"What are the chance of encountering pirates?"
167
417275
3592
«Какова вероятность столкнуться с пиратами?»
07:00
Of course, you understand,
168
420867
1811
Вы, конечно, понимаете,
07:02
the central scientific challenge of a project like this one
169
422678
2609
что главная научная трудность подобного проекта, —
07:05
is qualifying, quantifying and representing
170
425287
3729
это качественная и количественная оценка информации и учёт
07:09
uncertainty and inconsistency at each step of this process.
171
429016
3330
неопределённости и непостоянства на каждом этапе данного процесса.
07:12
There are errors everywhere,
172
432346
2712
Ошибки встречаются повсюду —
07:15
errors in the document, it's the wrong name of the captain,
173
435058
2489
в документах, например, неверное имя капитана,
07:17
some of the boats never actually took to sea.
174
437547
3213
некоторые судна, на самом деле, никогда не уходили в море.
07:20
There are errors in translation, interpretative biases,
175
440760
4857
Ошибки в переводе, предвзятость толкований, —
07:25
and on top of that, if you add algorithmic processes,
176
445624
3466
более того, если добавить алгоритмические процессы, —
07:29
you're going to have errors in recognition,
177
449090
2949
появятся ошибки, связанные с распознаванием,
07:32
errors in extraction,
178
452039
1961
извлечением информации.
07:34
so you have very, very uncertain data.
179
454000
4481
То есть полученные нами данные будут весьма и весьма сомнительными.
07:38
So how can we detect and correct these inconsistencies?
180
458481
3757
Каким же образом можно обнаружить и скорректировать такие неточности?
07:42
How can we represent that form of uncertainty?
181
462238
3660
Каким образом можно обозначить этот вид неопределённости?
07:45
It's difficult. One thing you can do
182
465898
2097
Задача не из лёгких. Самое очевидное, что можно сделать, —
07:47
is document each step of the process,
183
467995
2226
это задокументировать каждый шаг процесса,
07:50
not only coding the historical information
184
470221
2448
не только закодировав историческую информацию,
07:52
but what we call the meta-historical information,
185
472669
2679
но и так называемую «метаисторическую» информацию —
07:55
how is historical knowledge constructed,
186
475348
2663
то, на чем построены исторические знания —
07:58
documenting each step.
187
478011
1998
задокументировать каждый шаг.
08:00
That will not guarantee that we actually converge
188
480009
1645
Это не даст гарантии, что мы приблизимся
08:01
toward a single story of Venice,
189
481654
2450
к единой истории Венеции,
08:04
but probably we can actually reconstruct
190
484104
2138
но мы, вероятно, сможем воссоздать
08:06
a fully documented potential story of Venice.
191
486242
3048
полностью задокументированную потенциальную историю Венеции.
08:09
Maybe there's not a single map.
192
489290
1459
Может быть, не будет единой карты.
08:10
Maybe there are several maps.
193
490749
2120
Может быть, их будет несколько.
08:12
The system should allow for that,
194
492869
2216
Система должна это учитывать,
08:15
because we have to deal with a new form of uncertainty,
195
495085
2859
потому что нам приходиться работать с новой формой неизвестности,
08:17
which is really new for this type of giant databases.
196
497944
4641
которая является абсолютным новшеством для такого типа гигантских баз данных.
08:22
And how should we communicate
197
502585
2190
Каким образом мы должны представить
08:24
this new research to a large audience?
198
504790
3979
это новое исследование большой аудитории?
08:28
Again, Venice is extraordinary for that.
199
508769
2663
И вновь, Венеция — исключительна в этом смысле.
08:31
With the millions of visitors that come every year,
200
511432
2171
Учитывая миллионы туристов, приезжающих каждый год,
08:33
it's actually one of the best places
201
513603
1763
она является одним из лучших мест,
08:35
to try to invent the museum of the future.
202
515366
2988
где можно попытаться изобрести музей будущего.
08:38
Imagine, horizontally you see the reconstructed map
203
518354
3304
Представьте, в горизонтальной плоскости вы видите реконструированную карту
08:41
of a given year,
204
521658
1286
заданного года,
08:42
and vertically, you see the document
205
522944
2958
а в вертикальной — документ,
08:45
that served the reconstruction,
206
525902
1511
на основе которого сделана реконструкция,
08:47
paintings, for instance.
207
527413
3400
например, картины.
08:50
Imagine an immersive system that permits
208
530813
2580
Представьте систему с «эффектом присутствия», которая позволяет
08:53
to go and dive and reconstruct the Venice of a given year,
209
533393
3502
воссоздать и окунуться в Венецию заданного года —
08:56
some experience you could share within a group.
210
536895
2715
опыт, которым можно поделиться с группой.
08:59
On the contrary, imagine actually that you start
211
539610
2246
И наоборот, представьте, что вы начали
09:01
from a document, a Venetian manuscript,
212
541856
2207
с документа, венецианского манускрипта,
09:04
and you show, actually, what you can construct out of it,
213
544063
3049
и вы смотрите, что можно воспроизвести на его основе,
09:07
how it is decoded,
214
547112
1772
как он расшифрован,
09:08
how the context of that document can be recreated.
215
548884
2415
каким образом можно воссоздать его содержание.
09:11
This is an image from an exhibit
216
551299
1885
Это фотография с выставки,
09:13
which is currently conducted in Geneva
217
553184
2276
которая в настоящее время проходит в Женеве,
09:15
with that type of system.
218
555460
2354
с такой вот системой.
09:17
So to conclude, we can say that
219
557814
2175
В заключении можно сказать, что
09:19
research in the humanities is about to undergo
220
559989
3079
исследования в области гуманитарных наук стоят на пороге
09:23
an evolution which is maybe similar
221
563068
1802
эволюции, возможно, схожей с той,
09:24
to what happened to life sciences 30 years ago.
222
564870
4582
что произошла с бионауками 30 лет назад.
09:29
It's really a question of scale.
223
569452
4676
Действительно, это вопрос масштаба.
09:34
We see projects which are
224
574130
3303
Мы рассматриваем проекты, которые
09:37
much beyond any single research team can do,
225
577433
3843
ещё не были под силу ни одной исследовательской команде
09:41
and this is really new for the humanities,
226
581276
2243
это абсолютно ново для гуманитарных наук,
09:43
which very often take the habit of working
227
583519
3869
где традицией является работать
09:47
in small groups or only with a couple of researchers.
228
587388
4008
небольшими группами или в паре.
09:51
When you visit the Archivio di Stato,
229
591396
2118
Посещая Государственный Архив,
09:53
you feel this is beyond what any single team can do,
230
593514
2822
понимаешь, что это не по силам какой-то одной команде,
09:56
and that should be a joint and common effort.
231
596336
3834
необходимо сотрудничество.
10:00
So what we must do for this paradigm shift
232
600170
3106
Для смены парадигмы мы должны
10:03
is actually foster a new generation
233
603276
1902
фактически воспитать новое поколение
10:05
of "digital humanists"
234
605178
1537
«цифровых гуманитарных наук»,
10:06
that are going to be ready for this shift.
235
606715
2090
готовых к подобной смене.
10:08
I thank you very much.
236
608805
1959
Спасибо большое.
10:10
(Applause)
237
610764
4000
(Аплодисменты)
Об этом сайте

Этот сайт познакомит вас с видеороликами YouTube, полезными для изучения английского языка. Вы увидите уроки английского языка, преподаваемые высококлассными учителями со всего мира. Дважды щелкните по английским субтитрам, отображаемым на каждой странице видео, чтобы воспроизвести видео оттуда. Субтитры прокручиваются синхронно с воспроизведением видео. Если у вас есть какие-либо комментарии или пожелания, пожалуйста, свяжитесь с нами, используя эту контактную форму.

https://forms.gle/WvT1wiN1qDtmnspy7