Frederic Kaplan: How I built an information time machine

78,548 views ・ 2014-01-09

TED


Dubbelklik op de Engelse ondertitels hieronder om de video af te spelen.

Vertaald door: Mai Nguyen Nagekeken door: Els De Keyser
00:12
This is an image of the planet Earth.
0
12285
2893
Dit is een afbeelding van de planeet Aarde.
00:15
It looks very much like the Apollo pictures
1
15178
3093
Het lijkt heel erg op de bekende Apollo-foto's van de aarde.
00:18
that are very well known.
2
18271
1611
00:19
There is something different;
3
19882
2070
Echter, er is een verschil: je kunt erop klikken
00:21
you can click on it,
4
21952
1447
en dan kan je inzoomen op bijna elke plek op aarde
00:23
and if you click on it,
5
23399
1198
00:24
you can zoom in on almost any place on the Earth.
6
24597
3072
In vogelperspectief zie je de EPFL (École Polytechnique Fédérale de Lausanne)
00:27
For instance, this is a bird's-eye view
7
27669
1999
00:29
of the EPFL campus.
8
29668
2666
Vaak kun je ook een gebouw vanuit een nabijgelegen straat bekijken.
00:32
In many cases, you can also see
9
32334
2108
00:34
how a building looks from a nearby street.
10
34442
3740
Wonderbaarlijk.
00:38
This is pretty amazing.
11
38182
1422
00:39
But there's something missing in this wonderful tour:
12
39604
3427
Maar er ontbreekt nog iets aan deze prachtige toer:
00:43
It's time.
13
43031
2188
de tijd.
00:45
i'm not really sure when this picture was taken.
14
45219
3070
Ik weet niet zeker wanneer deze foto is genomen.
00:48
I'm not even sure it was taken
15
48289
1412
Was het op hetzelfde moment als het vogelperspectief?
00:49
at the same moment as the bird's-eye view.
16
49701
6083
We ontwikkelen instrumenten in mijn lab
00:55
In my lab, we develop tools
17
55784
2209
00:57
to travel not only in space
18
57993
1764
zodat we niet alleen in de ruimte, maar ook in de tijd kunnen reizen.
00:59
but also through time.
19
59757
2558
01:02
The kind of question we're asking is
20
62315
1870
De vraag die we ons dan stellen, is:
01:04
Is it possible to build something
21
64185
1393
"Is het mogelijk om een Google Maps van 't verleden te bouwen?
01:05
like Google Maps of the past?
22
65578
2178
01:07
Can I add a slider on top of Google Maps
23
67756
3310
Kan ik een schuifbalk bovenaan Google Maps zetten
01:11
and just change the year,
24
71066
1803
en simpelweg het jaar veranderen,
01:12
seeing how it was 100 years before,
25
72869
1791
om te zien hoe het er 100 jaar of zelfs 1000 jaar geleden uitzag?
01:14
1,000 years before?
26
74660
1669
01:16
Is that possible?
27
76329
2123
Kan dat? Kan ik sociale netwerken van het verleden reconstrueren?
01:18
Can I reconstruct social networks of the past?
28
78452
2252
01:20
Can I make a Facebook of the Middle Ages?
29
80704
3049
Kan ik een Facebook van de middeleeuwen maken?
01:23
So, can I build time machines?
30
83753
3776
Kortom, kan ik tijdmachines bouwen?"
01:27
Maybe we can just say, "No, it's not possible."
31
87529
2565
We kunnen zeggen: "Nee, dat kan niet".
01:30
Or, maybe, we can think of it from an information point of view.
32
90094
3810
We kunnen het ook vanuit een informatieve invalshoek benaderen.
01:33
This is what I call the information mushroom.
33
93904
3190
Ik noem dit de informatiepaddenstoel.
Verticaal staat de tijd,
01:37
Vertically, you have the time.
34
97094
1583
01:38
and horizontally, the amount of digital information available.
35
98677
2740
horizontaal de beschikbaarheid van digitale informatie.
01:41
Obviously, in the last 10 years, we have much information.
36
101417
3482
We hebben natuurlijk veel informatie van de afgelopen 10 jaar.
01:44
And obviously the more we go in the past, the less information we have.
37
104899
3548
Hoe verder we het verleden induiken, hoe minder informatie we hebben.
01:48
If we want to build something like Google Maps of the past,
38
108447
2318
Als we een Google Maps of Facebook van het verleden willen bouwen,
01:50
or Facebook of the past,
39
110765
1494
01:52
we need to enlarge this space,
40
112259
1574
dan moet dit gedeelte groter worden: dit moet een rechthoek worden.
01:53
we need to make that like a rectangle.
41
113833
1938
01:55
How do we do that?
42
115771
1510
Hoe krijgen we dat voor elkaar?
01:57
One way is digitization.
43
117281
2098
Een manier om dat te doen, is digitalisering.
01:59
There's a lot of material available --
44
119395
1779
Er is veel materiaal beschikbaar: kranten, duizenden gedrukte boeken.
02:01
newspaper, printed books, thousands of printed books.
45
121190
6270
Die kan ik digitaliseren. Ik kan er informatie uit halen.
02:07
I can digitize all these.
46
127460
1768
02:09
I can extract information from these.
47
129228
2737
02:11
Of course, the more you go in the past, the less information you will have.
48
131965
3543
Hoe meer je het verleden ingaat, des te minder informatie je hebt.
02:15
So, it might not be enough.
49
135508
2646
Dan heb je wellicht onvoldoende informatie.
02:18
So, I can do what historians do.
50
138154
2408
Ik kan historici nadoen: ik kan extrapoleren.
02:20
I can extrapolate.
51
140562
1524
02:22
This is what we call, in computer science, simulation.
52
142086
4470
Dit noemen we in de computerindustrie 'simulatie.'
02:26
If I take a log book,
53
146556
1751
Een logboek kan ik gaan beschouwen als niet zomaar een logboek
02:28
I can consider, it's not just a log book
54
148307
2404
02:30
of a Venetian captain going to a particular journey.
55
150711
2972
van een Venetiaanse kapitein die een bepaalde reis maakt.
02:33
I can consider it is actually a log book
56
153683
1643
Als ik het beschouw als een logboek
02:35
which is representative of many journeys of that period.
57
155326
2582
dat representatief is voor vele reizen uit die periode,
02:37
I'm extrapolating.
58
157908
2245
dan ben ik aan het extrapoleren.
02:40
If I have a painting of a facade,
59
160153
2038
Een schilderij van een voorgevel
02:42
I can consider it's not just that particular building,
60
162191
2751
beschouw ik niet alleen als dat specifieke bouwsel.
02:44
but probably it also shares the same grammar
61
164942
3932
Het vertoont waarschijnlijk fundamentale overeenkomsten
02:48
of buildings where we lost any information.
62
168874
4041
met bouwsels waarvan we de informatie niet meer hebben.
02:52
So if we want to construct a time machine,
63
172915
2858
We hebben twee dingen nodig voor het bouwen van een tijdmachine:
02:55
we need two things.
64
175773
1339
02:57
We need very large archives,
65
177112
2234
hele grote archieven en uitstekende specialisten.
02:59
and we need excellent specialists.
66
179346
2742
03:02
The Venice Time Machine,
67
182088
1874
De 'Venice Time Machine', het project waar ik het over ga hebben,
03:03
the project I'm going to talk to you about,
68
183962
1805
03:05
is a joint project between the EPFL
69
185767
3020
is een samenwerkingsproject van EPFL
03:08
and the University of Venice Ca'Foscari.
70
188787
2978
en de Universiteit van Venetië, Ca' Foscari.
03:11
There's something very peculiar about Venice,
71
191765
2165
Het uitzonderlijke aan Venetië is dat de administratie
03:13
that its administration has been
72
193930
2674
03:16
very, very bureaucratic.
73
196604
2194
héél bureaucratisch was.
03:18
They've been keeping track of everything,
74
198798
2193
Ze hebben alles bijgehouden, net zoals Google tegenwoordig.
03:20
almost like Google today.
75
200991
2915
Het Rijksarchief van Venetië bevat 80 kilometer aan archieven
03:23
At the Archivio di Stato,
76
203906
1514
03:25
you have 80 kilometers of archives
77
205420
1764
waarin elk aspect vermeld staat
03:27
documenting every aspect
78
207184
2009
van het leven van Venetië over een periode van meer dan 1000 jaar.
03:29
of the life of Venice over more than 1,000 years.
79
209193
2246
03:31
You have every boat that goes out,
80
211439
1920
Elk in- en uitgaande boot.
03:33
every boat that comes in.
81
213359
1076
03:34
You have every change that was made in the city.
82
214435
2797
Elke verandering die er in de stad was aangebracht.
03:37
This is all there.
83
217232
3291
Het staat er allemaal in.
03:40
We are setting up a 10-year digitization program
84
220523
3908
We zijn een 10-jarig digitaliserings- programma aan het opzetten
03:44
which has the objective of transforming
85
224431
1677
om dit immens grote archief om te zetten
03:46
this immense archive
86
226108
1384
03:47
into a giant information system.
87
227492
2426
in een gigantisch informatiesysteem.
03:49
The type of objective we want to reach
88
229918
1857
Het doel dat we willen bereiken
03:51
is 450 books a day that can be digitized.
89
231775
4726
is het digitaliseren van 450 boeken per dag.
03:56
Of course, when you digitize, that's not enough,
90
236501
2247
Als je dat doet, dan is dat niet voldoende,
03:58
because these documents,
91
238748
1287
want deze documenten
04:00
most of them are in Latin, in Tuscan,
92
240035
2639
zijn vaak in het Latijn, het Toscaanse of het Venetiaanse dialect geschreven.
04:02
in Venetian dialect,
93
242689
1515
04:04
so you need to transcribe them,
94
244204
1675
Je moet ze eerst transcriberen en soms vertalen
04:05
to translate them in some cases,
95
245879
1681
04:07
to index them,
96
247560
1120
om ze te kunnen indexeren. Dit is geen makkelijke taak.
04:08
and this is obviously not easy.
97
248680
2164
04:10
In particular, traditional optical character recognition method
98
250844
3844
De traditionele optische tekenherkenningmethode (OCR),
die toegepast kan worden op geprinte manuscripten,
04:14
that can be used for printed manuscripts,
99
254688
1424
04:16
they do not work well on the handwritten document.
100
256112
4004
werkt niet goed met handgeschreven documenten.
04:20
So the solution is actually to take inspiration
101
260116
2130
De oplossing is geïnspireerd door een ander domein: spraakherkenning.
04:22
from another domain: speech recognition.
102
262246
2901
Het lijkt onmogelijk,
04:25
This is a domain of something that seems impossible,
103
265147
2055
04:27
which can actually be done,
104
267202
2537
maar het kan wel degelijk gedaan worden,
04:29
simply by putting additional constraints.
105
269739
2194
door er simpelweg extra beperkingen op te leggen.
04:31
If you have a very good model
106
271933
1586
Als je een heel goed model hebt van een gebruikte taal
04:33
of a language which is used,
107
273519
1526
04:35
if you have a very good model of a document,
108
275045
2086
en een goed model van een document dat goed gestructureerd is,
04:37
how well they are structured.
109
277131
1432
04:38
And these are administrative documents.
110
278563
1353
-- en vele van deze administratieve documenten zijn dat --
04:39
They are well structured in many cases.
111
279931
2132
04:42
If you divide this huge archive into smaller subsets
112
282063
3308
en als je dit enorme archief in kleinere subsets opdeelt,
04:45
where a smaller subset actually shares similar features,
113
285371
2877
waarbij de kleinere dezelfde gelijkende kenmerken delen,
04:48
then there's a chance of success.
114
288248
4031
dan is er een kans dat het zal werken.
04:54
If we reach that stage, then there's something else:
115
294761
2435
Als dat lukt, kunnen we een stap verder gaan.
We kunnen ook gebeurtenissen uit dit document halen.
04:57
we can extract from this document events.
116
297196
3522
05:00
Actually probably 10 billion events
117
300718
2298
Er kunnen vast 10 miljard gebeurtenissen
05:03
can be extracted from this archive.
118
303016
1931
uit dit archief worden gehaald.
05:04
And this giant information system
119
304947
1724
Dit enorme informatiesysteem kan op vele manieren worden doorzocht.
05:06
can be searched in many ways.
120
306671
1816
05:08
You can ask questions like,
121
308487
1368
Je kunt vragen:
05:09
"Who lived in this palazzo in 1323?"
122
309855
2760
"Wie leefde er in 1323 in dit gebouw?
05:12
"How much cost a sea bream at the Realto market
123
312615
2222
Hoeveel kostte een zeebrasem op de Rialtomarkt in 1434 ?
05:14
in 1434?"
124
314837
1724
05:16
"What was the salary
125
316561
1460
Wat verdiende een glasmaker in Murano,
05:18
of a glass maker in Murano
126
318021
2045
over een periode van tien jaar?"
05:20
maybe over a decade?"
127
320066
1406
05:21
You can ask even bigger questions
128
321472
1422
Je kunt grotere vragen stellen. Alles is semantisch gecodeerd.
05:22
because it will be semantically coded.
129
322894
2738
05:25
And then what you can do is put that in space,
130
325632
2140
Dan kan je dat localiseren, want dit soort informatie
05:27
because much of this information is spatial.
131
327772
2173
is vaak ruimtelijke informatie,
05:29
And from that, you can do things like
132
329945
1935
Dan kan je de buitengewone reis reconstrueren
05:31
reconstructing this extraordinary journey
133
331880
2113
05:33
of that city that managed to have a sustainable development
134
333993
3356
van een stad die voortdurend groeit
05:37
over a thousand years,
135
337349
2126
gedurende een periode van 1000 jaar,
05:39
managing to have all the time
136
339475
1620
die het evenwicht met haar omgeving weet te behouden.
05:41
a form of equilibrium with its environment.
137
341095
2861
05:43
You can reconstruct that journey,
138
343956
1248
Je kunt zo'n reis reconstrueren
05:45
visualize it in many different ways.
139
345204
2896
en ze op verschillende manieren uitdrukken.
Je leert Venetië niet kennen door enkel naar de stad te kijken.
05:48
But of course, you cannot understand Venice if you just look at the city.
140
348100
2699
05:50
You have to put it in a larger European context.
141
350799
2396
Plaats het in een grotere Europese context.
05:53
So the idea is also to document all the things
142
353195
2821
Het idee is om alle dingen te documenteren
05:56
that worked at the European level.
143
356016
2423
die op Europees niveau liggen.
05:58
We can reconstruct also the journey
144
358439
1964
We kunnen de reis van het Venetiaanse maritieme imperium namaken
06:00
of the Venetian maritime empire,
145
360403
1990
06:02
how it progressively controlled the Adriatic Sea,
146
362393
3166
en laten zien hoe het stap voor stap de Adriatische Zee veroverde,
06:05
how it became the most powerful medieval empire
147
365559
3746
hoe het het machtigste middeleeuwse imperium van zijn tijd werd
06:09
of its time,
148
369305
1561
06:10
controlling most of the sea routes
149
370866
2172
en van Oost tot Zuid controle had over de meeste zeeroutes.
06:13
from the east to the south.
150
373038
2933
06:17
But you can even do other things,
151
377305
2316
Je kunt er ook andere dingen mee doen,
06:19
because in these maritime routes,
152
379621
2277
want bij deze zeeroutes zijn er regelmatige patronen.
06:21
there are regular patterns.
153
381898
1975
06:23
You can go one step beyond
154
383889
2493
Je kunt een stapje verdergaan en zelfs een mediterrane simulator creëren
06:26
and actually create a simulation system,
155
386382
2120
06:28
create a Mediterranean simulator
156
388502
2815
06:31
which is capable actually of reconstructing
157
391317
2593
die in staat is om de ontbrekende informatie te reconstrueren
06:33
even the information we are missing,
158
393910
2202
06:36
which would enable us to have questions you could ask
159
396112
2988
zodat we vragen kunnen stellen, zoals bij een routeplanner:
06:39
like if you were using a route planner.
160
399100
2988
06:42
"If I am in Corfu in June 1323
161
402088
3071
"Als ik in juni 1323 in Corfu ben en naar Constantinopel wil gaan,
06:45
and want to go to Constantinople,
162
405159
2526
06:47
where can I take a boat?"
163
407685
2143
waar kan ik dan de boot nemen?"
06:49
Probably we can answer this question
164
409828
1367
Wij kunnen die vraag beantwoorden met een foutenmarge van 1 tot 3 dagen.
06:51
with one or two or three days' precision.
165
411195
4473
06:55
"How much will it cost?"
166
415668
1607
"Hoeveel gaat het kosten?
06:57
"What are the chance of encountering pirates?"
167
417275
3592
Wat is de kans dat ik piraten tegen zal komen?"
07:00
Of course, you understand,
168
420867
1811
De grootste wetenschappelijke uitdaging voor dit soort van project
07:02
the central scientific challenge of a project like this one
169
422678
2609
07:05
is qualifying, quantifying and representing
170
425287
3729
is het kwalificeren, kwantificeren en voorstellen van onzekerheid
en inconsistentie bij elke stap van het proces.
07:09
uncertainty and inconsistency at each step of this process.
171
429016
3330
07:12
There are errors everywhere,
172
432346
2712
Je komt overal fouten tegen:
07:15
errors in the document, it's the wrong name of the captain,
173
435058
2489
de verkeerde naam van een kapitein,
07:17
some of the boats never actually took to sea.
174
437547
3213
sommige boten zijn nooit de zee op gegaan.
07:20
There are errors in translation, interpretative biases,
175
440760
4857
Er zijn vertaalfouten en er is sprake van interpretatieve vooringenomenheid.
07:25
and on top of that, if you add algorithmic processes,
176
445624
3466
Bovendien krijg je, als je algoritmische processen toevoegt,
07:29
you're going to have errors in recognition,
177
449090
2949
ook nog eens herkenningsfouten of extractiefouten,
07:32
errors in extraction,
178
452039
1961
07:34
so you have very, very uncertain data.
179
454000
4481
dus je hebt zéér onbetrouwbare data.
07:38
So how can we detect and correct these inconsistencies?
180
458481
3757
Hoe kunnen we deze inconsistenties opsporen en corrigeren?
07:42
How can we represent that form of uncertainty?
181
462238
3660
Hoe kunnen we deze vorm van onbetrouwbaarheid aanpakken?
07:45
It's difficult. One thing you can do
182
465898
2097
Het is lastig. Eén ding dat je kunt doen,
07:47
is document each step of the process,
183
467995
2226
is elke stap van het proces documenteren.
07:50
not only coding the historical information
184
470221
2448
Kijk niet alleen naar de historische informatie,
07:52
but what we call the meta-historical information,
185
472669
2679
maar naar de zogeheten meta-historische informatie,
07:55
how is historical knowledge constructed,
186
475348
2663
van hoe historische kennis is opgebouwd,
07:58
documenting each step.
187
478011
1998
en documenteer elke stap.
Dat betekent niet dat we uiteindelijk
08:00
That will not guarantee that we actually converge
188
480009
1645
08:01
toward a single story of Venice,
189
481654
2450
één verhaal over Venetië zullen hebben.
08:04
but probably we can actually reconstruct
190
484104
2138
We kunnen wel een onderbouwde mogelijke geschiedenis van Venetië reconstrueren.
08:06
a fully documented potential story of Venice.
191
486242
3048
Misschien heb je niet één plattegrond,
08:09
Maybe there's not a single map.
192
489290
1459
08:10
Maybe there are several maps.
193
490749
2120
maar zijn er wel meerdere.
08:12
The system should allow for that,
194
492869
2216
Het systeem moet dat mogelijk maken.
08:15
because we have to deal with a new form of uncertainty,
195
495085
2859
We moeten leren omgaan met een nieuwe soort van onbetrouwbaarheid.
08:17
which is really new for this type of giant databases.
196
497944
4641
Dit is nieuw voor dit soort enorme databanken.
08:22
And how should we communicate
197
502585
2190
Hoe moeten we dit nieuwe onderzoek delen met het grote publiek?
08:24
this new research to a large audience?
198
504790
3979
08:28
Again, Venice is extraordinary for that.
199
508769
2663
Wederom, Venetië leent zich daar buitengewoon goed voor.
08:31
With the millions of visitors that come every year,
200
511432
2171
Er komen elk jaar miljoenen bezoekers.
08:33
it's actually one of the best places
201
513603
1763
Het is één van de beste plaatsen
08:35
to try to invent the museum of the future.
202
515366
2988
om er het museum van de toekomst te ontwikkelen.
08:38
Imagine, horizontally you see the reconstructed map
203
518354
3304
Horizontaal zie je de gereconstrueerde kaart van een bepaald jaar
08:41
of a given year,
204
521658
1286
08:42
and vertically, you see the document
205
522944
2958
en verticaal het document dat de reconstructie gebruikte,
08:45
that served the reconstruction,
206
525902
1511
08:47
paintings, for instance.
207
527413
3400
schilderijen, bijvoorbeeld.
08:50
Imagine an immersive system that permits
208
530813
2580
Beeld je een systeem in waar je helemaal in opgaat en dat je toegang verleent
08:53
to go and dive and reconstruct the Venice of a given year,
209
533393
3502
tot het Venetië van een bepaald jaar,
08:56
some experience you could share within a group.
210
536895
2715
waarbij je je ervaringen met een groep kunt delen.
08:59
On the contrary, imagine actually that you start
211
539610
2246
Of stel je eens voor dat je begint
09:01
from a document, a Venetian manuscript,
212
541856
2207
met een document, een Venetiaans manuscript,
09:04
and you show, actually, what you can construct out of it,
213
544063
3049
en dat je laat zien wat je daaruit kunt halen,
hoe het is ontcijferd wordt
09:07
how it is decoded,
214
547112
1772
09:08
how the context of that document can be recreated.
215
548884
2415
en hoe zijn context nagebootst kan worden.
09:11
This is an image from an exhibit
216
551299
1885
Dit is een afbeelding van een tentoonstelling
09:13
which is currently conducted in Geneva
217
553184
2276
die momenteel in Genève wordt gehouden,
09:15
with that type of system.
218
555460
2354
en die ook zo'n systeem heeft.
09:17
So to conclude, we can say that
219
557814
2175
Kortom, onderzoek op het gebied van geesteswetenschappen staat op het punt
09:19
research in the humanities is about to undergo
220
559989
3079
om een evolutie te ondergaan die misschien vergelijkbaar is
09:23
an evolution which is maybe similar
221
563068
1802
09:24
to what happened to life sciences 30 years ago.
222
564870
4582
met wat er 30 jaar terug is gebeurd met de levenswetenschappen.
09:29
It's really a question of scale.
223
569452
4676
Het is eigenlijk een kwestie van schaal.
09:34
We see projects which are
224
574130
3303
We zien projecten die niet uitgevoerd kunnen worden
09:37
much beyond any single research team can do,
225
577433
3843
door slechts één onderzoeksteam.
Dit is een nieuwe ontwikkeling voor de geesteswetenschappen.
09:41
and this is really new for the humanities,
226
581276
2243
09:43
which very often take the habit of working
227
583519
3869
Die zijn vaak gewend om
in klein groepsverband of met een paar onderzoekers te werken.
09:47
in small groups or only with a couple of researchers.
228
587388
4008
09:51
When you visit the Archivio di Stato,
229
591396
2118
Als je het Rijksarchief bezoekt,
09:53
you feel this is beyond what any single team can do,
230
593514
2822
weet je dat dit te groot is voor eender welk onderzoeksteam
09:56
and that should be a joint and common effort.
231
596336
3834
Er moet een gezamenlijke inspanning worden geleverd.
10:00
So what we must do for this paradigm shift
232
600170
3106
Voor deze paradigmaverschuiving moeten we eigenlijk een nieuwe generatie
10:03
is actually foster a new generation
233
603276
1902
van 'digitale humanisten' opleiden die klaar zijn voor deze verschuiving.
10:05
of "digital humanists"
234
605178
1537
10:06
that are going to be ready for this shift.
235
606715
2090
10:08
I thank you very much.
236
608805
1959
Ik dank jullie zeer.
10:10
(Applause)
237
610764
4000
(Applaus)
(Applaus)
Over deze website

Deze site laat u kennismaken met YouTube-video's die nuttig zijn om Engels te leren. U ziet Engelse lessen gegeven door topdocenten uit de hele wereld. Dubbelklik op de Engelse ondertitels op elke videopagina om de video af te spelen. De ondertitels scrollen synchroon met het afspelen van de video. Heeft u opmerkingen of verzoeken, neem dan contact met ons op via dit contactformulier.

https://forms.gle/WvT1wiN1qDtmnspy7