Frederic Kaplan: How I built an information time machine

78,570 views ・ 2014-01-09

TED


Por favor, faça duplo clique nas legendas em inglês abaixo para reproduzir o vídeo.

Tradutor: Nelson Peixoto Revisora: Isabel Vaz Belchior
00:12
This is an image of the planet Earth.
0
12285
2893
Esta é uma imagem do planeta Terra.
00:15
It looks very much like the Apollo pictures
1
15178
3093
É muito semelhante às fotografias da Apollo,
00:18
that are very well known.
2
18271
1611
que são muito conhecidas.
00:19
There is something different;
3
19882
2070
Há algo diferente;
00:21
you can click on it,
4
21952
1447
podemos clicar na fotografia,
00:23
and if you click on it,
5
23399
1198
e se clicarmos nela
00:24
you can zoom in on almost any place on the Earth.
6
24597
3072
podemos ampliar, praticamente, qualquer lugar na Terra.
00:27
For instance, this is a bird's-eye view
7
27669
1999
Por exemplo, isto é uma visão aérea panorâmica
00:29
of the EPFL campus.
8
29668
2666
do campus da EPFL.
00:32
In many cases, you can also see
9
32334
2108
Na maioria dos casos, também podemos ver
00:34
how a building looks from a nearby street.
10
34442
3740
como um edifício é visto a partir de uma rua adjacente.
00:38
This is pretty amazing.
11
38182
1422
Isto é impressionante.
00:39
But there's something missing in this wonderful tour:
12
39604
3427
Mas há algo que falta nesta visita maravilhosa.
00:43
It's time.
13
43031
2188
O tempo.
00:45
i'm not really sure when this picture was taken.
14
45219
3070
Eu não tenho a certeza de quando esta fotografia foi tirada.
00:48
I'm not even sure it was taken
15
48289
1412
Nem sequer tenho a certeza de que foi tirada
00:49
at the same moment as the bird's-eye view.
16
49701
6083
na mesma altura em que a fotografia aérea foi tirada.
00:55
In my lab, we develop tools
17
55784
2209
No meu laboratório desenvolvemos ferramentas
00:57
to travel not only in space
18
57993
1764
para viajar, não só no espaço,
00:59
but also through time.
19
59757
2558
mas também no tempo.
01:02
The kind of question we're asking is
20
62315
1870
O tipo de perguntas que estamos a formular é:
01:04
Is it possible to build something
21
64185
1393
"É possível construir algo
01:05
like Google Maps of the past?
22
65578
2178
"como um Google Maps do passado?"
01:07
Can I add a slider on top of Google Maps
23
67756
3310
"Conseguirei eu adicionar um diapositivo ao Google Maps
01:11
and just change the year,
24
71066
1803
"e ajustar o ano
01:12
seeing how it was 100 years before,
25
72869
1791
"e ver como como era 100 anos antes,
01:14
1,000 years before?
26
74660
1669
"1000 anos antes?"
01:16
Is that possible?
27
76329
2123
"Isso é possível?"
01:18
Can I reconstruct social networks of the past?
28
78452
2252
"Conseguirei eu reconstruir redes sociais do passado?"
01:20
Can I make a Facebook of the Middle Ages?
29
80704
3049
"Conseguirei eu criar um Facebook da Idade Média?"
01:23
So, can I build time machines?
30
83753
3776
"Conseguirei eu construir máquinas do Tempo?"
01:27
Maybe we can just say, "No, it's not possible."
31
87529
2565
Talvez possamos simplesmente dizer: "Não, não é possível."
01:30
Or, maybe, we can think of it from an information point of view.
32
90094
3810
Ou talvez possamos pensar nisso sob uma perspectiva de informação.
01:33
This is what I call the information mushroom.
33
93904
3190
Isto é o que eu chamo de cogumelo da informação.
01:37
Vertically, you have the time.
34
97094
1583
Na vertical, tem o tempo.
01:38
and horizontally, the amount of digital information available.
35
98677
2740
Na horizontal, a quantidade de informação digital disponível.
01:41
Obviously, in the last 10 years, we have much information.
36
101417
3482
Obviamente, nos últimos 10 anos temos muita informação disponível.
01:44
And obviously the more we go in the past, the less information we have.
37
104899
3548
E obviamente, quanto mais regredimos no passado, menos informação temos.
01:48
If we want to build something like Google Maps of the past,
38
108447
2318
Se queremos construir algo como o Gogle Maps do passado,
01:50
or Facebook of the past,
39
110765
1494
ou o Facebook do passado,
01:52
we need to enlarge this space,
40
112259
1574
precisamos de alargar este espaço,
01:53
we need to make that like a rectangle.
41
113833
1938
precisamos de tornar isto num rectângulo.
01:55
How do we do that?
42
115771
1510
Como fazemos isso?
01:57
One way is digitization.
43
117281
2098
Uma maneira é através da digitalização.
01:59
There's a lot of material available --
44
119395
1779
Há montes de material disponível
02:01
newspaper, printed books, thousands of printed books.
45
121190
6270
— jornais, livros impressos, milhares de livros impressos.
02:07
I can digitize all these.
46
127460
1768
Posso digitalizá-los todos.
02:09
I can extract information from these.
47
129228
2737
Posso extrair informação de todos.
02:11
Of course, the more you go in the past, the less information you will have.
48
131965
3543
É claro, quanto mais regredimos no passado, menos informação vamos ter.
02:15
So, it might not be enough.
49
135508
2646
Mas pode não ser suficiente.
02:18
So, I can do what historians do.
50
138154
2408
Então, posso fazer o que os historiadores fazem.
02:20
I can extrapolate.
51
140562
1524
Posso extrapolar.
02:22
This is what we call, in computer science, simulation.
52
142086
4470
Isto é o que nós chamamos, em ciências de computação, simulação.
02:26
If I take a log book,
53
146556
1751
Se eu pegar num diário de bordo,
02:28
I can consider, it's not just a log book
54
148307
2404
posso considerar que não é apenas um diário de bordo
02:30
of a Venetian captain going to a particular journey.
55
150711
2972
de um capitão veneziano numa viagem específica.
02:33
I can consider it is actually a log book
56
153683
1643
Posso considerar que é, na realidade, um diário de bordo
02:35
which is representative of many journeys of that period.
57
155326
2582
que representa muitas viagens daquele período.
02:37
I'm extrapolating.
58
157908
2245
Estou a extrapolar.
02:40
If I have a painting of a facade,
59
160153
2038
Se eu tenho um quadro de uma fachada,
02:42
I can consider it's not just that particular building,
60
162191
2751
Posso considerar que não é apenas desse edifício em particular,
02:44
but probably it also shares the same grammar
61
164942
3932
mas que provavelmente partilha da mesma gramática da forma
02:48
of buildings where we lost any information.
62
168874
4041
dos edifícios de que perdemos informação.
02:52
So if we want to construct a time machine,
63
172915
2858
Por isso, se queremos construir uma máquina do tempo,
02:55
we need two things.
64
175773
1339
precisamos de duas coisas.
02:57
We need very large archives,
65
177112
2234
Precisamos de arquivos enormes
02:59
and we need excellent specialists.
66
179346
2742
e precisamos de especialistas excelentes.
03:02
The Venice Time Machine,
67
182088
1874
A Máquina do Tempo de Veneza,
03:03
the project I'm going to talk to you about,
68
183962
1805
o projecto sobre o qual vos vou falar,
03:05
is a joint project between the EPFL
69
185767
3020
é um projecto em parceria entre a EPFL
03:08
and the University of Venice Ca'Foscari.
70
188787
2978
e a Universidade de Veneza Ca'Foscari
03:11
There's something very peculiar about Venice,
71
191765
2165
Há algo de muito peculiar sobre Veneza
03:13
that its administration has been
72
193930
2674
é que a sua administração tem sido
03:16
very, very bureaucratic.
73
196604
2194
muito, muito burocrática.
03:18
They've been keeping track of everything,
74
198798
2193
Eles têm mantido registos de tudo,
03:20
almost like Google today.
75
200991
2915
quase como o Google hoje em dia.
03:23
At the Archivio di Stato,
76
203906
1514
No Arquivo do Estado (Archivio di Stato)
03:25
you have 80 kilometers of archives
77
205420
1764
há 80 kilómetros de arquivos
03:27
documenting every aspect
78
207184
2009
a documentar todos os aspectos
03:29
of the life of Venice over more than 1,000 years.
79
209193
2246
da vida de Veneza por mais de 1000 anos.
03:31
You have every boat that goes out,
80
211439
1920
Está lá cada barco que saiu,
03:33
every boat that comes in.
81
213359
1076
cada barco que entrou.
03:34
You have every change that was made in the city.
82
214435
2797
Estão lá todas as alterações que foram feitas na cidade.
03:37
This is all there.
83
217232
3291
Está tudo lá.
03:40
We are setting up a 10-year digitization program
84
220523
3908
Estamos a preparar um plano de digitalização de 10 anos
03:44
which has the objective of transforming
85
224431
1677
que tem o objectivo de transformar
03:46
this immense archive
86
226108
1384
este arquivo imenso
03:47
into a giant information system.
87
227492
2426
num sistema de informação gigante.
03:49
The type of objective we want to reach
88
229918
1857
O tipo de objectivo que queremos alcançar
03:51
is 450 books a day that can be digitized.
89
231775
4726
é que sejam digitalizados 450 livros por dia.
03:56
Of course, when you digitize, that's not enough,
90
236501
2247
É claro que quando digitalizamos, isso não é suficiente.
03:58
because these documents,
91
238748
1287
porque estes documentos,
04:00
most of them are in Latin, in Tuscan,
92
240035
2639
a maioria deles estão em latim, toscano,
04:02
in Venetian dialect,
93
242689
1515
num dialecto veneziano
04:04
so you need to transcribe them,
94
244204
1675
e é preciso transcrevê-los,
04:05
to translate them in some cases,
95
245879
1681
traduzi-los, e em alguns casos,
04:07
to index them,
96
247560
1120
indexá-los
04:08
and this is obviously not easy.
97
248680
2164
e isto, obviamente, não é fácil.
04:10
In particular, traditional optical character recognition method
98
250844
3844
Especificamente, o método de reconhecimento óptico de carácteres
04:14
that can be used for printed manuscripts,
99
254688
1424
que pode ser aplicado a manuscritos impressos,
04:16
they do not work well on the handwritten document.
100
256112
4004
não funciona bem com documentos escritos à mão.
04:20
So the solution is actually to take inspiration
101
260116
2130
Por isso, a solução é ir buscar inspiração
04:22
from another domain: speech recognition.
102
262246
2901
a outro domínio: reconhecimento de voz.
04:25
This is a domain of something that seems impossible,
103
265147
2055
Isto é um domínio de algo que parece impossível,
04:27
which can actually be done,
104
267202
2537
que na realidade pode ser feito
04:29
simply by putting additional constraints.
105
269739
2194
simplesmente, acrescentando algumas restrições.
04:31
If you have a very good model
106
271933
1586
Se tiverem um modelo muito bom
04:33
of a language which is used,
107
273519
1526
de uma linguagem que é usada,
04:35
if you have a very good model of a document,
108
275045
2086
se tiverem um modelo muito bom de um documento,
04:37
how well they are structured.
109
277131
1432
de quão bem eles estão estruturados.
04:38
And these are administrative documents.
110
278563
1353
E estes são documentos administrativos.
04:39
They are well structured in many cases.
111
279931
2132
Em muitos casos eles estão bem estruturados.
04:42
If you divide this huge archive into smaller subsets
112
282063
3308
Se dividirmos este arquivo enorme em sub-conjuntos mais pequenos,
04:45
where a smaller subset actually shares similar features,
113
285371
2877
onde cada sub-conjunto partilha características similares,
04:48
then there's a chance of success.
114
288248
4031
então temos hipótese de sermos bem sucedidos.
04:54
If we reach that stage, then there's something else:
115
294761
2435
Se alcançarmos esse estado, depois, há mais outra coisa:
04:57
we can extract from this document events.
116
297196
3522
Conseguimos extrair eventos destes documentos.
05:00
Actually probably 10 billion events
117
300718
2298
Provavelmente, 10 biliões de eventos
05:03
can be extracted from this archive.
118
303016
1931
podem ser extraídos deste arquivo.
05:04
And this giant information system
119
304947
1724
E este sistema de informação gigante
05:06
can be searched in many ways.
120
306671
1816
pode ser pesquisado de muitas formas
05:08
You can ask questions like,
121
308487
1368
Se fizermos uma pergunta como:
05:09
"Who lived in this palazzo in 1323?"
122
309855
2760
"Quem viveu neste palazzo em 1323?"
05:12
"How much cost a sea bream at the Realto market
123
312615
2222
"Quanto custava um pargo no mercado Realto
05:14
in 1434?"
124
314837
1724
"em 1434?"
05:16
"What was the salary
125
316561
1460
"Qual era o salário
05:18
of a glass maker in Murano
126
318021
2045
"de um vidreiro em Murano
05:20
maybe over a decade?"
127
320066
1406
"ao longo de uma década?"
05:21
You can ask even bigger questions
128
321472
1422
Podemos fazer perguntas ainda maiores
05:22
because it will be semantically coded.
129
322894
2738
porque está codificado semanticamente.
05:25
And then what you can do is put that in space,
130
325632
2140
E depois, o que podemos fazer é colocar isso em termos de espaço,
05:27
because much of this information is spatial.
131
327772
2173
porque muita desta informação é espacial.
05:29
And from that, you can do things like
132
329945
1935
E, a partir daí, podemos fazer coisas como
05:31
reconstructing this extraordinary journey
133
331880
2113
reconstruir a viagem extraordinária
05:33
of that city that managed to have a sustainable development
134
333993
3356
desta cidade que conseguiu ter um desenvolvimento sustentável
05:37
over a thousand years,
135
337349
2126
ao longo de mil anos,
05:39
managing to have all the time
136
339475
1620
conseguindo sempre
05:41
a form of equilibrium with its environment.
137
341095
2861
um equilíbrio com o seu meio ambiente.
05:43
You can reconstruct that journey,
138
343956
1248
Podemos reconstruir essa viagem,
05:45
visualize it in many different ways.
139
345204
2896
visualizá-la de muitas formas diferentes.
05:48
But of course, you cannot understand Venice if you just look at the city.
140
348100
2699
Mas claro, não conseguimos compreender Veneza só por olharmos para a cidade.
05:50
You have to put it in a larger European context.
141
350799
2396
Temos que a colocar num contexto europeu mais amplo.
05:53
So the idea is also to document all the things
142
353195
2821
Por isso, a ideia é também documentar todas as coisas
05:56
that worked at the European level.
143
356016
2423
que funcionavam a um nível europeu.
05:58
We can reconstruct also the journey
144
358439
1964
Também conseguimos reconstruir a viagem
06:00
of the Venetian maritime empire,
145
360403
1990
do império marítimo veneziano,
06:02
how it progressively controlled the Adriatic Sea,
146
362393
3166
como controlou o Mar Adriático progressivamente,
06:05
how it became the most powerful medieval empire
147
365559
3746
como se tornou o império medieval mais poderoso
06:09
of its time,
148
369305
1561
do seu tempo,
06:10
controlling most of the sea routes
149
370866
2172
controlando a maior parte das rotas marítimas
06:13
from the east to the south.
150
373038
2933
de leste até sul.
06:17
But you can even do other things,
151
377305
2316
Mas podemos fazer ainda outras coisas,
06:19
because in these maritime routes,
152
379621
2277
porque nestas rotas marítimas,
06:21
there are regular patterns.
153
381898
1975
existem padrões regulares.
06:23
You can go one step beyond
154
383889
2493
Podemos ir um passo mais além
06:26
and actually create a simulation system,
155
386382
2120
e criar um sistema de simulação,
06:28
create a Mediterranean simulator
156
388502
2815
criar um simulador mediterrânico
06:31
which is capable actually of reconstructing
157
391317
2593
que seja capaz de reconstruir
06:33
even the information we are missing,
158
393910
2202
mesmo a informação que nos falta,
06:36
which would enable us to have questions you could ask
159
396112
2988
que nos possibilite fazer perguntas
06:39
like if you were using a route planner.
160
399100
2988
como se estivéssemos a utilizar um planeador de percursos.
06:42
"If I am in Corfu in June 1323
161
402088
3071
"Se eu estou em Corfu em Junho de 1323
06:45
and want to go to Constantinople,
162
405159
2526
"e quiser ir para Constantinopla,
06:47
where can I take a boat?"
163
407685
2143
"onde posso apanhar um barco?"
06:49
Probably we can answer this question
164
409828
1367
Provavelmente, podemos responder a esta questão
06:51
with one or two or three days' precision.
165
411195
4473
com um ou dois ou três dias de precisão.
06:55
"How much will it cost?"
166
415668
1607
"Quanto custará?"
06:57
"What are the chance of encountering pirates?"
167
417275
3592
"Quais são as hipóteses de encontrar piratas?"
07:00
Of course, you understand,
168
420867
1811
É claro, compreendemos
07:02
the central scientific challenge of a project like this one
169
422678
2609
que o principal desafio científico de um projecto como este
07:05
is qualifying, quantifying and representing
170
425287
3729
é qualificar, quantificar e representar
07:09
uncertainty and inconsistency at each step of this process.
171
429016
3330
a incerteza e inconsistência a cada passo deste processo.
07:12
There are errors everywhere,
172
432346
2712
Há erros em todo o lado,
07:15
errors in the document, it's the wrong name of the captain,
173
435058
2489
erros nos documentos, é o nome errado do capitão,
07:17
some of the boats never actually took to sea.
174
437547
3213
alguns barcos nunca chegaram a zarpar.
07:20
There are errors in translation, interpretative biases,
175
440760
4857
Há erros na tradução, interpretações parciais,
07:25
and on top of that, if you add algorithmic processes,
176
445624
3466
e em cima de tudo isso, se adicionarmos os processos algorítmicos,
07:29
you're going to have errors in recognition,
177
449090
2949
vamos ter erros no reconhecimento,
07:32
errors in extraction,
178
452039
1961
erros na extracção,
07:34
so you have very, very uncertain data.
179
454000
4481
por isso temos informação muito, muito incerta.
07:38
So how can we detect and correct these inconsistencies?
180
458481
3757
Então como podemos detectar e corrigir estas inconsistências?
07:42
How can we represent that form of uncertainty?
181
462238
3660
Como podemos representar essa forma de incerteza?
07:45
It's difficult. One thing you can do
182
465898
2097
É difícil. Uma coisa que podemos fazer
07:47
is document each step of the process,
183
467995
2226
é documentar cada etapa do processo,
07:50
not only coding the historical information
184
470221
2448
não só codificando a informação histórica
07:52
but what we call the meta-historical information,
185
472669
2679
mas também o que chamamos de meta-informação histórica,
07:55
how is historical knowledge constructed,
186
475348
2663
como o conhecimento histórico é construído,
07:58
documenting each step.
187
478011
1998
documentando cada etapa.
08:00
That will not guarantee that we actually converge
188
480009
1645
Isto não garante que vamos convergir
08:01
toward a single story of Venice,
189
481654
2450
para uma única história de Veneza,
08:04
but probably we can actually reconstruct
190
484104
2138
mas, provavelmente, podemos reconstruir
08:06
a fully documented potential story of Venice.
191
486242
3048
uma potencial história de Veneza totalmente documentada.
08:09
Maybe there's not a single map.
192
489290
1459
Talvez não haja um único mapa.
08:10
Maybe there are several maps.
193
490749
2120
Talvez haja vários mapas.
08:12
The system should allow for that,
194
492869
2216
O sistema deve permitir isso,
08:15
because we have to deal with a new form of uncertainty,
195
495085
2859
porque temos de lidar com uma nova forma de incerteza,
08:17
which is really new for this type of giant databases.
196
497944
4641
que é mesmo nova para este tipo de base de dados gigantes.
08:22
And how should we communicate
197
502585
2190
E como deveremos comunicar
08:24
this new research to a large audience?
198
504790
3979
esta nova pesquisa a uma vasta audiência?
08:28
Again, Venice is extraordinary for that.
199
508769
2663
Novamente, Veneza é extraordinária para isso.
08:31
With the millions of visitors that come every year,
200
511432
2171
Como os milhões de visitantes que a visitam todos os anos,
08:33
it's actually one of the best places
201
513603
1763
é na realidade, um dos melhores lugares
08:35
to try to invent the museum of the future.
202
515366
2988
para tentar inventar o museu do futuro.
08:38
Imagine, horizontally you see the reconstructed map
203
518354
3304
Imaginem, horizontalmente, vemos o mapa reconstruido
08:41
of a given year,
204
521658
1286
de um certo ano,
08:42
and vertically, you see the document
205
522944
2958
e verticalmente, vemos o documento
08:45
that served the reconstruction,
206
525902
1511
que serviu de base para a reconstrução,
08:47
paintings, for instance.
207
527413
3400
quadros, por exemplo.
08:50
Imagine an immersive system that permits
208
530813
2580
Imaginem um sistema imersivo que permita
08:53
to go and dive and reconstruct the Venice of a given year,
209
533393
3502
ir e imergir e reconstruir a Veneza de um certo ano,
08:56
some experience you could share within a group.
210
536895
2715
é uma experiência que podemos partilhar em grupo.
08:59
On the contrary, imagine actually that you start
211
539610
2246
Pelo contrário, imaginem que, na realidade, começamos
09:01
from a document, a Venetian manuscript,
212
541856
2207
com um documento, um manuscrito veneziano,
09:04
and you show, actually, what you can construct out of it,
213
544063
3049
e que vocês mostram o que pode ser reconstruído a partir dele,
09:07
how it is decoded,
214
547112
1772
como é descodificado,
09:08
how the context of that document can be recreated.
215
548884
2415
como o contexto desse documento pode ser recriado.
09:11
This is an image from an exhibit
216
551299
1885
Esta é uma imagem de uma exposição
09:13
which is currently conducted in Geneva
217
553184
2276
que é actualmente feita em Geneva
09:15
with that type of system.
218
555460
2354
com este tipo de sistema.
09:17
So to conclude, we can say that
219
557814
2175
Para concluir, podemos dizer que
09:19
research in the humanities is about to undergo
220
559989
3079
a pesquisa nas humanidades está prestes a submeter-se
09:23
an evolution which is maybe similar
221
563068
1802
a uma evolução que, na realidade, é semelhante
09:24
to what happened to life sciences 30 years ago.
222
564870
4582
ao que aconteceu às ciências da vida há cerca de 30 anos atrás.
09:29
It's really a question of scale.
223
569452
4676
É mesmo uma questão de escala.
09:34
We see projects which are
224
574130
3303
Vemos projectos que estão
09:37
much beyond any single research team can do,
225
577433
3843
muito além do que uma equipa de investigação pode fazer
09:41
and this is really new for the humanities,
226
581276
2243
e isto é realmente novo para as humanidades,
09:43
which very often take the habit of working
227
583519
3869
que muitas vezes adquirem o hábito de trabalhar
09:47
in small groups or only with a couple of researchers.
228
587388
4008
em pequenos grupos ou apenas com um par de investigadores.
09:51
When you visit the Archivio di Stato,
229
591396
2118
Quando visitamos o Archivio di Stato,
09:53
you feel this is beyond what any single team can do,
230
593514
2822
sentimos que está além do que qualquer equipa individual pode fazer,
09:56
and that should be a joint and common effort.
231
596336
3834
e que deve ser um esforço comum e partilhado.
10:00
So what we must do for this paradigm shift
232
600170
3106
Por isso, o que devemos fazer para esta mudança de paradigma
10:03
is actually foster a new generation
233
603276
1902
é fomentar uma nova geração
10:05
of "digital humanists"
234
605178
1537
de "humanistas digitais"
10:06
that are going to be ready for this shift.
235
606715
2090
que vão estar prontos para esta mudança.
10:08
I thank you very much.
236
608805
1959
Muito obrigado.
10:10
(Applause)
237
610764
4000
(Aplausos)
Sobre este site

Este sítio irá apresentar-lhe vídeos do YouTube que são úteis para a aprendizagem do inglês. Verá lições de inglês ensinadas por professores de primeira linha de todo o mundo. Faça duplo clique nas legendas em inglês apresentadas em cada página de vídeo para reproduzir o vídeo a partir daí. As legendas deslocam-se em sincronia com a reprodução do vídeo. Se tiver quaisquer comentários ou pedidos, por favor contacte-nos utilizando este formulário de contacto.

https://forms.gle/WvT1wiN1qDtmnspy7