Rajesh Rao: Computing a Rosetta Stone for the Indus script

1,210,240 views ・ 2011-06-28

TED


Por favor, faça duplo clique nas legendas em inglês abaixo para reproduzir o vídeo.

Tradutor: Isabel Vaz Belchior Revisora: Miguel Cabral de Pinho
00:15
I'd like to begin with a thought experiment.
0
15260
3000
Gostaria de começar com um exercício mental.
00:19
Imagine that it's 4,000 years into the future.
1
19260
3000
Imaginem que estamos 4000 anos no futuro.
00:22
Civilization as we know it
2
22260
2000
A civilização tal como a conhecemos
00:24
has ceased to exist --
3
24260
2000
deixou de existir
00:26
no books,
4
26260
2000
-- não há livros,
00:28
no electronic devices,
5
28260
3000
não há aparelhos eletrónicos,
00:31
no Facebook or Twitter.
6
31260
3000
não há Facebook ou Twitter.
00:34
All knowledge of the English language and the English alphabet
7
34260
3000
Todo o conhecimento da língua inglesa e do alfabeto inglês
00:37
has been lost.
8
37260
2000
se perdeu.
00:39
Now imagine archeologists
9
39260
2000
Agora imaginem arqueólogos
00:41
digging through the rubble of one of our cities.
10
41260
2000
a escavar por entre os escombros de uma das nossas cidades.
00:43
What might they find?
11
43260
2000
O que é que encontrariam?
00:45
Well perhaps some rectangular pieces of plastic
12
45260
3000
Bem, talvez algumas peças retangulares de plástico
00:48
with strange symbols on them.
13
48260
3000
com estranhos símbolos.
00:51
Perhaps some circular pieces of metal.
14
51260
3000
Talvez algumas peças circulares de metal.
00:54
Maybe some cylindrical containers
15
54260
2000
Talvez alguns recipientes cilíndricos
00:56
with some symbols on them.
16
56260
2000
com alguns símbolos.
00:58
And perhaps one archeologist becomes an instant celebrity
17
58260
3000
E talvez uma arqueóloga se torne uma celebridade instantânea
01:01
when she discovers --
18
61260
2000
quando ela descobrir
01:03
buried in the hills somewhere in North America --
19
63260
2000
-- enterradas nas colinas algures na América do Norte --
01:05
massive versions of these same symbols.
20
65260
3000
versões gigantescas destes mesmos símbolos.
01:10
Now let's ask ourselves,
21
70260
2000
Agora perguntemo-nos,
01:12
what could such artifacts say about us
22
72260
3000
o que tais artefactos poderiam dizer sobre nós
01:15
to people 4,000 years into the future?
23
75260
3000
a pessoas a 4000 anos no futuro?
01:18
This is no hypothetical question.
24
78260
2000
Esta não é uma questão hipotética.
01:20
In fact, this is exactly the kind of question we're faced with
25
80260
3000
De facto, este é exatamente o tipo de questão com que nos confrontamos
01:23
when we try to understand the Indus Valley civilization,
26
83260
3000
quando tentamos compreender a civilização do Vale do Indo,
01:26
which existed 4,000 years ago.
27
86260
2000
que existiu há 4000 anos.
01:28
The Indus civilization was roughly contemporaneous
28
88260
3000
A civilização do Indo era quase contemporânea
01:31
with the much better known Egyptian and the Mesopotamian civilizations,
29
91260
3000
das muito mais bem conhecidas civilizações egípcia e mesopotâmica,
01:34
but it was actually much larger than either of these two civilizations.
30
94260
3000
mas era, na verdade, muito maior do que qualquer destas duas civilizações.
01:37
It occupied the area
31
97260
2000
Ocupava a área
01:39
of approximately one million square kilometers,
32
99260
2000
de aproximadamente um milhão de quilómetros quadrados,
01:41
covering what is now Pakistan,
33
101260
2000
cobrindo o que é agora o Paquistão,
01:43
Northwestern India
34
103260
2000
o noroeste da Índia
01:45
and parts of Afghanistan and Iran.
35
105260
2000
e partes do Afeganistão e do Irão.
01:47
Given that it was such a vast civilization,
36
107260
2000
Dado que era uma civilização tão vasta,
01:49
you might expect to find really powerful rulers, kings,
37
109260
4000
poder-se-ia esperar encontrar poderosos governantes, reis,
01:53
and huge monuments glorifying these powerful kings.
38
113260
3000
e enormes monumentos a glorificar estes poderosos reis.
01:56
In fact,
39
116260
2000
De facto,
01:58
what archeologists have found is none of that.
40
118260
2000
o que os arqueólogos encontraram não foi nada disso.
02:00
They've found small objects such as these.
41
120260
3000
Eles encontraram pequenos objetos tais como estes.
02:03
Here's an example of one of these objects.
42
123260
3000
Aqui está um exemplo de um destes objetos.
02:06
Well obviously this is a replica.
43
126260
2000
Bem, obviamente que este é uma réplica.
02:08
But who is this person?
44
128260
3000
Mas quem é esta pessoa?
02:11
A king? A god?
45
131260
2000
Um rei? Um deus?
02:13
A priest?
46
133260
2000
Um sacerdote?
02:15
Or perhaps an ordinary person
47
135260
2000
Ou talvez uma pessoa comum
02:17
like you or me?
48
137260
2000
como vocês ou eu?
02:19
We don't know.
49
139260
2000
Não sabemos.
02:21
But the Indus people also left behind artifacts with writing on them.
50
141260
3000
Mas o povo do Indo também deixou artefactos com escrita.
02:24
Well no, not pieces of plastic,
51
144260
2000
Bem, não, peças de plástico não,
02:26
but stone seals, copper tablets,
52
146260
3000
mas selos de pedra, placas de cobre,
02:29
pottery and, surprisingly,
53
149260
2000
cerâmica e, surpreendentemente,
02:31
one large sign board,
54
151260
2000
um enorme quadro com símbolos,
02:33
which was found buried near the gate of a city.
55
153260
2000
que foi encontrado enterrado perto do portão de uma cidade.
02:35
Now we don't know if it says Hollywood,
56
155260
2000
02:37
or even Bollywood for that matter.
57
157260
2000
Agora, não sabemos se diz Hollywood,
02:39
In fact, we don't even know
58
159260
2000
ou até Bollywood, tanto quanto sabemos.
Na verdade, nem sequer sabemos
02:41
what any of these objects say,
59
161260
2000
o que qualquer um destes objetos diz.
02:43
and that's because the Indus script is undeciphered.
60
163260
3000
E isso é porque a escrita do Indo está indecifrada.
02:46
We don't know what any of these symbols mean.
61
166260
2000
Não sabemos o que qualquer um destes símbolos quer dizer.
02:48
The symbols are most commonly found on seals.
62
168260
3000
Os símbolos são mais vulgarmente encontrados nos selos.
02:51
So you see up there one such object.
63
171260
2000
Vocês veem ali em cima um desses objetos.
02:53
It's the square object with the unicorn-like animal on it.
64
173260
3000
É o objeto quadrado com o animal semelhante a um unicórnio.
02:56
Now that's a magnificent piece of art.
65
176260
2000
Ora, eis uma magnífica peça de arte.
02:58
So how big do you think that is?
66
178260
2000
Então, quão grande pensam vocês que é?
03:00
Perhaps that big?
67
180260
2000
Talvez assim?
03:02
Or maybe that big?
68
182260
2000
Ou talvez assim?
03:04
Well let me show you.
69
184260
2000
Bem, deixem-me mostrar-vos.
03:07
Here's a replica of one such seal.
70
187260
3000
Aqui está uma réplica de um desses selos.
03:10
It's only about one inch by one inch in size --
71
190260
2000
Tem apenas cerca de 2,54 cm x 2,54 cm de tamanho
03:12
pretty tiny.
72
192260
2000
-- bem pequenino.
03:14
So what were these used for?
73
194260
2000
Então para que é que estes foram usados?
03:16
We know that these were used for stamping clay tags
74
196260
3000
Sabemos que estes foram usados para selar etiquetas de barro
03:19
that were attached to bundles of goods that were sent from one place to the other.
75
199260
3000
que eram atadas a pacotes de bens enviados de um lugar para outro.
03:22
So you know those packing slips you get on your FedEx boxes?
76
202260
3000
Estão a ver aquelas guias de remessa que recebem nas caixas da FedEx?
03:25
These were used to make those kinds of packing slips.
77
205260
3000
Estes eram usados para fazer esse tipo de guias de remessa.
03:28
You might wonder what these objects contain
78
208260
3000
Poderão pensar sobre o que estes objetos contêm,
03:31
in terms of their text.
79
211260
2000
em termos do seu texto.
03:33
Perhaps they're the name of the sender
80
213260
2000
Talvez eles sejam o nome do remetente
03:35
or some information about the goods
81
215260
2000
ou alguma informação sobre os bens
03:37
that are being sent from one place to the other -- we don't know.
82
217260
3000
que estão a ser enviados de um lugar para outro -- não sabemos.
03:40
We need to decipher the script to answer that question.
83
220260
2000
Precisamos de decifrar a escrita para responder a essa questão.
03:42
Deciphering the script
84
222260
2000
Decifrar a escrita
03:44
is not just an intellectual puzzle;
85
224260
2000
não é apenas um "puzzle" intelectual;
03:46
it's actually become a question
86
226260
2000
tornou-se realmente uma questão
03:48
that's become deeply intertwined
87
228260
2000
que ficou profundamente interligada
03:50
with the politics and the cultural history of South Asia.
88
230260
3000
com a política e a história cultural do Sul da Ásia.
03:53
In fact, the script has become a battleground of sorts
89
233260
3000
De facto, a escrita tornou-se um campo de batalha
03:56
between three different groups of people.
90
236260
2000
entre três diferentes grupos de pessoas.
03:58
First, there's a group of people
91
238260
2000
Primeiro, há um grupo de pessoas
04:00
who are very passionate in their belief
92
240260
2000
que são muito apaixonadas na sua crença
04:02
that the Indus script
93
242260
2000
de que a escrita do Indo
04:04
does not represent a language at all.
94
244260
2000
não representa de todo uma linguagem.
04:06
These people believe that the symbols
95
246260
2000
Estas pessoas acreditam que os símbolos são muito semelhantes
04:08
are very similar to the kind of symbols you find on traffic signs
96
248260
3000
ao tipo de símbolos que se encontram nos sinais de trânsito
04:11
or the emblems you find on shields.
97
251260
3000
ou aos emblemas que se encontram nos escudos.
04:14
There's a second group of people
98
254260
2000
Há um segundo grupo de pessoas
04:16
who believe that the Indus script represents an Indo-European language.
99
256260
3000
que creem que a escrita do Indo representa uma linguagem indo-europeia.
04:19
If you look at a map of India today,
100
259260
2000
Se olharem para um mapa da Índia hoje,
04:21
you'll see that most of the languages spoken in North India
101
261260
3000
verão que a maioria das línguas faladas no norte da Índia
04:24
belong to the Indo-European language family.
102
264260
3000
pertence à família das línguas indo-europeias.
04:27
So some people believe that the Indus script
103
267260
2000
Por isso, algumas pessoas creem que a escrita do Indo
04:29
represents an ancient Indo-European language such as Sanskrit.
104
269260
3000
representa uma antiga língua indo-europeia, tal como o sânscrito.
04:32
There's a last group of people
105
272260
2000
Há um último grupo de pessoas
04:34
who believe that the Indus people
106
274260
3000
que creem que as pessoas do Indo
04:37
were the ancestors of people living in South India today.
107
277260
3000
eram os ancestrais das pessoas que vivem no sul da Índia hoje.
04:40
These people believe that the Indus script
108
280260
2000
Estas pessoas creem que a escrita do Indo
04:42
represents an ancient form
109
282260
2000
representa uma antiga forma
04:44
of the Dravidian language family,
110
284260
2000
da família linguística dravidiana,
04:46
which is the language family spoken in much of South India today.
111
286260
3000
que é a família linguística falada na maior parte do sul da Índia hoje.
04:49
And the proponents of this theory
112
289260
2000
E os proponentes desta teoria
04:51
point to that small pocket of Dravidian-speaking people in the North,
113
291260
3000
apontam para a pequena bolsa de pessoas falantes de dravidiano no norte,
04:54
actually near Afghanistan,
114
294260
2000
na realidade, perto do Afeganistão,
04:56
and they say that perhaps, sometime in the past,
115
296260
3000
e dizem que talvez, algures no passado,
04:59
Dravidian languages were spoken all over India
116
299260
3000
as línguas dravidianas fossem faladas por toda a Índia,
05:02
and that this suggests
117
302260
2000
e que isso sugere
05:04
that the Indus civilization is perhaps also Dravidian.
118
304260
3000
que a civilização do Indo fosse talvez também dravidiana.
05:07
Which of these hypotheses can be true?
119
307260
3000
Qual destas hipóteses pode ser verdadeira?
05:10
We don't know, but perhaps if you deciphered the script,
120
310260
2000
Não sabemos, mas talvez se vocês decifrassem a escrita,
05:12
you would be able to answer this question.
121
312260
2000
pudessem ser capazes de responder a esta questão.
05:14
But deciphering the script is a very challenging task.
122
314260
2000
Mas decifrar a escrita é uma tarefa muito desafiadora.
05:16
First, there's no Rosetta Stone.
123
316260
2000
Primeiro, não há uma Pedra de Roseta.
05:18
I don't mean the software;
124
318260
2000
Não quero dizer o "software";
05:20
I mean an ancient artifact
125
320260
2000
quero dizer um antigo artefacto
05:22
that contains in the same text
126
322260
2000
que contém no mesmo texto
05:24
both a known text and an unknown text.
127
324260
3000
tanto um texto conhecido como um texto desconhecido.
05:27
We don't have such an artifact for the Indus script.
128
327260
3000
Não temos um artefacto assim para a escrita do Indo.
05:30
And furthermore, we don't even know what language they spoke.
129
330260
3000
E, além disso, nem sequer sabemos que língua é que eles falavam.
05:33
And to make matters even worse,
130
333260
2000
E para piorar ainda mais as coisas,
05:35
most of the text that we have are extremely short.
131
335260
2000
a maioria dos textos que temos são extremamente curtos.
05:37
So as I showed you, they're usually found on these seals
132
337260
2000
Como vos mostrei, eles são, geralmente, encontrados nestes selos minúsculos.
05:39
that are very, very tiny.
133
339260
2000
05:41
And so given these formidable obstacles,
134
341260
2000
E por isso, dados estes obstáculos formidáveis,
05:43
one might wonder and worry
135
343260
2000
poder-nos-emos perguntar e preocupar
05:45
whether one will ever be able to decipher the Indus script.
136
345260
3000
se seremos alguma vez capazes de decifrar a escrita do Indo.
05:48
In the rest of my talk,
137
348260
2000
No resto da minha palestra,
05:50
I'd like to tell you about how I learned to stop worrying
138
350260
2000
gostaria de vos dizer como aprendi a deixar de me preocupar
05:52
and love the challenge posed by the Indus script.
139
352260
2000
e a adorar o desafio colocado pela escrita do Indo.
05:54
I've always been fascinated by the Indus script
140
354260
3000
Sempre me senti fascinado pela escrita do Indo
05:57
ever since I read about it in a middle school textbook.
141
357260
2000
desde que li sobre ela num manual do 3.º Ciclo.
05:59
And why was I fascinated?
142
359260
2000
E porque é que me senti fascinado?
06:01
Well it's the last major undeciphered script in the ancient world.
143
361260
4000
Bem, é a última grande escrita indecifrada do mundo antigo.
06:05
My career path led me to become a computational neuroscientist,
144
365260
3000
A minha carreira fez com que me tornasse um neurocientista computacional,
06:08
so in my day job,
145
368260
2000
por isso, no meu emprego de dia,
06:10
I create computer models of the brain
146
370260
2000
eu crio modelos computacionais do cérebro
06:12
to try to understand how the brain makes predictions,
147
372260
3000
para tentar compreender como é que o cérebro faz predições,
06:15
how the brain makes decisions,
148
375260
2000
como é que o cérebro toma decisões,
06:17
how the brain learns and so on.
149
377260
2000
como é que o cérebro aprende, e por aí fora.
06:19
But in 2007, my path crossed again with the Indus script.
150
379260
3000
Mas em 2007, o meu caminho cruzou-se de novo com a escrita do Indo.
06:22
That's when I was in India,
151
382260
2000
Foi quando estive na Índia,
06:24
and I had the wonderful opportunity
152
384260
2000
e tive a maravilhosa oportunidade
06:26
to meet with some Indian scientists
153
386260
2000
de me encontrar com alguns cientistas indianos
06:28
who were using computer models to try to analyze the script.
154
388260
3000
que estavam a usar modelos computacionais para tentar analisar a escrita.
06:31
And so it was then that I realized
155
391260
2000
E assim foi então que compreendi
06:33
there was an opportunity for me to collaborate with these scientists,
156
393260
3000
que havia uma oportunidade para mim de colaborar com estes cientistas,
06:36
and so I jumped at that opportunity.
157
396260
2000
e, portanto, atirei-me a essa oportunidade.
06:38
And I'd like to describe some of the results that we have found.
158
398260
2000
E gostaria de descrever alguns dos resultados que encontrámos.
06:40
Or better yet, let's all collectively decipher.
159
400260
3000
Ou melhor ainda, vamos todos decifrar coletivamente.
06:43
Are you ready?
160
403260
2000
Estão prontos?
06:45
The first thing that you need to do when you have an undeciphered script
161
405260
3000
A primeira coisa a fazer quando têm uma escrita indecifrada,
06:48
is try to figure out the direction of writing.
162
408260
2000
é tentar perceber a direção da escrita.
06:50
Here are two texts that contain some symbols on them.
163
410260
3000
Aqui estão dois textos que contêm alguns símbolos.
06:53
Can you tell me
164
413260
2000
Conseguem dizer-me
06:55
if the direction of writing is right to left or left to right?
165
415260
3000
se a direção da escrita é da direita para a esquerda
ou da esquerda para a direita?
06:58
I'll give you a couple of seconds.
166
418260
3000
Vou dar-vos alguns segundos.
07:01
Okay. Right to left, how many? Okay.
167
421260
3000
Ok. Da direita para a esquerda, quantos?
07:04
Okay. Left to right?
168
424260
2000
Ok. Da esquerda para a direita?
07:06
Oh, it's almost 50/50. Okay.
169
426260
2000
Oh, é quase 50/50. Ok.
07:08
The answer is:
170
428260
2000
A resposta é:
07:10
if you look at the left-hand side of the two texts,
171
430260
2000
se olharem para o lado esquerdo dos dois textos,
07:12
you'll notice that there's a cramping of signs,
172
432260
3000
vão reparar que há um amontoar de símbolos,
07:15
and it seems like 4,000 years ago,
173
435260
2000
e parece que há 4000 anos,
07:17
when the scribe was writing from right to left,
174
437260
2000
quando os escribas estavam a escrever da direita para a esquerda,
07:19
they ran out of space.
175
439260
2000
faltou-lhes espaço.
07:21
And so they had to cram the sign.
176
441260
2000
E, por isso, eles tiveram de comprimir o símbolo.
07:23
One of the signs is also below the text on the top.
177
443260
2000
Um dos símbolos está por baixo do texto no topo.
07:25
This suggests the direction of writing
178
445260
2000
Isto sugere que a direção da escrita era provavelmente da direita para a esquerda.
07:27
was probably from right to left,
179
447260
2000
07:29
and so that's one of the first things we know,
180
449260
2000
É uma das primeiras coisas que sabemos,
07:31
that directionality is a very key aspect of linguistic scripts.
181
451260
3000
que a direcionalidade é um aspeto fundamental das escritas linguísticas.
07:34
And the Indus script now has
182
454260
2000
07:36
this particular property.
183
456260
2000
E a escrita do Indo tem agora esta propriedade particular.
07:38
What other properties of language does the script show?
184
458260
2000
Que outras propriedades da linguagem mostra a escrita?
07:40
Languages contain patterns.
185
460260
2000
As línguas contêm padrões.
07:42
If I give you the letter Q
186
462260
2000
Se vos der a letra Q
07:44
and ask you to predict the next letter, what do you think that would be?
187
464260
3000
e pedir para predizerem a próxima letra, qual é que pensam que poderá ser?
07:47
Most of you said U, which is right.
188
467260
2000
A maioria de vós disse U, que está certo.
07:49
Now if I asked you to predict one more letter,
189
469260
2000
Agora se eu vos pedir para predizerem mais uma letra,
07:51
what do you think that would be?
190
471260
2000
qual é que pensam que poderá ser?
07:53
Now there's several thoughts. There's E. It could be I. It could be A,
191
473260
3000
Agora há várias opiniões. Há o E. Podia ser o I. Podia ser o A,
07:56
but certainly not B, C or D, right?
192
476260
3000
mas certamente que não o B, C ou D, certo?
07:59
The Indus script also exhibits similar kinds of patterns.
193
479260
3000
A escrita do Indo também exibe tipos semelhantes de padrões.
08:02
There's a lot of text that start with this diamond-shaped symbol.
194
482260
3000
Há muitos textos que começam com este símbolo em forma de diamante.
08:05
And this in turn tends to be followed
195
485260
2000
E isto, por sua vez, tende a ser seguido
08:07
by this quotation marks-like symbol.
196
487260
2000
por este símbolo parecido com aspas.
08:09
And this is very similar to a Q and U example.
197
489260
2000
E isto é muito semelhante a um exemplo Q e U.
08:11
This symbol can in turn be followed
198
491260
2000
Este símbolo pode, por sua vez, ser seguido por estes símbolos
08:13
by these fish-like symbols and some other signs,
199
493260
3000
parecidos com peixes e alguns outros signos,
08:16
but never by these other signs at the bottom.
200
496260
2000
mas nunca por estes outros signos no fundo.
08:18
And furthermore, there's some signs
201
498260
2000
E além disso, há alguns signos
08:20
that really prefer the end of texts,
202
500260
2000
que realmente preferem o final dos textos,
08:22
such as this jar-shaped sign,
203
502260
2000
tal como este signo em forma de jarro.
08:24
and this sign, in fact, happens to be
204
504260
2000
E acontece que este signo,
08:26
the most frequently occurring sign in the script.
205
506260
2000
é o signo que mais frequentemente ocorre na escrita.
08:28
Given such patterns, here was our idea.
206
508260
3000
Dados tais padrões, aqui estava a nossa ideia.
A ideia era usar um computador
08:31
The idea was to use a computer
207
511260
2000
08:33
to learn these patterns,
208
513260
2000
para aprender estes padrões,
08:35
and so we gave the computer the existing texts.
209
515260
3000
e, portanto, demos ao computador os textos existentes.
08:38
And the computer learned a statistical model
210
518260
2000
E o computador aprendeu um modelo estatístico
08:40
of which symbols tend to occur together
211
520260
2000
de quais os símbolos que tendem a ocorrer juntos
08:42
and which symbols tend to follow each other.
212
522260
2000
e quais os símbolos que tendem a seguir-se uns aos outros.
08:44
Given the computer model,
213
524260
2000
Dado o modelo computacional,
08:46
we can test the model by essentially quizzing it.
214
526260
3000
podemos testar o modelo essencialmente por perguntas.
08:49
So we could deliberately erase some symbols,
215
529260
2000
Podemos deliberadamente apagar alguns símbolos,
08:51
and we can ask it to predict the missing symbols.
216
531260
3000
e podemos pedir-lhe para predizer os símbolos em falta.
08:54
Here are some examples.
217
534260
3000
Aqui estão alguns exemplos.
09:00
You may regard this
218
540260
2000
Podem considerar isto
09:02
as perhaps the most ancient game
219
542260
2000
como, talvez, o mais antigo jogo
09:04
of Wheel of Fortune.
220
544260
3000
da Roda da Fortuna.
(Risos)
09:08
What we found
221
548260
2000
O que descobrimos
09:10
was that the computer was successful in 75 percent of the cases
222
550260
2000
foi que o computador foi bem-sucedido em 75% dos casos
09:12
in predicting the correct symbol.
223
552260
2000
na predição do símbolo correto.
09:14
In the rest of the cases,
224
554260
2000
No resto dos casos,
09:16
typically the second best guess or third best guess was the right answer.
225
556260
3000
tipicamente, a segunda melhor resposta
ou terceira melhor resposta era a resposta certa.
09:19
There's also practical use
226
559260
2000
09:21
for this particular procedure.
227
561260
2000
Há também uso prático
para este procedimento particular.
09:23
There's a lot of these texts that are damaged.
228
563260
2000
Há muitos destes textos que estão danificados.
09:25
Here's an example of one such text.
229
565260
2000
Aqui está um exemplo de um desses textos.
09:27
And we can use the computer model now to try to complete this text
230
567260
3000
Podemos usar o modelo computacional para tentar completar este texto
09:30
and make a best guess prediction.
231
570260
2000
e fazer a melhor predição de resposta.
09:32
Here's an example of a symbol that was predicted.
232
572260
3000
Aqui está um exemplo de um símbolo que foi predito.
09:35
And this could be really useful as we try to decipher the script
233
575260
2000
E isto podia ser realmente útil conforme tentamos decifrar a escrita
09:37
by generating more data that we can analyze.
234
577260
3000
ao gerar mais dados que consigamos analisar.
09:40
Now here's one other thing you can do with the computer model.
235
580260
3000
Agora, aqui está uma outra coisa que podem fazer com o modelo computacional.
09:43
So imagine a monkey
236
583260
2000
09:45
sitting at a keyboard.
237
585260
2000
Imaginem um macaco
sentado a um teclado.
09:47
I think you might get a random jumble of letters that looks like this.
238
587260
3000
Penso que poderão obter um amontoado de letras ao acaso, parecido com este.
09:50
Such a random jumble of letters
239
590260
2000
Um amontoado de letras ao acaso, assim,
09:52
is said to have a very high entropy.
240
592260
2000
tem uma entropia muito alta.
09:54
This is a physics and information theory term.
241
594260
2000
Este é um termo da teoria da física e da informação.
09:56
But just imagine it's a really random jumble of letters.
242
596260
3000
Mas imaginem só que é realmente um amontoado de letras ao acaso.
09:59
How many of you have ever spilled coffee on a keyboard?
243
599260
4000
Quantos de vós alguma vez entornaram café em cima de um teclado?
10:03
You might have encountered the stuck-key problem --
244
603260
2000
Poder-se-ão ter deparado com o teclado bloqueado
10:05
so basically the same symbol being repeated over and over again.
245
605260
3000
portanto, o mesmo símbolo a ser repetido uma e outra vez.
10:08
This kind of a sequence is said to have a very low entropy
246
608260
3000
Este tipo de sequência tem uma entropia muito baixa
10:11
because there's no variation at all.
247
611260
2000
porque não há variação nenhuma.
10:13
Language, on the other hand, has an intermediate level of entropy;
248
613260
3000
A linguagem, por outro lado, tem um nível de entropia intermédio;
10:16
it's neither too rigid,
249
616260
2000
nem é demasiado rígido,
10:18
nor is it too random.
250
618260
2000
nem é demasiado ao acaso.
10:20
What about the Indus script?
251
620260
2000
Então e a escrita do Indo?
10:22
Here's a graph that plots the entropies of a whole bunch of sequences.
252
622260
4000
Aqui está um gráfico que marca as entropias
de todo um grupo de sequências.
10:26
At the very top you find the uniformly random sequence,
253
626260
2000
Mesmo no topo, encontram a sequência uniformemente ao acaso,
10:28
which is a random jumble of letters --
254
628260
2000
que é um amontoado de letras ao acaso
10:30
and interestingly, we also find
255
630260
2000
-- e, curiosamente, encontramos também
10:32
the DNA sequence from the human genome and instrumental music.
256
632260
3000
a sequência do ADN do genoma humano e da música instrumental.
10:35
And both of these are very, very flexible,
257
635260
2000
E ambas são muito, muito flexíveis,
10:37
which is why you find them in the very high range.
258
637260
2000
pelo que é por isso que vocês as encontram na variação muito alta.
10:39
At the lower end of the scale,
259
639260
2000
10:41
you find a rigid sequence, a sequence of all A's,
260
641260
2000
Na parte mais baixa do final da escala,
10:43
and you also find a computer program,
261
643260
2000
vocês encontram uma sequência rígida, de todos os A,
10:45
in this case in the language Fortran,
262
645260
2000
e encontram também um programa de computador,
10:47
which obeys really strict rules.
263
647260
2000
neste caso, na linguagem Fortran,
10:49
Linguistic scripts
264
649260
2000
que obedece realmente a regras rígidas.
10:51
occupy the middle range.
265
651260
2000
As escritas linguísticas
ocupam a variação média.
10:53
Now what about the Indus script?
266
653260
2000
Agora, então e a escrita do Indo?
10:55
We found that the Indus script
267
655260
2000
Nós descobrimos que a escrita do Indo,
10:57
actually falls within the range of the linguistic scripts.
268
657260
2000
insere-se na variação das escritas linguísticas.
10:59
When this result was first published,
269
659260
2000
Quando este resultado foi publicado pela primeira vez, foi muito controverso.
11:01
it was highly controversial.
270
661260
3000
11:04
There were people who raised a hue and cry,
271
664260
3000
Houve pessoas que fizeram um alarido,
11:07
and these people were the ones who believed
272
667260
2000
e estas pessoas eram aquelas que acreditavam
11:09
that the Indus script does not represent language.
273
669260
3000
que a escrita do Indo não representa uma língua.
11:12
I even started to get some hate mail.
274
672260
2000
Eu comecei até a receber correio de ódio.
11:14
My students said
275
674260
2000
Os meus alunos disseram
11:16
that I should really seriously consider getting some protection.
276
676260
3000
que eu deveria pensar seriamente em obter alguma proteção.
11:19
Who'd have thought
277
679260
2000
Quem imaginaria que a decifração poderia ser uma profissão perigosa?
11:21
that deciphering could be a dangerous profession?
278
681260
2000
11:23
What does this result really show?
279
683260
2000
O que é que este resultado realmente mostra?
11:25
It shows that the Indus script
280
685260
2000
Mostra que a escrita do Indo
11:27
shares an important property of language.
281
687260
2000
partilha uma propriedade importante da linguagem.
11:29
So, as the old saying goes,
282
689260
2000
Portanto, como diz o ditado,
11:31
if it looks like a linguistic script
283
691260
2000
se parece uma escrita linguística
11:33
and it acts like a linguistic script,
284
693260
2000
e funciona como uma escrita linguística,
11:35
then perhaps we may have a linguistic script on our hands.
285
695260
3000
então, talvez tenhamos uma escrita linguística nas mãos.
11:38
What other evidence is there
286
698260
2000
Que outra evidência há
11:40
that the script could actually encode language?
287
700260
2000
de que a escrita poderia realmente codificar linguagem?
11:42
Well linguistic scripts can actually encode multiple languages.
288
702260
3000
Bem as escritas linguísticas realmente codificam múltiplas línguas.
11:45
So for example, here's the same sentence written in English
289
705260
3000
Assim, por exemplo, aqui está a mesma frase escrita em inglês
11:48
and the same sentence written in Dutch
290
708260
2000
e a mesma frase escrita em neerlandês
11:50
using the same letters of the alphabet.
291
710260
2000
usando as mesmas letras do alfabeto.
11:52
If you don't know Dutch and you only know English
292
712260
3000
Se vocês não souberem neerlandês e só souberem inglês
11:55
and I give you some words in Dutch,
293
715260
2000
e eu vos der algumas palavras em neerlandês,
11:57
you'll tell me that these words contain
294
717260
2000
dir-me-ão que estas palavras contêm
11:59
some very unusual patterns.
295
719260
2000
alguns padrões muito invulgares.
12:01
Some things are not right,
296
721260
2000
Algumas coisas não estão certas,
12:03
and you'll say these words are probably not English words.
297
723260
3000
e vocês dirão que estas palavras provavelmente não são palavras inglesas.
12:06
The same thing happens in the case of the Indus script.
298
726260
2000
A mesma coisa acontece no caso da escrita do Indo.
12:08
The computer found several texts --
299
728260
2000
O computador encontrou vários textos
12:10
two of them are shown here --
300
730260
2000
-- dois deles são mostrados aqui --
12:12
that have very unusual patterns.
301
732260
2000
que têm padrões muito invulgares.
12:14
So for example the first text:
302
734260
2000
Então, por exemplo, o primeiro texto:
12:16
there's a doubling of this jar-shaped sign.
303
736260
3000
há uma duplicação deste signo em forma de jarro.
12:19
This sign is the most frequently-occurring sign
304
739260
2000
Este signo é o que mais frequentemente ocorre
12:21
in the Indus script,
305
741260
2000
na escrita do Indo,
12:23
and it's only in this text
306
743260
2000
e é apenas neste texto que ele surge duplicado.
12:25
that it occurs as a doubling pair.
307
745260
2000
12:27
Why is that the case?
308
747260
2000
Porque é que é assim?
12:29
We went back and looked at where these particular texts were found,
309
749260
3000
Voltámos atrás para vermos
onde é que estes textos em particular foram encontrados,
12:32
and it turns out that they were found
310
752260
2000
12:34
very, very far away from the Indus Valley.
311
754260
2000
e acontece que foram encontrados muito, muito longe do Vale do Indo.
12:36
They were found in present day Iraq and Iran.
312
756260
3000
Eles foram encontrados no Iraque e Irão atuais.
12:39
And why were they found there?
313
759260
2000
E porque é que eles foram lá encontrados?
12:41
What I haven't told you is that
314
761260
2000
O que não vos disse
12:43
the Indus people were very, very enterprising.
315
763260
2000
é que o povo do Indo era muito, muito empreendedor.
12:45
They used to trade with people pretty far away from where they lived,
316
765260
3000
Eles costumavam fazer comércio com povos muito longe de onde viviam.
12:48
and so in this case, they were traveling by sea
317
768260
3000
E assim, neste caso, eles estavam a viajar por mar
12:51
all the way to Mesopotamia, present-day Iraq.
318
771260
3000
até à Mesopotâmia, o Iraque atual.
12:54
And what seems to have happened here
319
774260
2000
E o que parece ter acontecido aqui
12:56
is that the Indus traders, the merchants,
320
776260
3000
é que os comerciantes do Indo, os mercadores,
12:59
were using this script to write a foreign language.
321
779260
3000
estavam a usar esta escrita para escrever uma língua estrangeira.
13:02
It's just like our English and Dutch example.
322
782260
2000
Tal como o nosso exemplo do inglês e do neerlandês.
13:04
And that would explain why we have these strange patterns
323
784260
2000
E isso explicaria porque é que temos estes estranhos padrões
13:06
that are very different from the kinds of patterns you see in the text
324
786260
3000
que são muito diferentes
13:09
that are found within the Indus Valley.
325
789260
3000
dos tipos de padrões que vocês veem no texto
dos achados no Vale do Indo.
13:12
This suggests that the same script, the Indus script,
326
792260
2000
Isto sugere que a mesma escrita, a escrita do Indo,
13:14
could be used to write different languages.
327
794260
3000
poderia ser usada para escrever línguas diferentes.
13:17
The results we have so far seem to point to the conclusion
328
797260
3000
Os resultados que temos até agora parecem apontar para a conclusão
13:20
that the Indus script probably does represent language.
329
800260
3000
de que a escrita do Indo provavelmente representa mesmo uma língua.
13:23
If it does represent language,
330
803260
2000
Se representa mesmo uma língua,
13:25
then how do we read the symbols?
331
805260
2000
então como é que lemos os símbolos?
13:27
That's our next big challenge.
332
807260
2000
Esse é o nosso próximo grande desafio.
13:29
So you'll notice that many of the symbols
333
809260
2000
Então vão reparar que muitos dos símbolos
13:31
look like pictures of humans, of insects,
334
811260
2000
se parecem com imagens de humanos, de insetos,
13:33
of fishes, of birds.
335
813260
3000
de peixes, de aves.
13:36
Most ancient scripts
336
816260
2000
Muitas escritas antigas
13:38
use the rebus principle,
337
818260
2000
usam o "princípio de rebus",
13:40
which is, using pictures to represent words.
338
820260
3000
que é, usar imagens para representar palavras.
13:43
So as an example, here's a word.
339
823260
3000
Então, como exemplo, aqui está uma palavra.
13:46
Can you write it using pictures?
340
826260
2000
Conseguem escrevê-la usando imagens?
13:48
I'll give you a couple seconds.
341
828260
2000
Vou dar-vos alguns segundos.
13:50
Got it?
342
830260
2000
Conseguiram?
13:52
Okay. Great.
343
832260
2000
Ok. Ótimo.
13:54
Here's my solution.
344
834260
2000
Aqui está a minha solução.
13:56
You could use the picture of a bee followed by a picture of a leaf --
345
836260
2000
Podiam usar a imagem de uma abelha [bee]
13:58
and that's "belief," right.
346
838260
2000
seguida da imagem de uma folha [leaf] -- e temos "crença" [belief], certo?
14:00
There could be other solutions.
347
840260
2000
Poderia haver outras soluções.
14:02
In the case of the Indus script,
348
842260
2000
No caso da escrita do Indo,
14:04
the problem is the reverse.
349
844260
2000
o problema é o contrário.
14:06
You have to figure out the sounds of each of these pictures
350
846260
3000
Vocês têm de descobrir o som de cada uma destas imagens
14:09
such that the entire sequence makes sense.
351
849260
2000
de maneira a que a sequência inteira faça sentido.
14:11
So this is just like a crossword puzzle,
352
851260
3000
Então, isto é tal e qual um "puzzle" de palavras cruzadas,
14:14
except that this is the mother of all crossword puzzles
353
854260
3000
exceto que isto é a mãe de todos os "puzzles" de palavras cruzadas,
14:17
because the stakes are so high if you solve it.
354
857260
4000
porque o que está em jogo é tão importante,
caso se consiga resolver.
14:21
My colleagues, Iravatham Mahadevan and Asko Parpola,
355
861260
3000
Os meus colegas, Iravatham Mahadevan e Asko Parpola
têm estado a fazer algum avanço neste problema em particular.
14:24
have been making some headway on this particular problem.
356
864260
2000
14:26
And I'd like to give you a quick example of Parpola's work.
357
866260
2000
E gostaria de vos dar um rápido exemplo do trabalho do Parpola.
14:28
Here's a really short text.
358
868260
2000
Aqui está um texto realmente curto.
14:30
It contains seven vertical strokes followed by this fish-like sign.
359
870260
3000
Ele contém sete traços verticais seguidos por este signo em forma de peixe.
14:33
And I want to mention that these seals were used
360
873260
2000
E quero mencionar que estes selos eram usados
14:35
for stamping clay tags
361
875260
2000
14:37
that were attached to bundles of goods,
362
877260
2000
para selar etiquetas de barro
que eram atadas a pacotes de bens,
14:39
so it's quite likely that these tags, at least some of them,
363
879260
3000
portanto, é bastante provável que estas etiquetas, pelo menos algumas delas,
14:42
contain names of merchants.
364
882260
2000
14:44
And it turns out that in India
365
884260
2000
contenham nomes de mercadores.
14:46
there's a long tradition
366
886260
2000
E acontece que na Índia
há uma longa tradição
14:48
of names being based on horoscopes
367
888260
2000
de nomes baseados em horóscopos
14:50
and star constellations present at the time of birth.
368
890260
3000
e constelações de estrelas presentes no momento do nascimento.
14:53
In Dravidian languages,
369
893260
2000
Nas línguas dravidianas,
14:55
the word for fish is "meen"
370
895260
2000
a palavra para "peixe" é "meen"
14:57
which happens to sound just like the word for star.
371
897260
3000
que, por acaso, soa como a palavra para estrela.
15:00
And so seven stars
372
900260
2000
e assim, sete estrelas representariam "elu meen"
15:02
would stand for "elu meen,"
373
902260
2000
15:04
which is the Dravidian word
374
904260
2000
que é a palavra dravidiana
15:06
for the Big Dipper star constellation.
375
906260
2000
para a constelação da Ursa Maior.
15:08
Similarly, there's another sequence of six stars,
376
908260
3000
Do mesmo modo, há outra sequência de seis estrelas,
15:11
and that translates to "aru meen,"
377
911260
2000
e que se traduz por "aru meen"
15:13
which is the old Dravidian name
378
913260
2000
que é o antigo nome dravidiano
15:15
for the star constellation Pleiades.
379
915260
2000
para a constelação das estrelas Plêiades.
15:17
And finally, there's other combinations,
380
917260
3000
E finalmente, há outras combinações,
15:20
such as this fish sign with something that looks like a roof on top of it.
381
920260
3000
tais como este signo de peixe,
com algo que parece um telhado por cima dele.
15:23
And that could be translated into "mey meen,"
382
923260
3000
E isso podia ser traduzido por "mey meen"
15:26
which is the old Dravidian name for the planet Saturn.
383
926260
3000
que é o antigo nome dravidiano para o planeta Saturno.
15:29
So that was pretty exciting.
384
929260
2000
Então, isto foi bastante entusiasmante.
15:31
It looks like we're getting somewhere.
385
931260
2000
Parece que estamos a chegar a algum lado.
15:33
But does this prove
386
933260
2000
Mas isto prova
15:35
that these seals contain Dravidian names
387
935260
2000
que estes selos contêm nomes dravidianos
15:37
based on planets and star constellations?
388
937260
2000
baseados em planetas e constelações de estrelas?
15:39
Well not yet.
389
939260
2000
Bem, ainda não.
15:41
So we have no way of validating
390
941260
2000
Não temos maneira de validar
15:43
these particular readings,
391
943260
2000
estas leituras particulares,
15:45
but if more and more of these readings start making sense,
392
945260
3000
mas se cada vez mais destas leituras começarem a fazer sentido,
15:48
and if longer and longer sequences
393
948260
2000
e se sequências cada vez mais longas
15:50
appear to be correct,
394
950260
2000
parecerem estar corretas,
15:52
then we know that we are on the right track.
395
952260
2000
então saberemos que estamos no caminho certo.
15:54
Today,
396
954260
2000
Hoje, podemos escrever uma palavra como TED
15:56
we can write a word such as TED
397
956260
3000
15:59
in Egyptian hieroglyphics and in cuneiform script,
398
959260
3000
em hieróglifos egípcios e em escrita cuneiforme,
16:02
because both of these were deciphered
399
962260
2000
porque ambas foram decifradas
16:04
in the 19th century.
400
964260
2000
no século XIX.
16:06
The decipherment of these two scripts
401
966260
2000
A decifração destas duas escritas
16:08
enabled these civilizations to speak to us again directly.
402
968260
3000
possibilitou a estas civilizações falar-nos outra vez diretamente.
16:11
The Mayans
403
971260
2000
Os maias começaram a falar-nos no século XX,
16:13
started speaking to us in the 20th century,
404
973260
2000
16:15
but the Indus civilization remains silent.
405
975260
3000
mas a civilização do Indo permanece silenciosa.
16:18
Why should we care?
406
978260
2000
Porque é que nos devemos preocupar?
16:20
The Indus civilization does not belong
407
980260
2000
A civilização do Indo não pertence apenas aos indianos do sul
16:22
to just the South Indians or the North Indians
408
982260
2000
ou aos indianos do norte
16:24
or the Pakistanis;
409
984260
2000
ou aos paquistaneses;
16:26
it belongs to all of us.
410
986260
2000
pertence-nos a todos.
16:28
These are our ancestors --
411
988260
2000
Estes são os nossos antepassados
16:30
yours and mine.
412
990260
2000
-- vossos e meus.
16:32
They were silenced
413
992260
2000
Eles foram silenciados
16:34
by an unfortunate accident of history.
414
994260
2000
por um infeliz acidente da História.
16:36
If we decipher the script,
415
996260
2000
Se decifrarmos a escrita,
16:38
we would enable them to speak to us again.
416
998260
2000
possibilitar-lhes-emos que nos falem outra vez.
16:40
What would they tell us?
417
1000260
3000
O que nos diriam?
16:43
What would we find out about them? About us?
418
1003260
3000
O que descobriríamos sobre eles? Sobre nós?
16:46
I can't wait to find out.
419
1006260
3000
Mal posso esperar para descobrir.
16:49
Thank you.
420
1009260
2000
Obrigado.
16:51
(Applause)
421
1011260
4000
(Aplausos)
Sobre este site

Este sítio irá apresentar-lhe vídeos do YouTube que são úteis para a aprendizagem do inglês. Verá lições de inglês ensinadas por professores de primeira linha de todo o mundo. Faça duplo clique nas legendas em inglês apresentadas em cada página de vídeo para reproduzir o vídeo a partir daí. As legendas deslocam-se em sincronia com a reprodução do vídeo. Se tiver quaisquer comentários ou pedidos, por favor contacte-nos utilizando este formulário de contacto.

https://forms.gle/WvT1wiN1qDtmnspy7