Rajesh Rao: Computing a Rosetta Stone for the Indus script

Rajesh Rao: Uma pedra de Rosetta para a escritura do Indo

1,196,598 views

2011-06-28 ・ TED


New videos

Rajesh Rao: Computing a Rosetta Stone for the Indus script

Rajesh Rao: Uma pedra de Rosetta para a escritura do Indo

1,196,598 views ・ 2011-06-28

TED


Por favor, clique duas vezes nas legendas em inglês abaixo para reproduzir o vídeo.

Tradutor: Isabel Villan Revisor: Fers Gruendling
00:15
I'd like to begin with a thought experiment.
0
15260
3000
Eu gostaria de começar com um exercício hipotético.
00:19
Imagine that it's 4,000 years into the future.
1
19260
3000
Imagine que ele acontece 4.000 anos no futuro.
00:22
Civilization as we know it
2
22260
2000
A civilização como a conhecemos
00:24
has ceased to exist --
3
24260
2000
deixou de existir --
00:26
no books,
4
26260
2000
sem livros,
00:28
no electronic devices,
5
28260
3000
sem aparelhos eletrônicos,
00:31
no Facebook or Twitter.
6
31260
3000
sem Facebook ou Twiter.
00:34
All knowledge of the English language and the English alphabet
7
34260
3000
Todo conhecimento da língua e do alfabeto ingleses
00:37
has been lost.
8
37260
2000
foi perdido.
00:39
Now imagine archeologists
9
39260
2000
Agora imagine arqueólogos
00:41
digging through the rubble of one of our cities.
10
41260
2000
cavando nos escombros de uma de nossas cidades.
00:43
What might they find?
11
43260
2000
O que eles poderiam encontrar?
00:45
Well perhaps some rectangular pieces of plastic
12
45260
3000
Bem, talvez alguns pedaços retangulares de plástico
00:48
with strange symbols on them.
13
48260
3000
com símbolos estranhos.
00:51
Perhaps some circular pieces of metal.
14
51260
3000
Talvez alguns pedaços circulares de metal.
00:54
Maybe some cylindrical containers
15
54260
2000
Talvez alguns recipientes cilíndricos
00:56
with some symbols on them.
16
56260
2000
com alguns símbolos.
00:58
And perhaps one archeologist becomes an instant celebrity
17
58260
3000
E talvez uma arqueóloga se torne uma celebridade instantânea
01:01
when she discovers --
18
61260
2000
quando ela decobre --
01:03
buried in the hills somewhere in North America --
19
63260
2000
enterrada nas colinas de algum lugar na América do Norte --
01:05
massive versions of these same symbols.
20
65260
3000
grandes quantidades de versões destes mesmos símbolos.
01:10
Now let's ask ourselves,
21
70260
2000
Agora, vamos perguntar a nós mesmos,
01:12
what could such artifacts say about us
22
72260
3000
o que tais artefatos poderiam dizer sobre nós
01:15
to people 4,000 years into the future?
23
75260
3000
para pessoas a 4.000 anos no futuro?
01:18
This is no hypothetical question.
24
78260
2000
Esta não é uma questão hipotética.
01:20
In fact, this is exactly the kind of question we're faced with
25
80260
3000
De fato, é exatamente o tipo de questão que encaramos
01:23
when we try to understand the Indus Valley civilization,
26
83260
3000
quando tentamos entender a civilização do Vale do Indo,
01:26
which existed 4,000 years ago.
27
86260
2000
que existiu 4.000 anos atrás.
01:28
The Indus civilization was roughly contemporaneous
28
88260
3000
A civilização do Indo era, grosso modo, contemporânea
01:31
with the much better known Egyptian and the Mesopotamian civilizations,
29
91260
3000
às muito mais conhecidas civilizações egípcia e mesopotâmica,
01:34
but it was actually much larger than either of these two civilizations.
30
94260
3000
mas era realmente muito maior que qualquer uma dessas duas civilizações.
01:37
It occupied the area
31
97260
2000
Ela ocupou a área
01:39
of approximately one million square kilometers,
32
99260
2000
de aproximadamente um milhão de quilômetros quadrados,
01:41
covering what is now Pakistan,
33
101260
2000
abrangendo o que é agora o Paquistão,
01:43
Northwestern India
34
103260
2000
o Noroeste da Índia
01:45
and parts of Afghanistan and Iran.
35
105260
2000
e partes do Afeganistão e Irã.
01:47
Given that it was such a vast civilization,
36
107260
2000
Considerando-se que era uma civilização tão vasta,
01:49
you might expect to find really powerful rulers, kings,
37
109260
4000
você esperaria encontrar governantes realmente poderosos, reis,
01:53
and huge monuments glorifying these powerful kings.
38
113260
3000
e monumentos gigantescos glorificando esses reis poderosos.
01:56
In fact,
39
116260
2000
De fato,
01:58
what archeologists have found is none of that.
40
118260
2000
o que arqueólogos encontraram não foi nada disso.
02:00
They've found small objects such as these.
41
120260
3000
Eles encontraram pequenos objetos como estes.
02:03
Here's an example of one of these objects.
42
123260
3000
Aqui está um exemplo de um desses objetos.
02:06
Well obviously this is a replica.
43
126260
2000
Bem, obviamente isto é uma réplica.
02:08
But who is this person?
44
128260
3000
Mas, quem é esta pessoa?
02:11
A king? A god?
45
131260
2000
Um rei? Um deus?
02:13
A priest?
46
133260
2000
Um sacerdote?
02:15
Or perhaps an ordinary person
47
135260
2000
Ou, talvez, uma pessoa comum
02:17
like you or me?
48
137260
2000
como você ou eu?
02:19
We don't know.
49
139260
2000
Não sabemos.
02:21
But the Indus people also left behind artifacts with writing on them.
50
141260
3000
Mas o povo do Indo também deixou artefatos com escritos.
02:24
Well no, not pieces of plastic,
51
144260
2000
Bem, não, não peças de plástico,
02:26
but stone seals, copper tablets,
52
146260
3000
mas selos de pedra, plaquetas de cobre,
02:29
pottery and, surprisingly,
53
149260
2000
cerâmica e, surpreendentemente,
02:31
one large sign board,
54
151260
2000
uma grande placa de símbolos,
02:33
which was found buried near the gate of a city.
55
153260
2000
que foi encontrada enterrada perto do portão de uma cidade.
02:35
Now we don't know if it says Hollywood,
56
155260
2000
Não sabemos se ela diz Hollywood,
02:37
or even Bollywood for that matter.
57
157260
2000
ou mesmo Bollywood nessa questão.
02:39
In fact, we don't even know
58
159260
2000
De verdade, não sabemos mesmo
02:41
what any of these objects say,
59
161260
2000
o que diz qualquer um desses objetos.
02:43
and that's because the Indus script is undeciphered.
60
163260
3000
E isso ocorre porque a escritura do Indo não foi decifrada.
02:46
We don't know what any of these symbols mean.
61
166260
2000
Não sabemos o que qualquer um desses símbolos significa.
02:48
The symbols are most commonly found on seals.
62
168260
3000
Os símbolos são mais comumente encontrados em selos.
02:51
So you see up there one such object.
63
171260
2000
Aqui vocês veem um desses objetos.
02:53
It's the square object with the unicorn-like animal on it.
64
173260
3000
É um objeto quadrado com um animal em forma de unicórnio.
02:56
Now that's a magnificent piece of art.
65
176260
2000
Esta é uma magnífica peça de arte.
02:58
So how big do you think that is?
66
178260
2000
Quão grande vocês acham que ela é?
03:00
Perhaps that big?
67
180260
2000
Talvez deste tamanho?
03:02
Or maybe that big?
68
182260
2000
Ou talvez deste?
03:04
Well let me show you.
69
184260
2000
Bem, permitam-me mostrar-lhes.
03:07
Here's a replica of one such seal.
70
187260
3000
Aqui está uma réplica de um desses selos.
03:10
It's only about one inch by one inch in size --
71
190260
2000
Ele tem o tamanho de uma polegada por uma polegada --
03:12
pretty tiny.
72
192260
2000
bastante pequeno.
03:14
So what were these used for?
73
194260
2000
Então, para que eles eram usados?
03:16
We know that these were used for stamping clay tags
74
196260
3000
Sabemos que estes eram usados para estampar etiquetas de argila
03:19
that were attached to bundles of goods that were sent from one place to the other.
75
199260
3000
que eram anexadas a fardos de mercadorias remetidas de um lugar para outro.
03:22
So you know those packing slips you get on your FedEx boxes?
76
202260
3000
Sabem aquelas tiras de embalagem que vocês têm nas caixas FedEx?
03:25
These were used to make those kinds of packing slips.
77
205260
3000
Estes eram usados para fazer esse tipo de etiqueta de embalagem.
03:28
You might wonder what these objects contain
78
208260
3000
Agora vocês podem imaginar o que estes objetos contêm
03:31
in terms of their text.
79
211260
2000
em termos de textos.
03:33
Perhaps they're the name of the sender
80
213260
2000
Talvez eles sejam o nome do remetente
03:35
or some information about the goods
81
215260
2000
ou alguma informação sobre as mercadorias
03:37
that are being sent from one place to the other -- we don't know.
82
217260
3000
que estão sendo enviadas de um lugar para o outro -- nós não sabemos.
03:40
We need to decipher the script to answer that question.
83
220260
2000
Precisamos decifrar a escritura para responder esta questão.
03:42
Deciphering the script
84
222260
2000
Decifrar a escritura
03:44
is not just an intellectual puzzle;
85
224260
2000
não é apenas um quebra-cabeças intelectual;
03:46
it's actually become a question
86
226260
2000
na verdade tornou-se uma questão
03:48
that's become deeply intertwined
87
228260
2000
profundamente entrelaçada
03:50
with the politics and the cultural history of South Asia.
88
230260
3000
com a política e a história cultural do Sul da Ásia.
03:53
In fact, the script has become a battleground of sorts
89
233260
3000
Na verdade, a escritura se tornou um campo de batalha de todo tipo
03:56
between three different groups of people.
90
236260
2000
entre três diferentes grupos de pessoas.
03:58
First, there's a group of people
91
238260
2000
Primeiramente, há um grupo de pessoas
04:00
who are very passionate in their belief
92
240260
2000
que são muito passionais na sua crença
04:02
that the Indus script
93
242260
2000
de que as escrituras do Indo
04:04
does not represent a language at all.
94
244260
2000
não representam nenhuma língua.
04:06
These people believe that the symbols
95
246260
2000
Essas pessoas acreditam que os símbolos
04:08
are very similar to the kind of symbols you find on traffic signs
96
248260
3000
são muito semelhantes ao tipo de símbolos que você encontra em sinais de trânsito
04:11
or the emblems you find on shields.
97
251260
3000
ou os emblemas que você encontra em escudos.
04:14
There's a second group of people
98
254260
2000
Há um segundo grupo de pessoas
04:16
who believe that the Indus script represents an Indo-European language.
99
256260
3000
que acredita que a escritura do Indo representa uma língua indo-europeia.
04:19
If you look at a map of India today,
100
259260
2000
Se você olhar para um mapa da Índia hoje,
04:21
you'll see that most of the languages spoken in North India
101
261260
3000
verá que a maioria das línguas faladas no Norte da Índia
04:24
belong to the Indo-European language family.
102
264260
3000
pertence à família das línguas indo-europeias.
04:27
So some people believe that the Indus script
103
267260
2000
Então, algumas pessoas acreditam que a escritura do Indo
04:29
represents an ancient Indo-European language such as Sanskrit.
104
269260
3000
representa uma antiga língua indo-europeia como o sânscrito.
04:32
There's a last group of people
105
272260
2000
Há um último grupo de pessoas
04:34
who believe that the Indus people
106
274260
3000
que acredita que os povos do Indo
04:37
were the ancestors of people living in South India today.
107
277260
3000
eram os ancestrais das pessoas que vivem no Sul da Índia hoje.
04:40
These people believe that the Indus script
108
280260
2000
Estas pessoas acreditam que a escritura do Indo
04:42
represents an ancient form
109
282260
2000
representa uma forma antiga
04:44
of the Dravidian language family,
110
284260
2000
da família de línguas dravídicas,
04:46
which is the language family spoken in much of South India today.
111
286260
3000
que é a família de línguas faladas na maior parte do Sul da Índia hoje.
04:49
And the proponents of this theory
112
289260
2000
E os proponentes desta teoria
04:51
point to that small pocket of Dravidian-speaking people in the North,
113
291260
3000
apontam para aquele pequeno bolsão de pessoas que falam dravídico no Norte,
04:54
actually near Afghanistan,
114
294260
2000
de fato, perto do Afeganistão,
04:56
and they say that perhaps, sometime in the past,
115
296260
3000
e dizem que, talvez, em alguma época no passado,
04:59
Dravidian languages were spoken all over India
116
299260
3000
as línguas dravídicas fossem faladas em toda a Índia
05:02
and that this suggests
117
302260
2000
e que isto sugere
05:04
that the Indus civilization is perhaps also Dravidian.
118
304260
3000
que talvez a civilização do Indo seja também dravidiana.
05:07
Which of these hypotheses can be true?
119
307260
3000
Agora, qual dessas hipóteses pode ser verdadeira?
05:10
We don't know, but perhaps if you deciphered the script,
120
310260
2000
Não sabemos, mas talvez se você decifrasse a escritura,
05:12
you would be able to answer this question.
121
312260
2000
seria capaz de responder esta questão.
05:14
But deciphering the script is a very challenging task.
122
314260
2000
Mas, decifrar a escritura é uma tarefa muito desafiante.
05:16
First, there's no Rosetta Stone.
123
316260
2000
Primeiro, não há Pedra de Rosetta.
05:18
I don't mean the software;
124
318260
2000
Não me refiro ao software;
05:20
I mean an ancient artifact
125
320260
2000
refiro-me ao artefato antigo
05:22
that contains in the same text
126
322260
2000
que contém no mesmo texto
05:24
both a known text and an unknown text.
127
324260
3000
tanto um texto conhecido como um texto desconhecido.
05:27
We don't have such an artifact for the Indus script.
128
327260
3000
Não temos esse artefato para a escritura do Indo.
05:30
And furthermore, we don't even know what language they spoke.
129
330260
3000
E, além disso, nem mesmo sabemos qual língua eles falavam.
05:33
And to make matters even worse,
130
333260
2000
E para tornar o assunto ainda pior,
05:35
most of the text that we have are extremely short.
131
335260
2000
a maioria dos textos que temos são extremamente curtos.
05:37
So as I showed you, they're usually found on these seals
132
337260
2000
Como lhes mostrei, eles são geralmente encontrados nestes selos
05:39
that are very, very tiny.
133
339260
2000
que são muito, muito pequenos.
05:41
And so given these formidable obstacles,
134
341260
2000
Então, considerados esses obstáculos formidáveis,
05:43
one might wonder and worry
135
343260
2000
uma pessoa pode questionar-se e mesmo preocupar-se
05:45
whether one will ever be able to decipher the Indus script.
136
345260
3000
se alguém algum dia será capaz de decifrar a escritura do Indo.
05:48
In the rest of my talk,
137
348260
2000
Então, no restante de minha apresentação,
05:50
I'd like to tell you about how I learned to stop worrying
138
350260
2000
eu gostaria de contar-lhes como aprendi a parar de me preocupar
05:52
and love the challenge posed by the Indus script.
139
352260
2000
e a amar o desafio apresentado pela escritura do Indo.
05:54
I've always been fascinated by the Indus script
140
354260
3000
Sempre fui fascinado pela escritura do Indo
05:57
ever since I read about it in a middle school textbook.
141
357260
2000
desde que li sobre ela em um livro da escola de ensino médio
05:59
And why was I fascinated?
142
359260
2000
E por que eu era fascinado?
06:01
Well it's the last major undeciphered script in the ancient world.
143
361260
4000
Bem, esta é a última e a maior escritura não decifrada no mundo antigo.
06:05
My career path led me to become a computational neuroscientist,
144
365260
3000
Minha trajetória profissional levou-me a ser um neurocientista computacional
06:08
so in my day job,
145
368260
2000
então em meu trabalho diário,
06:10
I create computer models of the brain
146
370260
2000
crio modelos computacionais do cérebro
06:12
to try to understand how the brain makes predictions,
147
372260
3000
para tentar entender como o cérebro elabora predições,
06:15
how the brain makes decisions,
148
375260
2000
como o cérebro toma decisões,
06:17
how the brain learns and so on.
149
377260
2000
como o cérebro aprende e assim por diante.
06:19
But in 2007, my path crossed again with the Indus script.
150
379260
3000
Mas, em 2007, meu caminho cruzou novamente com a escritura do Indo.
06:22
That's when I was in India,
151
382260
2000
Isto foi quando eu estava na Índia,
06:24
and I had the wonderful opportunity
152
384260
2000
e tive a maravilhosa oportunidade
06:26
to meet with some Indian scientists
153
386260
2000
de encontrar-me com alguns cientistas indianos
06:28
who were using computer models to try to analyze the script.
154
388260
3000
que estavam usando modelos computacionais para tentar analisar a escritura.
06:31
And so it was then that I realized
155
391260
2000
E foi então que percebi
06:33
there was an opportunity for me to collaborate with these scientists,
156
393260
3000
que havia uma oportunidade de eu colaborar com esses cientistas,
06:36
and so I jumped at that opportunity.
157
396260
2000
e me agarrei àquela oportunidade.
06:38
And I'd like to describe some of the results that we have found.
158
398260
2000
E eu gostaria de descrever alguns dos resultados que encontramos.
06:40
Or better yet, let's all collectively decipher.
159
400260
3000
Ou melhor ainda, vamos todos decifrar coletivamente.
06:43
Are you ready?
160
403260
2000
Estão prontos?
06:45
The first thing that you need to do when you have an undeciphered script
161
405260
3000
A primeira coisa que você precisa fazer quando tem uma escrita não decifrada
06:48
is try to figure out the direction of writing.
162
408260
2000
é tentar descobrir a direção da escrita.
06:50
Here are two texts that contain some symbols on them.
163
410260
3000
Então, aqui estão dois textos que contêm alguns símbolos.
06:53
Can you tell me
164
413260
2000
Vocês podem me dizer
06:55
if the direction of writing is right to left or left to right?
165
415260
3000
se a direção da escrita é da direita para a esquerda ou da esquerda para a direita?
06:58
I'll give you a couple of seconds.
166
418260
3000
Vou dar-lhes alguns segundos.
07:01
Okay. Right to left, how many? Okay.
167
421260
3000
OK. Da direita para a esquerda, quantos? OK.
07:04
Okay. Left to right?
168
424260
2000
Ok. Da esquerda para a direita?
07:06
Oh, it's almost 50/50. Okay.
169
426260
2000
Oh, é quase meio a meio. OK.
07:08
The answer is:
170
428260
2000
Então a resposta é:
07:10
if you look at the left-hand side of the two texts,
171
430260
2000
se você olhar para o lado esquerdo dos dois textos,
07:12
you'll notice that there's a cramping of signs,
172
432260
3000
você notará que há um aglomerado de símbolos,
07:15
and it seems like 4,000 years ago,
173
435260
2000
e parece que, 4.000 anos atrás,
07:17
when the scribe was writing from right to left,
174
437260
2000
quando os escribas estavam escrevendo da direita para a esquerda,
07:19
they ran out of space.
175
439260
2000
eles ficaram sem espaço.
07:21
And so they had to cram the sign.
176
441260
2000
Então eles tiveram que encaixar o símbolo.
07:23
One of the signs is also below the text on the top.
177
443260
2000
Um dos símbolos está abaixo do texto no topo.
07:25
This suggests the direction of writing
178
445260
2000
Isto sugere que a direção da escrita
07:27
was probably from right to left,
179
447260
2000
era provavelmente da direita para a esquerda.
07:29
and so that's one of the first things we know,
180
449260
2000
E esta é uma das primeiras coisas que sabemos,
07:31
that directionality is a very key aspect of linguistic scripts.
181
451260
3000
que o direcionamento é um aspecto chave de escritas linguísticas.
07:34
And the Indus script now has
182
454260
2000
E a escritura do Indo agora tem
07:36
this particular property.
183
456260
2000
essa propriedade específica.
07:38
What other properties of language does the script show?
184
458260
2000
Que outras propriedades da linguagem a escritura mostra?
07:40
Languages contain patterns.
185
460260
2000
Línguas contêm padrões.
07:42
If I give you the letter Q
186
462260
2000
Se eu lhe dou a letra Q
07:44
and ask you to predict the next letter, what do you think that would be?
187
464260
3000
e peço para você predizer a próxima letra, qual você acha que seria?
07:47
Most of you said U, which is right.
188
467260
2000
A maioria disse U, o que está correto.
07:49
Now if I asked you to predict one more letter,
189
469260
2000
Agora, se peço para você predizer mais uma letra,
07:51
what do you think that would be?
190
471260
2000
qual você acha que seria?
07:53
Now there's several thoughts. There's E. It could be I. It could be A,
191
473260
3000
Agora há várias possibilidades. Existe o E. Poderia ser I. Poderia ser A,
07:56
but certainly not B, C or D, right?
192
476260
3000
mas certamente não B, C ou D, certo?
07:59
The Indus script also exhibits similar kinds of patterns.
193
479260
3000
A escritura Indo também exibe tipos semelhantes de padrões.
08:02
There's a lot of text that start with this diamond-shaped symbol.
194
482260
3000
Há muitos textos que começam com este símbolo em forma de diamante.
08:05
And this in turn tends to be followed
195
485260
2000
E este, por sua vez, tende a ser seguido
08:07
by this quotation marks-like symbol.
196
487260
2000
por este símbolo em forma de aspas.
08:09
And this is very similar to a Q and U example.
197
489260
2000
E isto é muito similar ao exemplo do Q e U.
08:11
This symbol can in turn be followed
198
491260
2000
Este símbolo pode também ser seguido
08:13
by these fish-like symbols and some other signs,
199
493260
3000
por estes símbolos em forma de peixe e alguns outros signos,
08:16
but never by these other signs at the bottom.
200
496260
2000
mas nunca por estes outros signos abaixo.
08:18
And furthermore, there's some signs
201
498260
2000
E além disso, há alguns signos
08:20
that really prefer the end of texts,
202
500260
2000
que realmente preferem o final dos textos,
08:22
such as this jar-shaped sign,
203
502260
2000
como este signo em forma de jarra.
08:24
and this sign, in fact, happens to be
204
504260
2000
E este signo, de fato, é o que
08:26
the most frequently occurring sign in the script.
205
506260
2000
mais frequentemente ocorre na escritura.
08:28
Given such patterns, here was our idea.
206
508260
3000
Dados esses padrões, aqui vai nossa ideia.
08:31
The idea was to use a computer
207
511260
2000
A ideia foi usar um computador
08:33
to learn these patterns,
208
513260
2000
para aprender esses padrões,
08:35
and so we gave the computer the existing texts.
209
515260
3000
e, então, colocamos no computador os textos existentes.
08:38
And the computer learned a statistical model
210
518260
2000
E o computador aprendeu um modelo estatístico
08:40
of which symbols tend to occur together
211
520260
2000
de quais símbolos tendem a ocorrer juntos
08:42
and which symbols tend to follow each other.
212
522260
2000
e quais símbolos tendem a seguir uns aos outros.
08:44
Given the computer model,
213
524260
2000
Dado o modelo computacional,
08:46
we can test the model by essentially quizzing it.
214
526260
3000
podemos testar o modelo essencialmente questionando-o.
08:49
So we could deliberately erase some symbols,
215
529260
2000
Então poderíamos deliberadamente apagar alguns símbolos,
08:51
and we can ask it to predict the missing symbols.
216
531260
3000
e pedir-lhe para predizer os símbolos faltantes.
08:54
Here are some examples.
217
534260
3000
Aqui estão alguns exemplos.
09:00
You may regard this
218
540260
2000
Você pode considerar isto
09:02
as perhaps the most ancient game
219
542260
2000
talvez como o mais antigo jogo
09:04
of Wheel of Fortune.
220
544260
3000
da Roda da Fortuna.
09:08
What we found
221
548260
2000
O que encontramos
09:10
was that the computer was successful in 75 percent of the cases
222
550260
2000
foi que o computador tinha sucesso em 75 por cento dos casos
09:12
in predicting the correct symbol.
223
552260
2000
ao predizer o símbolo correto.
09:14
In the rest of the cases,
224
554260
2000
No restante dos casos,
09:16
typically the second best guess or third best guess was the right answer.
225
556260
3000
tipicamente a segunda ou a terceira opções era a resposta correta.
09:19
There's also practical use
226
559260
2000
Há também um uso prático
09:21
for this particular procedure.
227
561260
2000
para este procedimento específico.
09:23
There's a lot of these texts that are damaged.
228
563260
2000
Há muitos destes textos que estão danificados.
09:25
Here's an example of one such text.
229
565260
2000
Aqui está um exemplo de um desses textos.
09:27
And we can use the computer model now to try to complete this text
230
567260
3000
E podemos usar o modelo computacional agora para tentar completar este texto
09:30
and make a best guess prediction.
231
570260
2000
e fazer a melhor predição.
09:32
Here's an example of a symbol that was predicted.
232
572260
3000
Aqui está um exemplo de um símbolo que foi predito.
09:35
And this could be really useful as we try to decipher the script
233
575260
2000
E isso pode ser realmente útil à medida que tentamos decifrar a escritura,
09:37
by generating more data that we can analyze.
234
577260
3000
gerando mais dados que podemos analisar.
09:40
Now here's one other thing you can do with the computer model.
235
580260
3000
Aqui, temos uma outra coisa que pode ser feita com o modelo computacional.
09:43
So imagine a monkey
236
583260
2000
Imaginem um macaco
09:45
sitting at a keyboard.
237
585260
2000
dedilhando um teclado.
09:47
I think you might get a random jumble of letters that looks like this.
238
587260
3000
Penso que se poderia obter um conjunto errático de letras que se parece com este.
09:50
Such a random jumble of letters
239
590260
2000
Tal conjunto errático de letras
09:52
is said to have a very high entropy.
240
592260
2000
é considerado como tendo uma entropia muito alta.
09:54
This is a physics and information theory term.
241
594260
2000
Este é um termo da física e da teoria da informação.
09:56
But just imagine it's a really random jumble of letters.
242
596260
3000
Mas, apenas imagine que é realmente um conjunto errático de letras.
09:59
How many of you have ever spilled coffee on a keyboard?
243
599260
4000
Qual de vocês alguma vez já derramou café no teclado?
10:03
You might have encountered the stuck-key problem --
244
603260
2000
Você pode ter-se deparado com um teclado travado --
10:05
so basically the same symbol being repeated over and over again.
245
605260
3000
basicamente o mesmo símbolo sendo repetido indefinidamente.
10:08
This kind of a sequence is said to have a very low entropy
246
608260
3000
Este tipo de sequência é considerada como tendo uma entropia muito baixa
10:11
because there's no variation at all.
247
611260
2000
porque não há nenhuma variação.
10:13
Language, on the other hand, has an intermediate level of entropy;
248
613260
3000
A língua, por outro lado, têm um grau intermediário de entropia;
10:16
it's neither too rigid,
249
616260
2000
não é nem muito rígida,
10:18
nor is it too random.
250
618260
2000
nem muito errática.
10:20
What about the Indus script?
251
620260
2000
E a escritura do Indo?
10:22
Here's a graph that plots the entropies of a whole bunch of sequences.
252
622260
4000
Aqui está um gráfico que esquematiza as entropias de um bloco de sequências.
10:26
At the very top you find the uniformly random sequence,
253
626260
2000
No topo encontra-se a sequência uniformemente errática,
10:28
which is a random jumble of letters --
254
628260
2000
que é o conjunto errático de letras --
10:30
and interestingly, we also find
255
630260
2000
e, interessante, também encontramos
10:32
the DNA sequence from the human genome and instrumental music.
256
632260
3000
a sequência do DNA do genoma humano e a música instrumental.
10:35
And both of these are very, very flexible,
257
635260
2000
E ambas são muito, muito flexíveis,
10:37
which is why you find them in the very high range.
258
637260
2000
e é por isso que se encontram na mais alta variação.
10:39
At the lower end of the scale,
259
639260
2000
Na parte mais baixa da escala,
10:41
you find a rigid sequence, a sequence of all A's,
260
641260
2000
encontra-se a sequência rígida, a sequência de todos os A,
10:43
and you also find a computer program,
261
643260
2000
e também se encontra um programa de computador,
10:45
in this case in the language Fortran,
262
645260
2000
neste caso em linguagem Fortran,
10:47
which obeys really strict rules.
263
647260
2000
que obecede regras realmente estritas.
10:49
Linguistic scripts
264
649260
2000
Escritos linguísticos
10:51
occupy the middle range.
265
651260
2000
ocupam a variação mediana.
10:53
Now what about the Indus script?
266
653260
2000
E a escritura do Indo?
10:55
We found that the Indus script
267
655260
2000
Descobrimos que a escritura do Indo
10:57
actually falls within the range of the linguistic scripts.
268
657260
2000
na verdade encaixa-se dentro da variação dos escritos linguísticos.
10:59
When this result was first published,
269
659260
2000
Quando este resultado foi publicado pela primeira vez,
11:01
it was highly controversial.
270
661260
3000
levantou grande controvérsia.
11:04
There were people who raised a hue and cry,
271
664260
3000
Houve pessoas que clamaram por justiça,
11:07
and these people were the ones who believed
272
667260
2000
e estas pessoas eram aquelas que acreditavam
11:09
that the Indus script does not represent language.
273
669260
3000
que a escritura do Indo não representa um idioma.
11:12
I even started to get some hate mail.
274
672260
2000
Comecei a receber correspondência ameaçadora.
11:14
My students said
275
674260
2000
Meus alunos disseram
11:16
that I should really seriously consider getting some protection.
276
676260
3000
que eu deveria pensar seriamente em obter alguma proteção.
11:19
Who'd have thought
277
679260
2000
Quem teria imaginado
11:21
that deciphering could be a dangerous profession?
278
681260
2000
que decifrar poderia ser uma profissão perigosa?
11:23
What does this result really show?
279
683260
2000
O que este resultado realmente mostra?
11:25
It shows that the Indus script
280
685260
2000
Ele mostra que a escritura do Indo
11:27
shares an important property of language.
281
687260
2000
compartilha uma importante propriedade da língua.
11:29
So, as the old saying goes,
282
689260
2000
Então, como diz o velho adágio,
11:31
if it looks like a linguistic script
283
691260
2000
se parece com um escrito linguístico
11:33
and it acts like a linguistic script,
284
693260
2000
e age como um escrito linguístico,
11:35
then perhaps we may have a linguistic script on our hands.
285
695260
3000
então, talvez tenhamos um escrito linguístico em nossas mãos.
11:38
What other evidence is there
286
698260
2000
Que outra evidência existe
11:40
that the script could actually encode language?
287
700260
2000
de que a escritura poderia realmente codificar uma língua?
11:42
Well linguistic scripts can actually encode multiple languages.
288
702260
3000
Bem, escritos linguísticos podem realmente codificar múltiplas línguas.
11:45
So for example, here's the same sentence written in English
289
705260
3000
Por exemplo, aqui está a uma sentença escrita em inglês
11:48
and the same sentence written in Dutch
290
708260
2000
e a mesma sentença escrita em holandês,
11:50
using the same letters of the alphabet.
291
710260
2000
usando as mesmas letras do alfabeto.
11:52
If you don't know Dutch and you only know English
292
712260
3000
Se você não conhece holandês e conhece somente inglês
11:55
and I give you some words in Dutch,
293
715260
2000
e eu lhe dou algumas palavras em holandês,
11:57
you'll tell me that these words contain
294
717260
2000
você me dirá que essas palavras contêm
11:59
some very unusual patterns.
295
719260
2000
alguns padrões muito incomuns.
12:01
Some things are not right,
296
721260
2000
Algums coisas não estão certas,
12:03
and you'll say these words are probably not English words.
297
723260
3000
e você dirá que essas palavras são provavelmente não inglesas.
12:06
The same thing happens in the case of the Indus script.
298
726260
2000
A mesma coisa acontece no caso da escritura do Indo.
12:08
The computer found several texts --
299
728260
2000
O computador encontrou vários textos --
12:10
two of them are shown here --
300
730260
2000
dois deles são mostrados aqui --
12:12
that have very unusual patterns.
301
732260
2000
que têm padrões muito incomuns.
12:14
So for example the first text:
302
734260
2000
Por exemplo, o primeiro texto:
12:16
there's a doubling of this jar-shaped sign.
303
736260
3000
há um par desse signo em forma de jarra.
12:19
This sign is the most frequently-occurring sign
304
739260
2000
Este é o signo que mais frequentemente ocorre
12:21
in the Indus script,
305
741260
2000
na escritura do Indo,
12:23
and it's only in this text
306
743260
2000
e é apenas neste texto
12:25
that it occurs as a doubling pair.
307
745260
2000
que ele ocorre como um par.
12:27
Why is that the case?
308
747260
2000
Por que isso se apresenta assim?
12:29
We went back and looked at where these particular texts were found,
309
749260
3000
Voltamos e observamos onde estes textos específicos foram encontrados,
12:32
and it turns out that they were found
310
752260
2000
e acontece que eles foram encontrados
12:34
very, very far away from the Indus Valley.
311
754260
2000
muito, muito distantes do Vale do Indo.
12:36
They were found in present day Iraq and Iran.
312
756260
3000
Foram encontrados no que é atualmente o Iraque e o Irã.
12:39
And why were they found there?
313
759260
2000
E por que foram encontrados lá?
12:41
What I haven't told you is that
314
761260
2000
O que não lhes contei é que
12:43
the Indus people were very, very enterprising.
315
763260
2000
o povo do Indo era muito, muito empreendedor.
12:45
They used to trade with people pretty far away from where they lived,
316
765260
3000
Eles costumavam comerciar com povos muito distantes de onde eles viviam.
12:48
and so in this case, they were traveling by sea
317
768260
3000
E assim, neste caso, eles estavam viajando pelo mar
12:51
all the way to Mesopotamia, present-day Iraq.
318
771260
3000
todo o caminho para a Mesopotâmia, atualmente Iraque.
12:54
And what seems to have happened here
319
774260
2000
E o que parece ter acontecido aqui
12:56
is that the Indus traders, the merchants,
320
776260
3000
é que os comerciantes do Indo, os mercadores,
12:59
were using this script to write a foreign language.
321
779260
3000
estavam usando esta escrita pra grafar uma língua estrangeira.
13:02
It's just like our English and Dutch example.
322
782260
2000
É exatamente como nosso exemplo de inglês e holandês.
13:04
And that would explain why we have these strange patterns
323
784260
2000
E isso explicaria por que temos estes padrões estranhos
13:06
that are very different from the kinds of patterns you see in the text
324
786260
3000
que são muito diferentes dos tipos de padrões que se observam nos textos
13:09
that are found within the Indus Valley.
325
789260
3000
que são encontrados dentro do Vale do Indo.
13:12
This suggests that the same script, the Indus script,
326
792260
2000
Isto sugere que o mesmo escrito, a escritura do Indo,
13:14
could be used to write different languages.
327
794260
3000
poderia ser usada para escrever diferentes línguas.
13:17
The results we have so far seem to point to the conclusion
328
797260
3000
Os resultados que temos até agora parecem apontar para a conclusão
13:20
that the Indus script probably does represent language.
329
800260
3000
de que a escritura do Indo provavelmente representa uma língua.
13:23
If it does represent language,
330
803260
2000
Se ela realmente representa uma língua,
13:25
then how do we read the symbols?
331
805260
2000
então, como lemos os símbolos?
13:27
That's our next big challenge.
332
807260
2000
Este é o nosso próximo grande desafio.
13:29
So you'll notice that many of the symbols
333
809260
2000
Vocês perceberam que muitos dos símbolos
13:31
look like pictures of humans, of insects,
334
811260
2000
parecem desenhos de humanos, de insetos,
13:33
of fishes, of birds.
335
813260
3000
de peixes, de pássaros.
13:36
Most ancient scripts
336
816260
2000
Muitos escritos antigos
13:38
use the rebus principle,
337
818260
2000
usam o princípio do rébus,
13:40
which is, using pictures to represent words.
338
820260
3000
que é usar gravuras para representar palavras.
13:43
So as an example, here's a word.
339
823260
3000
Então, como um exemplo, aqui está uma palavra.
13:46
Can you write it using pictures?
340
826260
2000
Vocês podem escrevê-la usando gravuras?
13:48
I'll give you a couple seconds.
341
828260
2000
Vou dar-lhes alguns segundos.
13:50
Got it?
342
830260
2000
Conseguiram?
13:52
Okay. Great.
343
832260
2000
OK. Ótimo.
13:54
Here's my solution.
344
834260
2000
Aqui está minha solução.
13:56
You could use the picture of a bee followed by a picture of a leaf --
345
836260
2000
Você poderia usar o desenho de uma abelha (bee > bi) seguido pelo desenho de uma folha (leaf > lif) --
13:58
and that's "belief," right.
346
838260
2000
e isto forma "crença" (belief > bilif), certo?
14:00
There could be other solutions.
347
840260
2000
Poderia haver outras soluções.
14:02
In the case of the Indus script,
348
842260
2000
No caso da escritura do Indo,
14:04
the problem is the reverse.
349
844260
2000
o problema está invertido.
14:06
You have to figure out the sounds of each of these pictures
350
846260
3000
Você tem que imaginar os sons de cada uma destas gravuras
14:09
such that the entire sequence makes sense.
351
849260
2000
de modo que a sequência inteira faça sentido.
14:11
So this is just like a crossword puzzle,
352
851260
3000
Então, é como se isto fosse apenas um quebra-cabeças,
14:14
except that this is the mother of all crossword puzzles
353
854260
3000
a não ser pelo fato de que aqui está a mãe de todos os quebra-cabeças,
14:17
because the stakes are so high if you solve it.
354
857260
4000
porque o que está em jogo é muito alto se você solucioná-lo.
14:21
My colleagues, Iravatham Mahadevan and Asko Parpola,
355
861260
3000
Meus colegas, Iravatham Mahadevan e Asko Parpola,
14:24
have been making some headway on this particular problem.
356
864260
2000
têm tido algum progresso neste problema específico.
14:26
And I'd like to give you a quick example of Parpola's work.
357
866260
2000
E, gostaria de apresentar-lhes um rápido exemplo do trabalho de Parpola.
14:28
Here's a really short text.
358
868260
2000
Aqui está um trecho realmente curto.
14:30
It contains seven vertical strokes followed by this fish-like sign.
359
870260
3000
Ele contém sete traços verticais seguidos deste signo em forma de peixe.
14:33
And I want to mention that these seals were used
360
873260
2000
E quero mencionar que estes selos eram usados
14:35
for stamping clay tags
361
875260
2000
para estampar etiquetas de argila
14:37
that were attached to bundles of goods,
362
877260
2000
que eram anexadas a fardos de mercadorias,
14:39
so it's quite likely that these tags, at least some of them,
363
879260
3000
então, é muito provavel que estas etiquetas, ao menos algumas delas,
14:42
contain names of merchants.
364
882260
2000
contenham nomes dos mercadores.
14:44
And it turns out that in India
365
884260
2000
E acontece que na Índia
14:46
there's a long tradition
366
886260
2000
existe uma longa tradição
14:48
of names being based on horoscopes
367
888260
2000
de nomes serem baseados em horóscopos
14:50
and star constellations present at the time of birth.
368
890260
3000
e constelações presentes à época do nascimento.
14:53
In Dravidian languages,
369
893260
2000
Nas línguas dravídicas,
14:55
the word for fish is "meen"
370
895260
2000
a palavra para peixe é "meen"
14:57
which happens to sound just like the word for star.
371
897260
3000
que soa exatamente igual à palavra para estrela.
15:00
And so seven stars
372
900260
2000
Então sete estrelas
15:02
would stand for "elu meen,"
373
902260
2000
seriam representadas por "elu meen"
15:04
which is the Dravidian word
374
904260
2000
que é a palavra dravídica
15:06
for the Big Dipper star constellation.
375
906260
2000
para Big Dipper - conjunto de sete estrelas na constelação da Ursa Maior.
15:08
Similarly, there's another sequence of six stars,
376
908260
3000
Da mesma forma, há uma outra sequência de seis estrelas,
15:11
and that translates to "aru meen,"
377
911260
2000
e isso se traduz por "aru meen"
15:13
which is the old Dravidian name
378
913260
2000
que é o antigo nome dravídico
15:15
for the star constellation Pleiades.
379
915260
2000
para a constelação de Plêiades.
15:17
And finally, there's other combinations,
380
917260
3000
Finalmente, há outras combinações,
15:20
such as this fish sign with something that looks like a roof on top of it.
381
920260
3000
tal como este signo em forma de peixe com algo que parece um telhado no topo.
15:23
And that could be translated into "mey meen,"
382
923260
3000
E ele poderia ser traduzido como "mey meen"
15:26
which is the old Dravidian name for the planet Saturn.
383
926260
3000
que é o antigo nome dravídico para o planeta Saturno.
15:29
So that was pretty exciting.
384
929260
2000
Então, isto foi muito excitante.
15:31
It looks like we're getting somewhere.
385
931260
2000
Parece que estamos conseguindo alguma coisa.
15:33
But does this prove
386
933260
2000
Mas isto prova
15:35
that these seals contain Dravidian names
387
935260
2000
que estes selos contêm nomes dravídicos
15:37
based on planets and star constellations?
388
937260
2000
baseados em planetas e constelações?
15:39
Well not yet.
389
939260
2000
Bem, não ainda.
15:41
So we have no way of validating
390
941260
2000
Então, não temos como validar
15:43
these particular readings,
391
943260
2000
estas leituras específicas,
15:45
but if more and more of these readings start making sense,
392
945260
3000
mas, se mais e mais dessas leituras começarem a fazer sentido
15:48
and if longer and longer sequences
393
948260
2000
e se sequências cada vez mais longas
15:50
appear to be correct,
394
950260
2000
parecerem estar corretas,
15:52
then we know that we are on the right track.
395
952260
2000
então sabemos que estamos no caminho certo.
15:54
Today,
396
954260
2000
Hoje,
15:56
we can write a word such as TED
397
956260
3000
podemos escrever uma palavra como TED
15:59
in Egyptian hieroglyphics and in cuneiform script,
398
959260
3000
em hieroglifos egípcios ou na escrita cuneiforme
16:02
because both of these were deciphered
399
962260
2000
porque ambos foram decifrados
16:04
in the 19th century.
400
964260
2000
no século XIX.
16:06
The decipherment of these two scripts
401
966260
2000
Decifrar essas duas escritas
16:08
enabled these civilizations to speak to us again directly.
402
968260
3000
possibilitou a essas duas civilizações falar de novo conosco diretamente
16:11
The Mayans
403
971260
2000
Os Maias
16:13
started speaking to us in the 20th century,
404
973260
2000
começaram a falar conosco no século XX,
16:15
but the Indus civilization remains silent.
405
975260
3000
mas a civilização do Indo permanece silenciosa.
16:18
Why should we care?
406
978260
2000
Por que deveríamos nos importar?
16:20
The Indus civilization does not belong
407
980260
2000
A civilização do Indo não pertence
16:22
to just the South Indians or the North Indians
408
982260
2000
apenas aos indianos do Sul ou do Norte
16:24
or the Pakistanis;
409
984260
2000
ou aos paquistaneses;
16:26
it belongs to all of us.
410
986260
2000
ela pertence a todos nós.
16:28
These are our ancestors --
411
988260
2000
Esses são nossos ancestrais --
16:30
yours and mine.
412
990260
2000
seus e meus.
16:32
They were silenced
413
992260
2000
Eles foram silenciados
16:34
by an unfortunate accident of history.
414
994260
2000
por um acidente histórico infeliz.
16:36
If we decipher the script,
415
996260
2000
Se decifrássemos a escrita,
16:38
we would enable them to speak to us again.
416
998260
2000
tornaríamos possível para eles falar conosco novamente.
16:40
What would they tell us?
417
1000260
3000
O que eles nos diriam?
16:43
What would we find out about them? About us?
418
1003260
3000
O que descobriríamos sobre eles? Sobre nós?
16:46
I can't wait to find out.
419
1006260
3000
Mal posso esperar para descobrir.
16:49
Thank you.
420
1009260
2000
Obrigado.
16:51
(Applause)
421
1011260
4000
(Aplausos)
Sobre este site

Este site apresentará a você vídeos do YouTube que são úteis para o aprendizado do inglês. Você verá aulas de inglês ministradas por professores de primeira linha de todo o mundo. Clique duas vezes nas legendas em inglês exibidas em cada página de vídeo para reproduzir o vídeo a partir daí. As legendas rolarão em sincronia com a reprodução do vídeo. Se você tiver algum comentário ou solicitação, por favor, entre em contato conosco usando este formulário de contato.

https://forms.gle/WvT1wiN1qDtmnspy7