Rajesh Rao: Computing a Rosetta Stone for the Indus script

1,206,714 views ・ 2011-06-28

TED


Dubbelklik op de Engelse ondertitels hieronder om de video af te spelen.

Vertaald door: Ellen Westenbrink Nagekeken door: Els De Keyser
00:15
I'd like to begin with a thought experiment.
0
15260
3000
Ik wil beginnen met een gedachtenexperiment.
00:19
Imagine that it's 4,000 years into the future.
1
19260
3000
Stel je voor dat het over 4000 jaar is, in de toekomst.
00:22
Civilization as we know it
2
22260
2000
Onze beschaving van nu
00:24
has ceased to exist --
3
24260
2000
bestaat niet meer.
00:26
no books,
4
26260
2000
Geen boeken,
00:28
no electronic devices,
5
28260
3000
geen elektronische apparaten,
00:31
no Facebook or Twitter.
6
31260
3000
geen Facebook of Twitter.
00:34
All knowledge of the English language and the English alphabet
7
34260
3000
Alle kennis van de Engelse taal en het Engelse alfabet
00:37
has been lost.
8
37260
2000
is verloren gegaan.
00:39
Now imagine archeologists
9
39260
2000
Dan zijn er archeologen
00:41
digging through the rubble of one of our cities.
10
41260
2000
die in de ruïnes van een van onze steden graven.
00:43
What might they find?
11
43260
2000
Wat zouden ze vinden?
00:45
Well perhaps some rectangular pieces of plastic
12
45260
3000
Misschien wat rechthoekige stukjes plastic
00:48
with strange symbols on them.
13
48260
3000
met vreemde symbolen erop.
00:51
Perhaps some circular pieces of metal.
14
51260
3000
Misschien wat cirkelvormige stukjes metaal.
00:54
Maybe some cylindrical containers
15
54260
2000
Misschien wat cylindervormige houders
00:56
with some symbols on them.
16
56260
2000
met wat symbolen erop.
00:58
And perhaps one archeologist becomes an instant celebrity
17
58260
3000
En misschien wordt een van de archeologen wel wereldberoemd
01:01
when she discovers --
18
61260
2000
door haar ontdekking,
01:03
buried in the hills somewhere in North America --
19
63260
2000
ergens in de heuvels van Noord-Amerika,
01:05
massive versions of these same symbols.
20
65260
3000
van enorme versies van diezelfde symbolen.
01:10
Now let's ask ourselves,
21
70260
2000
Laten we ons eens afvragen
01:12
what could such artifacts say about us
22
72260
3000
wat dat soort voorwerpen over ons vertellen
01:15
to people 4,000 years into the future?
23
75260
3000
aan mensen die over 4000 jaar leven.
01:18
This is no hypothetical question.
24
78260
2000
Dat is geen hypothetische vraag.
01:20
In fact, this is exactly the kind of question we're faced with
25
80260
3000
Het is zelfs precies de soort vraag die we hebben
01:23
when we try to understand the Indus Valley civilization,
26
83260
3000
als we proberen de beschaving van de Indusvallei te begrijpen
01:26
which existed 4,000 years ago.
27
86260
2000
die 4000 jaar geleden bestond.
01:28
The Indus civilization was roughly contemporaneous
28
88260
3000
De Indusbeschaving viel ongeveer samen
01:31
with the much better known Egyptian and the Mesopotamian civilizations,
29
91260
3000
met de beter bekende Egyptische en Mesopotamische beschavingen,
01:34
but it was actually much larger than either of these two civilizations.
30
94260
3000
maar was veel groter dan elk van die twee beschavingen.
01:37
It occupied the area
31
97260
2000
Het ging om een gebied
01:39
of approximately one million square kilometers,
32
99260
2000
van ongeveer een miljoen vierkante kilometer
01:41
covering what is now Pakistan,
33
101260
2000
op de plaats van het huidige Pakistan,
01:43
Northwestern India
34
103260
2000
Noordwest-India,
01:45
and parts of Afghanistan and Iran.
35
105260
2000
en delen van Afghanistan en Iran.
01:47
Given that it was such a vast civilization,
36
107260
2000
Omdat het zo'n grote beschaving was,
01:49
you might expect to find really powerful rulers, kings,
37
109260
4000
zou je misschien sterke leiders verwachten, koningen,
01:53
and huge monuments glorifying these powerful kings.
38
113260
3000
en enorme monumenten ter ere van die sterke koningen.
01:56
In fact,
39
116260
2000
In werkelijkheid
01:58
what archeologists have found is none of that.
40
118260
2000
hebben archeologen niets van dat alles gevonden.
02:00
They've found small objects such as these.
41
120260
3000
Ze hebben kleine voorwerpen gevonden, zoals deze.
02:03
Here's an example of one of these objects.
42
123260
3000
Dit is een voorbeeld van zo'n voorwerp.
02:06
Well obviously this is a replica.
43
126260
2000
Het is natuurlijk een replica.
02:08
But who is this person?
44
128260
3000
Maar wie is dit?
02:11
A king? A god?
45
131260
2000
Een koning? Een god?
02:13
A priest?
46
133260
2000
Een priester?
02:15
Or perhaps an ordinary person
47
135260
2000
Of misschien gewoon iemand
02:17
like you or me?
48
137260
2000
zoals jij of ik?
02:19
We don't know.
49
139260
2000
We weten het niet.
02:21
But the Indus people also left behind artifacts with writing on them.
50
141260
3000
Maar het Indusvolk heeft ook voorwerpen achtergelaten waarop is geschreven.
02:24
Well no, not pieces of plastic,
51
144260
2000
Geen stukjes plastic,
02:26
but stone seals, copper tablets,
52
146260
3000
maar stenen zegels, koperen tabletten,
02:29
pottery and, surprisingly,
53
149260
2000
aardewerk en, heel verrassend,
02:31
one large sign board,
54
151260
2000
één groot bord
02:33
which was found buried near the gate of a city.
55
153260
2000
dat in de grond bij de poort van een stad is gevonden.
02:35
Now we don't know if it says Hollywood,
56
155260
2000
We weten niet of er Hollywood op staat
02:37
or even Bollywood for that matter.
57
157260
2000
of misschien zelfs Bollywood.
02:39
In fact, we don't even know
58
159260
2000
We weten niet eens
02:41
what any of these objects say,
59
161260
2000
wat er op al deze voorwerpen staat.
02:43
and that's because the Indus script is undeciphered.
60
163260
3000
Dat komt doordat het Indusschrift niet is ontcijferd.
02:46
We don't know what any of these symbols mean.
61
166260
2000
We weten niet wat deze symbolen betekenen.
02:48
The symbols are most commonly found on seals.
62
168260
3000
De symbolen komen vooral voor op zegels.
02:51
So you see up there one such object.
63
171260
2000
Hier zie je zo'n voorwerp.
02:53
It's the square object with the unicorn-like animal on it.
64
173260
3000
Het vierkante ding met het eenhoornachtige dier erop.
02:56
Now that's a magnificent piece of art.
65
176260
2000
Dat is een mooi stukje kunst.
02:58
So how big do you think that is?
66
178260
2000
Hoe groot denk je dat het is?
03:00
Perhaps that big?
67
180260
2000
Zo groot misschien?
03:02
Or maybe that big?
68
182260
2000
Of misschien zo groot?
03:04
Well let me show you.
69
184260
2000
Ik ga het laten zien.
03:07
Here's a replica of one such seal.
70
187260
3000
Dit is een replica van een van de zegels.
03:10
It's only about one inch by one inch in size --
71
190260
2000
Het is ongeveer 2,5 centimeter in het vierkant,
03:12
pretty tiny.
72
192260
2000
behoorlijk klein.
03:14
So what were these used for?
73
194260
2000
Waar werden ze voor gebruikt?
03:16
We know that these were used for stamping clay tags
74
196260
3000
We weten dat ze werken gebruikt voor het stempelen van kleitabletjes
03:19
that were attached to bundles of goods that were sent from one place to the other.
75
199260
3000
die aan bundels goederen werden bevestigd die naar een andere plaats werden gestuurd.
03:22
So you know those packing slips you get on your FedEx boxes?
76
202260
3000
Ken je de verzendbrieven die bij pakketjes van de koerier zitten?
03:25
These were used to make those kinds of packing slips.
77
205260
3000
Deze dingen werden gebruikt voor dat soort verzendbrieven.
03:28
You might wonder what these objects contain
78
208260
3000
Je vraagt je misschien af wat er op die voorwerpen staat
03:31
in terms of their text.
79
211260
2000
wat betreft de tekst.
03:33
Perhaps they're the name of the sender
80
213260
2000
Misschien is het de naam van de afzender
03:35
or some information about the goods
81
215260
2000
of informatie over de goederen
03:37
that are being sent from one place to the other -- we don't know.
82
217260
3000
die naar een andere plaats worden verzonden. We weten het niet.
03:40
We need to decipher the script to answer that question.
83
220260
2000
We moeten het schrift ontcijferen om die vraag te beantwoorden.
03:42
Deciphering the script
84
222260
2000
Het ontcijferen van het schrift
03:44
is not just an intellectual puzzle;
85
224260
2000
is niet zomaar een intellectuele puzzel.
03:46
it's actually become a question
86
226260
2000
Het is een vraag geworden
03:48
that's become deeply intertwined
87
228260
2000
die nauw verbonden is geraakt
03:50
with the politics and the cultural history of South Asia.
88
230260
3000
met de politiek en de culturele geschiedenis van Zuid-Azië.
03:53
In fact, the script has become a battleground of sorts
89
233260
3000
Het schrift is een soort strijdtoneel geworden
03:56
between three different groups of people.
90
236260
2000
tussen drie verschillende groepen mensen.
03:58
First, there's a group of people
91
238260
2000
Allereerst is er een groep mensen
04:00
who are very passionate in their belief
92
240260
2000
die gepassioneerd geloven
04:02
that the Indus script
93
242260
2000
dat het Indusschrift
04:04
does not represent a language at all.
94
244260
2000
helemaal geen taal vertegenwoordigt.
04:06
These people believe that the symbols
95
246260
2000
Deze mensen geloven dat de symbolen
04:08
are very similar to the kind of symbols you find on traffic signs
96
248260
3000
lijken op het soort symbolen dat je op verkeersborden ziet
04:11
or the emblems you find on shields.
97
251260
3000
of de emblemen op wapens.
04:14
There's a second group of people
98
254260
2000
Dan is er een tweede groep mensen
04:16
who believe that the Indus script represents an Indo-European language.
99
256260
3000
die geloven dat het Indusschrift een Indo-Europese taal vertegenwoordigt.
04:19
If you look at a map of India today,
100
259260
2000
Als je kijkt naar een kaart van het huidige India
04:21
you'll see that most of the languages spoken in North India
101
261260
3000
zie je dat de meeste talen die in Noord-India worden gesproken
04:24
belong to the Indo-European language family.
102
264260
3000
bij de Indo-Europese taalfamilie horen.
04:27
So some people believe that the Indus script
103
267260
2000
Dus sommige mensen geloven dat het Indusscript
04:29
represents an ancient Indo-European language such as Sanskrit.
104
269260
3000
een oude Indo-Europese taal zoals Sanskriet vertegenwoordigt.
04:32
There's a last group of people
105
272260
2000
Ten slotte is er een groep mensen
04:34
who believe that the Indus people
106
274260
3000
die geloven dat het Indusvolk
04:37
were the ancestors of people living in South India today.
107
277260
3000
de voorouders waren van mensen die tegenwoordig in Zuid-India wonen.
04:40
These people believe that the Indus script
108
280260
2000
Die mensen geloven dat het Indusscript
04:42
represents an ancient form
109
282260
2000
een oude vorm vertegenwoordigt
04:44
of the Dravidian language family,
110
284260
2000
van de Dravidische taalfamilie
04:46
which is the language family spoken in much of South India today.
111
286260
3000
de taalfamilie die nu in een groot deel van Zuid-India wordt gesproken.
04:49
And the proponents of this theory
112
289260
2000
De voorstanders van deze theorie
04:51
point to that small pocket of Dravidian-speaking people in the North,
113
291260
3000
wijzen naar dat kleine gebied in het Noorden waar Dravidisch wordt gesproken
04:54
actually near Afghanistan,
114
294260
2000
in de buurt van Afghanistan
04:56
and they say that perhaps, sometime in the past,
115
296260
3000
en ze zeggen dat misschien ooit vroeger
04:59
Dravidian languages were spoken all over India
116
299260
3000
overal in India Dravidische talen werden gesproken
05:02
and that this suggests
117
302260
2000
en dat het dus mogelijk is
05:04
that the Indus civilization is perhaps also Dravidian.
118
304260
3000
dat de Indusbeschaving misschien ook Dravidisch is.
05:07
Which of these hypotheses can be true?
119
307260
3000
Welk van deze hypotheses kan kloppen?
05:10
We don't know, but perhaps if you deciphered the script,
120
310260
2000
We weten het niet, maar als je het schrift ontcijfert,
05:12
you would be able to answer this question.
121
312260
2000
kun je die vraag misschien beantwoorden.
05:14
But deciphering the script is a very challenging task.
122
314260
2000
Maar het ontcijferen van het schrift is een enorme uitdaging.
05:16
First, there's no Rosetta Stone.
123
316260
2000
Ten eerste is er geen Steen van Rosetta.
05:18
I don't mean the software;
124
318260
2000
Ik heb het niet over de software
05:20
I mean an ancient artifact
125
320260
2000
maar over een oud voorwerp
05:22
that contains in the same text
126
322260
2000
waarop dezelfde tekst staat
05:24
both a known text and an unknown text.
127
324260
3000
in een bekende taal en een onbekende taal.
05:27
We don't have such an artifact for the Indus script.
128
327260
3000
Zo'n voorwerp hebben we niet voor het Indusschrift.
05:30
And furthermore, we don't even know what language they spoke.
129
330260
3000
Bovendien weten we niet eens welke taal ze spraken.
05:33
And to make matters even worse,
130
333260
2000
En om het nog erger te maken,
05:35
most of the text that we have are extremely short.
131
335260
2000
zijn de meeste teksten die we hebben heel kort.
05:37
So as I showed you, they're usually found on these seals
132
337260
2000
Ik liet al zien dat ze meestal op deze zegels staan,
05:39
that are very, very tiny.
133
339260
2000
die heel erg klein zijn.
05:41
And so given these formidable obstacles,
134
341260
2000
Met deze flinke hindernissen
05:43
one might wonder and worry
135
343260
2000
kun je je afvragen
05:45
whether one will ever be able to decipher the Indus script.
136
345260
3000
of het ons ooit zal lukken om het Indusschrift te ontcijferen.
05:48
In the rest of my talk,
137
348260
2000
In de rest van mijn voordracht
05:50
I'd like to tell you about how I learned to stop worrying
138
350260
2000
wil ik jullie vertellen waarom ik me daar nu geen zorgen meer over maak
05:52
and love the challenge posed by the Indus script.
139
352260
2000
en ik van de uitdaging van het Indusscript ben gaan houden.
05:54
I've always been fascinated by the Indus script
140
354260
3000
Ik ben al gefascineerd door het Indusscript
05:57
ever since I read about it in a middle school textbook.
141
357260
2000
sinds ik er op school in een lesboek over las.
05:59
And why was I fascinated?
142
359260
2000
Waarom vond ik het zo fascinerend?
06:01
Well it's the last major undeciphered script in the ancient world.
143
361260
4000
Het is het laatste belangrijke niet-ontcijferde schrift uit de oudheid.
06:05
My career path led me to become a computational neuroscientist,
144
365260
3000
Ik ben uiteindelijk computer-neurowetenschapper geworden,
06:08
so in my day job,
145
368260
2000
dus in mijn gewone baan
06:10
I create computer models of the brain
146
370260
2000
maak ik computermodellen van de hersenen
06:12
to try to understand how the brain makes predictions,
147
372260
3000
om te leren begrijpen hoe de hersenen voorspellingen doen,
06:15
how the brain makes decisions,
148
375260
2000
hoe de hersenen beslissingen nemen,
06:17
how the brain learns and so on.
149
377260
2000
hoe de hersenen leren, enzovoort.
06:19
But in 2007, my path crossed again with the Indus script.
150
379260
3000
Maar in 2007 kruiste het Indusschrift mijn pad weer.
06:22
That's when I was in India,
151
382260
2000
Ik was toen in India
06:24
and I had the wonderful opportunity
152
384260
2000
en kreeg de prachtige kans
06:26
to meet with some Indian scientists
153
386260
2000
om een aantal Indiase wetenschappers te ontmoeten
06:28
who were using computer models to try to analyze the script.
154
388260
3000
die het schrift probeerden te analyseren met computermodellen.
06:31
And so it was then that I realized
155
391260
2000
Toen realiseerde ik me
06:33
there was an opportunity for me to collaborate with these scientists,
156
393260
3000
dat ik de mogelijkheid had om met die wetenschappers samen te werken.
06:36
and so I jumped at that opportunity.
157
396260
2000
Ik greep die kans meteen aan.
06:38
And I'd like to describe some of the results that we have found.
158
398260
2000
Ik wil wat van onze resultaten beschrijven.
06:40
Or better yet, let's all collectively decipher.
159
400260
3000
Of nog beter: laten we samen gaan ontcijferen.
06:43
Are you ready?
160
403260
2000
Zijn jullie er klaar voor?
06:45
The first thing that you need to do when you have an undeciphered script
161
405260
3000
Het eerste wat je moet doen met een niet-ontcijferd schrift
06:48
is try to figure out the direction of writing.
162
408260
2000
is uitzoeken wat de schrijfrichting is.
06:50
Here are two texts that contain some symbols on them.
163
410260
3000
Dit zijn twee teksten met wat symbolen erin.
06:53
Can you tell me
164
413260
2000
Kan je me vertellen
06:55
if the direction of writing is right to left or left to right?
165
415260
3000
of de schrijfrichting van rechts naar links of van links naar rechts is?
06:58
I'll give you a couple of seconds.
166
418260
3000
Je krijgt een paar seconden.
07:01
Okay. Right to left, how many? Okay.
167
421260
3000
Oke. Hoeveel denken van rechts naar links?
07:04
Okay. Left to right?
168
424260
2000
Oke. Van links naar rechts?
07:06
Oh, it's almost 50/50. Okay.
169
426260
2000
Het is bijna 50/50.
07:08
The answer is:
170
428260
2000
Het antwoord is:
07:10
if you look at the left-hand side of the two texts,
171
430260
2000
Als je naar de linkerkant van de twee teksten kijkt,
07:12
you'll notice that there's a cramping of signs,
172
432260
3000
zie je dat de tekens dichter bij elkaar staan.
07:15
and it seems like 4,000 years ago,
173
435260
2000
Het lijkt erop dat 4000 jaar geleden,
07:17
when the scribe was writing from right to left,
174
437260
2000
toen de schrijver van rechts naar links schreef,
07:19
they ran out of space.
175
439260
2000
er niet genoeg ruimte was.
07:21
And so they had to cram the sign.
176
441260
2000
Het teken werd erbij gepropt.
07:23
One of the signs is also below the text on the top.
177
443260
2000
Een van de tekens staat ook onder de tekst aan de bovenkant.
07:25
This suggests the direction of writing
178
445260
2000
Het lijkt er dus op dat de schrijfrichting
07:27
was probably from right to left,
179
447260
2000
waarschijnlijk van rechts naar links was.
07:29
and so that's one of the first things we know,
180
449260
2000
Dat is een van de eerste dingen die we weten,
07:31
that directionality is a very key aspect of linguistic scripts.
181
451260
3000
dat richting een belangrijk aspect is van linguïstisch schrift.
07:34
And the Indus script now has
182
454260
2000
Het Indusschrift heeft dus
07:36
this particular property.
183
456260
2000
deze bepaalde eigenschap.
07:38
What other properties of language does the script show?
184
458260
2000
Welke eigenschappen van taal zouden we kunnen zien?
07:40
Languages contain patterns.
185
460260
2000
Talen bevatten patronen.
07:42
If I give you the letter Q
186
462260
2000
Als ik je de letter Q geef
07:44
and ask you to predict the next letter, what do you think that would be?
187
464260
3000
en je vraag te voorspellen wat de volgende letter is, wat denk je dan?
07:47
Most of you said U, which is right.
188
467260
2000
De meesten zeiden U, en dat klopt.
07:49
Now if I asked you to predict one more letter,
189
469260
2000
Als ik je ook de volgende letter zou vragen,
07:51
what do you think that would be?
190
471260
2000
welke zou dat dan zijn, denk je?
07:53
Now there's several thoughts. There's E. It could be I. It could be A,
191
473260
3000
Er zijn verschillende mogelijkheden. E, of I. Misschien A.
07:56
but certainly not B, C or D, right?
192
476260
3000
Maar zeker niet B, C of D, of wel?
07:59
The Indus script also exhibits similar kinds of patterns.
193
479260
3000
Het Indusschrift heeft net zulke patronen.
08:02
There's a lot of text that start with this diamond-shaped symbol.
194
482260
3000
Er zijn veel teksten die beginnen met dit ruitvormige symbool.
08:05
And this in turn tends to be followed
195
485260
2000
En dat wordt op zijn beurt vaak gevolgd
08:07
by this quotation marks-like symbol.
196
487260
2000
door dit symbool dat lijkt op aanhalingstekens.
08:09
And this is very similar to a Q and U example.
197
489260
2000
Net zoals het voorbeeld van de Q en de U.
08:11
This symbol can in turn be followed
198
491260
2000
Dit symbool kan weer worden gevolgd
08:13
by these fish-like symbols and some other signs,
199
493260
3000
door deze visachtige symbolen en wat andere tekens,
08:16
but never by these other signs at the bottom.
200
496260
2000
maar nooit door die tekens onderaan.
08:18
And furthermore, there's some signs
201
498260
2000
Daarnaast zijn er wat tekens
08:20
that really prefer the end of texts,
202
500260
2000
die bij voorkeur aan het eind van teksten staan,
08:22
such as this jar-shaped sign,
203
502260
2000
zoals dit komvormige teken.
08:24
and this sign, in fact, happens to be
204
504260
2000
Dit teken is trouwens
08:26
the most frequently occurring sign in the script.
205
506260
2000
het meest voorkomende teken in het schrift.
08:28
Given such patterns, here was our idea.
206
508260
3000
Door deze patronen kregen we een idee.
08:31
The idea was to use a computer
207
511260
2000
Het idee was om een computer te gebruiken
08:33
to learn these patterns,
208
513260
2000
om die patronen te leren.
08:35
and so we gave the computer the existing texts.
209
515260
3000
We gaven de computer de bestaande teksten.
08:38
And the computer learned a statistical model
210
518260
2000
En de computer leerde een statistisch model
08:40
of which symbols tend to occur together
211
520260
2000
van welke symbolen meestal samen voorkomen
08:42
and which symbols tend to follow each other.
212
522260
2000
en welke symbolen meestal op elkaar volgen.
08:44
Given the computer model,
213
524260
2000
Als we het computermodel hebben,
08:46
we can test the model by essentially quizzing it.
214
526260
3000
kunnen we het model testen door het te ondervragen.
08:49
So we could deliberately erase some symbols,
215
529260
2000
We kunnen met opzet wat symbolen wissen
08:51
and we can ask it to predict the missing symbols.
216
531260
3000
en het model vragen de ontbrekende symbolen te voorspellen.
08:54
Here are some examples.
217
534260
3000
Hier zijn wat voorbeelden.
09:00
You may regard this
218
540260
2000
Je kan dit zien
09:02
as perhaps the most ancient game
219
542260
2000
als misschien wel de oudste versie
09:04
of Wheel of Fortune.
220
544260
3000
van het Rad van Fortuin.
09:08
What we found
221
548260
2000
We ontdekten
09:10
was that the computer was successful in 75 percent of the cases
222
550260
2000
dat het de computer in 75 procent van de gevallen lukte
09:12
in predicting the correct symbol.
223
552260
2000
om het juiste symbool te voorspellen.
09:14
In the rest of the cases,
224
554260
2000
In de rest van de gevallen
09:16
typically the second best guess or third best guess was the right answer.
225
556260
3000
was meestal de tweede of derde suggestie het goede antwoord.
09:19
There's also practical use
226
559260
2000
Er is ook een praktisch nut
09:21
for this particular procedure.
227
561260
2000
voor deze procedure.
09:23
There's a lot of these texts that are damaged.
228
563260
2000
Veel teksten zijn beschadigd.
09:25
Here's an example of one such text.
229
565260
2000
Dit is een voorbeeld van zo'n tekst.
09:27
And we can use the computer model now to try to complete this text
230
567260
3000
Met het computermodel kunnen we proberen deze tekst aan te vullen
09:30
and make a best guess prediction.
231
570260
2000
met een zo goed mogelijke voorspelling.
09:32
Here's an example of a symbol that was predicted.
232
572260
3000
Dit is een voorbeeld van een symbool dat is voorspeld.
09:35
And this could be really useful as we try to decipher the script
233
575260
2000
Dit kan erg nuttig zijn als we het schrift proberen te ontcijferen.
09:37
by generating more data that we can analyze.
234
577260
3000
We kunnen meer gegevens genereren om te analyseren.
09:40
Now here's one other thing you can do with the computer model.
235
580260
3000
We kunnen nog iets anders doen met het computermodel.
09:43
So imagine a monkey
236
583260
2000
Stel je een aap voor
09:45
sitting at a keyboard.
237
585260
2000
die achter een toetsenbord zit.
09:47
I think you might get a random jumble of letters that looks like this.
238
587260
3000
Dan krijg je een willekeurige mix van letters die er zo uitziet.
09:50
Such a random jumble of letters
239
590260
2000
Van zo'n willekeurige mix van letters
09:52
is said to have a very high entropy.
240
592260
2000
wordt gezegd dat deze een zeer hoge entropie heeft.
09:54
This is a physics and information theory term.
241
594260
2000
Dat is een term uit de natuurkunde en informatietheorie.
09:56
But just imagine it's a really random jumble of letters.
242
596260
3000
Maar het is gewoon een zeer willekeurige mix van letters.
09:59
How many of you have ever spilled coffee on a keyboard?
243
599260
4000
Wie heeft er wel eens koffie op een toetsenbord geknoeid?
10:03
You might have encountered the stuck-key problem --
244
603260
2000
Dan hebt u misschien wel eens last gehad van een vastzittend toetsenbord.
10:05
so basically the same symbol being repeated over and over again.
245
605260
3000
Hetzelfde symbool wordt dan steeds weer herhaald.
10:08
This kind of a sequence is said to have a very low entropy
246
608260
3000
Zo'n soort reeks heeft een heel lage entropie
10:11
because there's no variation at all.
247
611260
2000
omdat er helemaal geen variatie is.
10:13
Language, on the other hand, has an intermediate level of entropy;
248
613260
3000
Taal heeft daarentegen een gemiddeld entropieniveau,
10:16
it's neither too rigid,
249
616260
2000
niet heel rigide
10:18
nor is it too random.
250
618260
2000
maar ook niet te willekeurig.
10:20
What about the Indus script?
251
620260
2000
Hoe zit het met het Indusschrift?
10:22
Here's a graph that plots the entropies of a whole bunch of sequences.
252
622260
4000
Dit is een grafiek met de entropieën van een heleboel reeksen.
10:26
At the very top you find the uniformly random sequence,
253
626260
2000
Helemaal bovenaan staat de volledig willekeurige reeks
10:28
which is a random jumble of letters --
254
628260
2000
die een willekeurige mix van letters is.
10:30
and interestingly, we also find
255
630260
2000
Wat interessant is, is dat daar ook
10:32
the DNA sequence from the human genome and instrumental music.
256
632260
3000
de DNA-volgorde van het menselijke genoom en instrumentale muziek staan.
10:35
And both of these are very, very flexible,
257
635260
2000
Die zijn allebei heel erg flexibel
10:37
which is why you find them in the very high range.
258
637260
2000
en dus hebben ze een zeer grote variatie.
10:39
At the lower end of the scale,
259
639260
2000
Helemaal onder aan de schaal
10:41
you find a rigid sequence, a sequence of all A's,
260
641260
2000
zie je een rigide reeks, een reeks met alleen A's.
10:43
and you also find a computer program,
261
643260
2000
Daar staat ook een computerprogramma,
10:45
in this case in the language Fortran,
262
645260
2000
in dit geval in de taal Fortran,
10:47
which obeys really strict rules.
263
647260
2000
waarvoor zeer strikte regels gelden.
10:49
Linguistic scripts
264
649260
2000
Linguïstisch schrift
10:51
occupy the middle range.
265
651260
2000
zit in het middelste bereik.
10:53
Now what about the Indus script?
266
653260
2000
Maar hoe zit het met het Indusschrift?
10:55
We found that the Indus script
267
655260
2000
We ontdekten dat het Indusschrift
10:57
actually falls within the range of the linguistic scripts.
268
657260
2000
binnen het bereik van linguïstisch schrift valt.
10:59
When this result was first published,
269
659260
2000
Toen dit resultaat voor het eerst werd gepubliceerd,
11:01
it was highly controversial.
270
661260
3000
was het zeer controversieel.
11:04
There were people who raised a hue and cry,
271
664260
3000
Sommige mensen schreeuwden het haast uit.
11:07
and these people were the ones who believed
272
667260
2000
Dat waren de mensen die geloofden
11:09
that the Indus script does not represent language.
273
669260
3000
dat het Indusschrift geen taal vertegenwoordigt.
11:12
I even started to get some hate mail.
274
672260
2000
Ik kreeg zelfs haatmails.
11:14
My students said
275
674260
2000
Mijn studenten vonden
11:16
that I should really seriously consider getting some protection.
276
676260
3000
dat ik erover moest denken om me te laten beveiligen.
11:19
Who'd have thought
277
679260
2000
Wie had ooit gedacht
11:21
that deciphering could be a dangerous profession?
278
681260
2000
dat ontcijferen zo'n gevaarlijk beroep zou zijn?
11:23
What does this result really show?
279
683260
2000
Wat betekent dit resultaat nu eigenlijk?
11:25
It shows that the Indus script
280
685260
2000
Het betekent dat het Indusschrift
11:27
shares an important property of language.
281
687260
2000
een belangrijke eigenschap van taal deelt.
11:29
So, as the old saying goes,
282
689260
2000
Zoals in het bekende gezegde
11:31
if it looks like a linguistic script
283
691260
2000
'als het eruit ziet als een linguïstisch schrift,
11:33
and it acts like a linguistic script,
284
693260
2000
en het zich gedraagt als een linguïstisch schrift,
11:35
then perhaps we may have a linguistic script on our hands.
285
695260
3000
dan hebben we misschien een linguïstisch schrift te pakken.'
11:38
What other evidence is there
286
698260
2000
Wat is er nog meer voor bewijs
11:40
that the script could actually encode language?
287
700260
2000
dat het schrift een taal zou kunnen coderen?
11:42
Well linguistic scripts can actually encode multiple languages.
288
702260
3000
Linguïstisch schrift kan meerdere talen coderen.
11:45
So for example, here's the same sentence written in English
289
705260
3000
Hier staat bijvoorbeeld een zin die in het Engels is geschreven
11:48
and the same sentence written in Dutch
290
708260
2000
en dezelfde zin die in het Nederlands is geschreven
11:50
using the same letters of the alphabet.
291
710260
2000
met dezelfde letters van het alfabet.
11:52
If you don't know Dutch and you only know English
292
712260
3000
Als je geen Nederlands spreekt en alleen maar Engels,
11:55
and I give you some words in Dutch,
293
715260
2000
en ik je wat Nederlandse woorden laat zien,
11:57
you'll tell me that these words contain
294
717260
2000
zul je zeggen dat er in die woorden
11:59
some very unusual patterns.
295
719260
2000
ongebruikelijke patronen zitten.
12:01
Some things are not right,
296
721260
2000
Sommige dingen kloppen niet
12:03
and you'll say these words are probably not English words.
297
723260
3000
en je zult zeggen dat het waarschijnlijk geen Engelse woorden zijn.
12:06
The same thing happens in the case of the Indus script.
298
726260
2000
Hetzelfde gebeurt bij het Indusschrift.
12:08
The computer found several texts --
299
728260
2000
De computer heeft verschillende teksten gevonden --
12:10
two of them are shown here --
300
730260
2000
dit zijn twee voorbeelden --
12:12
that have very unusual patterns.
301
732260
2000
met zeer ongebruikelijke patronen.
12:14
So for example the first text:
302
734260
2000
Neem bijvoorbeeld de eerste tekst.
12:16
there's a doubling of this jar-shaped sign.
303
736260
3000
Daarin wordt het komvormige teken verdubbeld.
12:19
This sign is the most frequently-occurring sign
304
739260
2000
Dat teken is het meest voorkomende teken
12:21
in the Indus script,
305
741260
2000
in het Indusschrift,
12:23
and it's only in this text
306
743260
2000
en alleen in deze tekst
12:25
that it occurs as a doubling pair.
307
745260
2000
komt het voor als een dubbel paar.
12:27
Why is that the case?
308
747260
2000
Waarom is dat zo?
12:29
We went back and looked at where these particular texts were found,
309
749260
3000
We gingen kijken waar deze teksten zijn gevonden
12:32
and it turns out that they were found
310
752260
2000
en het blijkt dat ze zijn gevonden
12:34
very, very far away from the Indus Valley.
311
754260
2000
ergens heel ver weg van de Indusvallei.
12:36
They were found in present day Iraq and Iran.
312
756260
3000
Ze zijn gevonden in het huidige Irak en Iran.
12:39
And why were they found there?
313
759260
2000
Waarom zijn ze daar gevonden?
12:41
What I haven't told you is that
314
761260
2000
Er is iets wat ik nog niet heb verteld.
12:43
the Indus people were very, very enterprising.
315
763260
2000
Het Indusvolk was heel ondernemend.
12:45
They used to trade with people pretty far away from where they lived,
316
765260
3000
Ze handelden met mensen die behoorlijk ver weg leefden.
12:48
and so in this case, they were traveling by sea
317
768260
3000
In dit geval reisden ze over zee,
12:51
all the way to Mesopotamia, present-day Iraq.
318
771260
3000
helemaal naar Mesopotamië, het huidige Irak.
12:54
And what seems to have happened here
319
774260
2000
En het lijkt erop dat daar
12:56
is that the Indus traders, the merchants,
320
776260
3000
de Indushandelaren, de kooplieden,
12:59
were using this script to write a foreign language.
321
779260
3000
dit schrift gebruikten om een vreemde taal op te schrijven.
13:02
It's just like our English and Dutch example.
322
782260
2000
Net zoals ons voorbeeld met Engels en Nederlands.
13:04
And that would explain why we have these strange patterns
323
784260
2000
Dat zou deze vreemde patronen verklaren
13:06
that are very different from the kinds of patterns you see in the text
324
786260
3000
die erg afwijken van het soort patronen in de teksten
13:09
that are found within the Indus Valley.
325
789260
3000
die zijn gevonden in de Indusvallei.
13:12
This suggests that the same script, the Indus script,
326
792260
2000
Het lijkt er dus op dat hetzelfde schrift, het Indusschrift,
13:14
could be used to write different languages.
327
794260
3000
kon worden gebruikt om verschillende talen op te schrijven.
13:17
The results we have so far seem to point to the conclusion
328
797260
3000
De resultaten tot nu toe lijken op de conclusie te wijzen
13:20
that the Indus script probably does represent language.
329
800260
3000
dat het Indusscript waarschijnlijk inderdaad taal vertegenwoordigt.
13:23
If it does represent language,
330
803260
2000
Dus als het taal vertegenwoordigt,
13:25
then how do we read the symbols?
331
805260
2000
hoe moeten we de symbolen dan lezen?
13:27
That's our next big challenge.
332
807260
2000
Dat is de volgende grote uitdaging.
13:29
So you'll notice that many of the symbols
333
809260
2000
Je ziet dat veel van de symbolen
13:31
look like pictures of humans, of insects,
334
811260
2000
lijken op plaatjes van mensen, van insecten,
13:33
of fishes, of birds.
335
813260
3000
van vissen, van vogels.
13:36
Most ancient scripts
336
816260
2000
De meeste oude schriften
13:38
use the rebus principle,
337
818260
2000
gebruiken het rebusprincipe.
13:40
which is, using pictures to represent words.
338
820260
3000
Er worden plaatjes gebruikt om woorden te vertegenwoordigen.
13:43
So as an example, here's a word.
339
823260
3000
Hier is bijvoorbeeld een woord.
13:46
Can you write it using pictures?
340
826260
2000
Kan je dat met plaatjes schrijven?
13:48
I'll give you a couple seconds.
341
828260
2000
Ik geef je een paar seconden.
13:50
Got it?
342
830260
2000
Heb je het?
13:52
Okay. Great.
343
832260
2000
Oke. Geweldig.
13:54
Here's my solution.
344
834260
2000
Dit is mijn oplossing.
13:56
You could use the picture of a bee followed by a picture of a leaf --
345
836260
2000
Een plaatje van een bij gevolgd door een plaatje van een blad
13:58
and that's "belief," right.
346
838260
2000
vormen in het Engels 'belief'.
14:00
There could be other solutions.
347
840260
2000
Er zijn andere oplossingen mogelijk.
14:02
In the case of the Indus script,
348
842260
2000
In het geval van het Indusschrift
14:04
the problem is the reverse.
349
844260
2000
is het probleem omgekeerd.
14:06
You have to figure out the sounds of each of these pictures
350
846260
3000
Je moet de geluiden van elk van deze plaatjes ontdekken
14:09
such that the entire sequence makes sense.
351
849260
2000
zodat de hele reeks betekenis krijgt.
14:11
So this is just like a crossword puzzle,
352
851260
3000
Het lijkt op een kruiswoordpuzzel,
14:14
except that this is the mother of all crossword puzzles
353
854260
3000
alleen is het de moeder van alle kruiswoordpuzzels,
14:17
because the stakes are so high if you solve it.
354
857260
4000
omdat er zoveel van afhangt als je hem oplost.
14:21
My colleagues, Iravatham Mahadevan and Asko Parpola,
355
861260
3000
Mijn collega's Iravatham Mahadevan en Asko Parpola
14:24
have been making some headway on this particular problem.
356
864260
2000
zijn al een eindje op weg met dit probleem.
14:26
And I'd like to give you a quick example of Parpola's work.
357
866260
2000
Ik geef een kort voorbeeld van Parpola's werk.
14:28
Here's a really short text.
358
868260
2000
Dit is een heel korte tekst.
14:30
It contains seven vertical strokes followed by this fish-like sign.
359
870260
3000
Hij bevat zeven vertikale strepen gevolgd door een visachtig teken.
14:33
And I want to mention that these seals were used
360
873260
2000
Ik moet zeggen dat deze zegels werden gebruikt
14:35
for stamping clay tags
361
875260
2000
voor het stempelen van kleitabletjes
14:37
that were attached to bundles of goods,
362
877260
2000
die werden bevestigd aan bundels goederen.
14:39
so it's quite likely that these tags, at least some of them,
363
879260
3000
Het is dus goed mogelijk dat in elk geval sommige ervan
14:42
contain names of merchants.
364
882260
2000
namen van kooplieden bevatten.
14:44
And it turns out that in India
365
884260
2000
En het blijkt dat er in India
14:46
there's a long tradition
366
886260
2000
een lange traditie is
14:48
of names being based on horoscopes
367
888260
2000
om namen te baseren op horoscopen
14:50
and star constellations present at the time of birth.
368
890260
3000
en constellaties op het moment van de geboorte.
14:53
In Dravidian languages,
369
893260
2000
In Dravidische talen
14:55
the word for fish is "meen"
370
895260
2000
is het woord voor vis 'meen'
14:57
which happens to sound just like the word for star.
371
897260
3000
en dat klinkt precies als het woord voor ster.
15:00
And so seven stars
372
900260
2000
Zeven sterren
15:02
would stand for "elu meen,"
373
902260
2000
staat dus voor 'elu meen'
15:04
which is the Dravidian word
374
904260
2000
en dat is het Dravidische woord
15:06
for the Big Dipper star constellation.
375
906260
2000
voor het sterrenbeeld de Grote Beer.
15:08
Similarly, there's another sequence of six stars,
376
908260
3000
Zo is er een andere reeks van zes sterren,
15:11
and that translates to "aru meen,"
377
911260
2000
wat vertaald 'aru meen' is,
15:13
which is the old Dravidian name
378
913260
2000
en dat is de oude Dravidische naam
15:15
for the star constellation Pleiades.
379
915260
2000
voor het sterrenbeeld de Plejaden.
15:17
And finally, there's other combinations,
380
917260
3000
Ten slotte zijn er andere combinaties
15:20
such as this fish sign with something that looks like a roof on top of it.
381
920260
3000
zoals dit visteken met iets dat lijkt op een dakje er bovenop.
15:23
And that could be translated into "mey meen,"
382
923260
3000
Dat kan worden vertaald als 'mey meen'
15:26
which is the old Dravidian name for the planet Saturn.
383
926260
3000
en dat is de oude Dravidische naam voor de planeet Saturnus.
15:29
So that was pretty exciting.
384
929260
2000
Dat was behoorlijk spannend.
15:31
It looks like we're getting somewhere.
385
931260
2000
Het lijkt erop dat we goed op weg zijn.
15:33
But does this prove
386
933260
2000
Maar bewijst dit
15:35
that these seals contain Dravidian names
387
935260
2000
dat deze zegels Dravidische namen bevatten
15:37
based on planets and star constellations?
388
937260
2000
die zijn gebaseerd op planeten en sterrenbeelden?
15:39
Well not yet.
389
939260
2000
Nog niet.
15:41
So we have no way of validating
390
941260
2000
We kunnen niet controleren
15:43
these particular readings,
391
943260
2000
of deze lezingen kloppen.
15:45
but if more and more of these readings start making sense,
392
945260
3000
Maar als steeds meer lezingen betekenis lijken te hebben,
15:48
and if longer and longer sequences
393
948260
2000
en als steeds langere reeksen
15:50
appear to be correct,
394
950260
2000
lijken te kloppen,
15:52
then we know that we are on the right track.
395
952260
2000
weten we dat we op het goede spoor zitten.
15:54
Today,
396
954260
2000
Tegenwoordig
15:56
we can write a word such as TED
397
956260
3000
kunnen we een woord zoals TED schrijven
15:59
in Egyptian hieroglyphics and in cuneiform script,
398
959260
3000
in Egyptische hiërogliefen en in spijkerschrift,
16:02
because both of these were deciphered
399
962260
2000
want die zijn allebei ontcijferd
16:04
in the 19th century.
400
964260
2000
in de negentiende eeuw.
16:06
The decipherment of these two scripts
401
966260
2000
Door de ontcijfering van deze twee schriften
16:08
enabled these civilizations to speak to us again directly.
402
968260
3000
kunnen deze beschavingen weer rechtstreeks tot ons spreken.
16:11
The Mayans
403
971260
2000
De Maya's
16:13
started speaking to us in the 20th century,
404
973260
2000
begonnen in de twintigste eeuw tegen ons te spreken,
16:15
but the Indus civilization remains silent.
405
975260
3000
maar de Indusbeschaving is nog stil.
16:18
Why should we care?
406
978260
2000
Waarom moet ons dat iets kunnen schelen?
16:20
The Indus civilization does not belong
407
980260
2000
De Indusbeschaving is niet alleen
16:22
to just the South Indians or the North Indians
408
982260
2000
van de Zuid-Indiase of de Noord-Indiase bevolking
16:24
or the Pakistanis;
409
984260
2000
of van de Pakistani.
16:26
it belongs to all of us.
410
986260
2000
Ze is van ons allemaal.
16:28
These are our ancestors --
411
988260
2000
Dit zijn onze voorouders,
16:30
yours and mine.
412
990260
2000
van jou en van mij.
16:32
They were silenced
413
992260
2000
Hen is het zwijgen opgelegd
16:34
by an unfortunate accident of history.
414
994260
2000
door een ongelukkige historische gebeurtenis.
16:36
If we decipher the script,
415
996260
2000
Als we het schrift ontcijferen,
16:38
we would enable them to speak to us again.
416
998260
2000
kunnen we ze weer tot ons laten spreken.
16:40
What would they tell us?
417
1000260
3000
Wat zouden ze ons vertellen?
16:43
What would we find out about them? About us?
418
1003260
3000
Wat zouden we over ze ontdekken? En over ons?
16:46
I can't wait to find out.
419
1006260
3000
Ik ben heel benieuwd.
16:49
Thank you.
420
1009260
2000
Bedankt.
16:51
(Applause)
421
1011260
4000
(Applaus)
Over deze website

Deze site laat u kennismaken met YouTube-video's die nuttig zijn om Engels te leren. U ziet Engelse lessen gegeven door topdocenten uit de hele wereld. Dubbelklik op de Engelse ondertitels op elke videopagina om de video af te spelen. De ondertitels scrollen synchroon met het afspelen van de video. Heeft u opmerkingen of verzoeken, neem dan contact met ons op via dit contactformulier.

https://forms.gle/WvT1wiN1qDtmnspy7