Rajesh Rao: Computing a Rosetta Stone for the Indus script

1,210,240 views ・ 2011-06-28

TED


Dubbelklicka på de engelska undertexterna nedan för att spela upp videon.

Översättare: Jens Arvidsson Granskare: Johan Cegrell
00:15
I'd like to begin with a thought experiment.
0
15260
3000
Jag skulle vilja inleda med ett tankeexperiment.
00:19
Imagine that it's 4,000 years into the future.
1
19260
3000
Tänk er att vi är 4000 år in i framtiden.
00:22
Civilization as we know it
2
22260
2000
Den civilisation som vi känner till
00:24
has ceased to exist --
3
24260
2000
finns inte längre --
00:26
no books,
4
26260
2000
inga böcker,
00:28
no electronic devices,
5
28260
3000
inga elektronikapparater,
00:31
no Facebook or Twitter.
6
31260
3000
varken Facebook eller Twitter.
00:34
All knowledge of the English language and the English alphabet
7
34260
3000
All kunskap om det engelska språket och det engelska alfabetet
00:37
has been lost.
8
37260
2000
har förlorats.
00:39
Now imagine archeologists
9
39260
2000
Tänk er nu arkeologer
00:41
digging through the rubble of one of our cities.
10
41260
2000
som gräver i resterna efter någon av våra städer.
00:43
What might they find?
11
43260
2000
Vad kan de tänkas hitta?
00:45
Well perhaps some rectangular pieces of plastic
12
45260
3000
Tja, kanske några fyrkantiga föremål av plast
00:48
with strange symbols on them.
13
48260
3000
med märkliga symboler på.
00:51
Perhaps some circular pieces of metal.
14
51260
3000
Kanske några runda metallföremål.
00:54
Maybe some cylindrical containers
15
54260
2000
Kanske några cylindriska behållare
00:56
with some symbols on them.
16
56260
2000
med några symboler på sig.
00:58
And perhaps one archeologist becomes an instant celebrity
17
58260
3000
Och kanske någon arkeolog i ett slag blir kändis
01:01
when she discovers --
18
61260
2000
när hon upptäcker --
01:03
buried in the hills somewhere in North America --
19
63260
2000
begravda i marken någonstans i Nordamerika --
01:05
massive versions of these same symbols.
20
65260
3000
jättelika versioner av just dessa symboler.
01:10
Now let's ask ourselves,
21
70260
2000
Om vi nu ställer oss frågan,
01:12
what could such artifacts say about us
22
72260
3000
vad kan sådana föremål säga om oss
01:15
to people 4,000 years into the future?
23
75260
3000
för människor 4000 år framåt i tiden?
01:18
This is no hypothetical question.
24
78260
2000
Detta är inte en hypotetisk fråga.
01:20
In fact, this is exactly the kind of question we're faced with
25
80260
3000
Det är faktiskt just en sådan fråga som vi ställs inför
01:23
when we try to understand the Indus Valley civilization,
26
83260
3000
när vi försöker förstå Induskulturen,
01:26
which existed 4,000 years ago.
27
86260
2000
som existerade för 4000 år sedan.
01:28
The Indus civilization was roughly contemporaneous
28
88260
3000
Induskulturen var i stort sett samtida
01:31
with the much better known Egyptian and the Mesopotamian civilizations,
29
91260
3000
med de mycket mer kända egyptiska och mesopotamiska högkulturerna,
01:34
but it was actually much larger than either of these two civilizations.
30
94260
3000
men den var faktiskt mycket större än endera av de här två högkulturerna.
01:37
It occupied the area
31
97260
2000
Den täckte en yta
01:39
of approximately one million square kilometers,
32
99260
2000
av ungefär en miljon kvadratkilometer,
01:41
covering what is now Pakistan,
33
101260
2000
och täckte nuvarande Pakistan,
01:43
Northwestern India
34
103260
2000
nordvästra Indien
01:45
and parts of Afghanistan and Iran.
35
105260
2000
och delar av Afghanistan och Iran.
01:47
Given that it was such a vast civilization,
36
107260
2000
Med tanke på att det var en så vidsträckt civilisation
01:49
you might expect to find really powerful rulers, kings,
37
109260
4000
skulle man kunna förvänta sig att hitta verkligt mäktiga härskare, kungar,
01:53
and huge monuments glorifying these powerful kings.
38
113260
3000
och väldiga monument som förhärligade dessa mäktiga kungar.
01:56
In fact,
39
116260
2000
Men faktum är
01:58
what archeologists have found is none of that.
40
118260
2000
att arkeologerna inte har funnit något sådant.
02:00
They've found small objects such as these.
41
120260
3000
De har hittat små föremål som de här.
02:03
Here's an example of one of these objects.
42
123260
3000
Här är ett exempel på ett av dessa föremål.
02:06
Well obviously this is a replica.
43
126260
2000
Ja, självklart är detta en kopia.
02:08
But who is this person?
44
128260
3000
Men vem föreställer detta?
02:11
A king? A god?
45
131260
2000
En kung? En gud?
02:13
A priest?
46
133260
2000
En präst?
02:15
Or perhaps an ordinary person
47
135260
2000
Eller kanske en vanlig människa
02:17
like you or me?
48
137260
2000
som du eller jag?
02:19
We don't know.
49
139260
2000
Vi vet inte.
02:21
But the Indus people also left behind artifacts with writing on them.
50
141260
3000
Men Indusfolket efterlämnade också föremål med saker skrivna på sig.
02:24
Well no, not pieces of plastic,
51
144260
2000
Nej, det var inte föremål av plast,
02:26
but stone seals, copper tablets,
52
146260
3000
men stensigill, koppartavlor,
02:29
pottery and, surprisingly,
53
149260
2000
keramik och, något förvånande,
02:31
one large sign board,
54
151260
2000
en stor skylt,
02:33
which was found buried near the gate of a city.
55
153260
2000
som var nedgrävd nära en stads stadsport.
02:35
Now we don't know if it says Hollywood,
56
155260
2000
Vi vet inte om det står Hollywood på den,
02:37
or even Bollywood for that matter.
57
157260
2000
eller Bollywood för den delen.
02:39
In fact, we don't even know
58
159260
2000
Faktum är att vi inte ens vet
02:41
what any of these objects say,
59
161260
2000
vad det står på något av dessa föremål,
02:43
and that's because the Indus script is undeciphered.
60
163260
3000
eftersom Indusskriften inte har kunnat uttydas ännu.
02:46
We don't know what any of these symbols mean.
61
166260
2000
Vi vet inte vad någon av dessa symboler betyder.
02:48
The symbols are most commonly found on seals.
62
168260
3000
Symbolerna återfinns vanligen på sigill.
02:51
So you see up there one such object.
63
171260
2000
Där uppe ser ni ett av dessa föremål.
02:53
It's the square object with the unicorn-like animal on it.
64
173260
3000
Det är det fyrkantiga föremålet med ett enhörningsliknande djur på sig.
02:56
Now that's a magnificent piece of art.
65
176260
2000
Det är verkligen ett fantastiskt konstföremål.
02:58
So how big do you think that is?
66
178260
2000
Men hur stort tror ni att det är?
03:00
Perhaps that big?
67
180260
2000
Kanske så här stort?
03:02
Or maybe that big?
68
182260
2000
Eller kanske så här stort?
03:04
Well let me show you.
69
184260
2000
Jag ska visa er.
03:07
Here's a replica of one such seal.
70
187260
3000
Här är en kopia av ett sådant sigill.
03:10
It's only about one inch by one inch in size --
71
190260
2000
Det är ungefär 2,5 gånger 2,5 cm stort --
03:12
pretty tiny.
72
192260
2000
ganska litet.
03:14
So what were these used for?
73
194260
2000
Vad användes då de här till?
03:16
We know that these were used for stamping clay tags
74
196260
3000
Vi vet att de användes för att stämpla lerstycken
03:19
that were attached to bundles of goods that were sent from one place to the other.
75
199260
3000
som fästes vid buntar av varor som skickades från ett ställe till ett annat.
03:22
So you know those packing slips you get on your FedEx boxes?
76
202260
3000
Ni vet de där följesedlarna som ni får med era postpaket?
03:25
These were used to make those kinds of packing slips.
77
205260
3000
De här användes för att göra sådana följesedlar.
03:28
You might wonder what these objects contain
78
208260
3000
Ni kanske undrar vad de här föremålen innehåller
03:31
in terms of their text.
79
211260
2000
i fråga om själva texten.
03:33
Perhaps they're the name of the sender
80
213260
2000
Kanske är det avsändarens namn
03:35
or some information about the goods
81
215260
2000
eller någon information om varorna
03:37
that are being sent from one place to the other -- we don't know.
82
217260
3000
som skickas från ett ställe till ett annat -- vi vet inte.
03:40
We need to decipher the script to answer that question.
83
220260
2000
Vi måste uttyda skriften för att besvara den frågan.
03:42
Deciphering the script
84
222260
2000
Att uttyda skriften
03:44
is not just an intellectual puzzle;
85
224260
2000
är inte bara en tankenöt;
03:46
it's actually become a question
86
226260
2000
det har faktiskt blivit en fråga
03:48
that's become deeply intertwined
87
228260
2000
som har blivit starkt sammanlänkad
03:50
with the politics and the cultural history of South Asia.
88
230260
3000
med politiken och kulturhistorien i södra Asien.
03:53
In fact, the script has become a battleground of sorts
89
233260
3000
Faktum är att skriften har blivit ett sorts slagfält
03:56
between three different groups of people.
90
236260
2000
mellan tre olika grupperingar.
03:58
First, there's a group of people
91
238260
2000
För det första finns det en grupp personer
04:00
who are very passionate in their belief
92
240260
2000
som har en stark övertygelse om
04:02
that the Indus script
93
242260
2000
att Indusskriften
04:04
does not represent a language at all.
94
244260
2000
över huvud taget inte representerar något språk.
04:06
These people believe that the symbols
95
246260
2000
De här personerna anser att symbolerna
04:08
are very similar to the kind of symbols you find on traffic signs
96
248260
3000
är av samma typ som sådana symboler finns på trafikskyltar
04:11
or the emblems you find on shields.
97
251260
3000
eller emblem på sköldar.
04:14
There's a second group of people
98
254260
2000
Det finns en andra grupp av personer
04:16
who believe that the Indus script represents an Indo-European language.
99
256260
3000
som anser att Indusskriften representerar ett indoeuropeiskt språk.
04:19
If you look at a map of India today,
100
259260
2000
Om man tittar på en karta över dagens Indien,
04:21
you'll see that most of the languages spoken in North India
101
261260
3000
ser man att de flesta av de språk som talas i norra Indien
04:24
belong to the Indo-European language family.
102
264260
3000
tillhör den indoeuropeiska språkfamiljen.
04:27
So some people believe that the Indus script
103
267260
2000
Därför tror en del personer att Indusskriften
04:29
represents an ancient Indo-European language such as Sanskrit.
104
269260
3000
representerar ett forntida indoeuropeiskt språk som t.ex. sanskrit.
04:32
There's a last group of people
105
272260
2000
Det finns en sista gruppering
04:34
who believe that the Indus people
106
274260
3000
som anser att Indusfolket
04:37
were the ancestors of people living in South India today.
107
277260
3000
var förfäder till folk som bor i södra Indien i dag.
04:40
These people believe that the Indus script
108
280260
2000
De här personerna anser att Indusskriften
04:42
represents an ancient form
109
282260
2000
representerar en forntida form
04:44
of the Dravidian language family,
110
284260
2000
av den dravidiska språkfamiljen,
04:46
which is the language family spoken in much of South India today.
111
286260
3000
som är den språkfamilj som talas i stora delar av södra Indien i dag.
04:49
And the proponents of this theory
112
289260
2000
Och anhängarna av denna teori
04:51
point to that small pocket of Dravidian-speaking people in the North,
113
291260
3000
pekar på den lilla fickan av dravidisktalande folk i norr,
04:54
actually near Afghanistan,
114
294260
2000
nära Afghanistan,
04:56
and they say that perhaps, sometime in the past,
115
296260
3000
och de hävdar att kanske någon gång i det förgångna
04:59
Dravidian languages were spoken all over India
116
299260
3000
talades dravidiska språk över hela Indien
05:02
and that this suggests
117
302260
2000
och att detta pekar mot
05:04
that the Indus civilization is perhaps also Dravidian.
118
304260
3000
att Induscivilisationen kanske också är dravidisk.
05:07
Which of these hypotheses can be true?
119
307260
3000
Vilken av dessa hypoteser kan vara korrekt?
05:10
We don't know, but perhaps if you deciphered the script,
120
310260
2000
Vi vet inte, men kanske om man uttyder skriften
05:12
you would be able to answer this question.
121
312260
2000
så kan man också besvara denna fråga.
05:14
But deciphering the script is a very challenging task.
122
314260
2000
Men att uttyda skriften är en mycket stor utmaning.
05:16
First, there's no Rosetta Stone.
123
316260
2000
För det första finns det ingen Rosettasten.
05:18
I don't mean the software;
124
318260
2000
Jag menar inte datorprogrammet;
05:20
I mean an ancient artifact
125
320260
2000
Jag menar ett forntida föremål
05:22
that contains in the same text
126
322260
2000
som innehåller samma text
05:24
both a known text and an unknown text.
127
324260
3000
både en känd text och en okänd text.
05:27
We don't have such an artifact for the Indus script.
128
327260
3000
Vi har inget motsvarande föremål för Indusskriften.
05:30
And furthermore, we don't even know what language they spoke.
129
330260
3000
Dessutom vet vi inte ens vilket språk de talade.
05:33
And to make matters even worse,
130
333260
2000
Och till råga på allt är
05:35
most of the text that we have are extremely short.
131
335260
2000
större delen av de texter vi har extremt korta.
05:37
So as I showed you, they're usually found on these seals
132
337260
2000
Som jag har visat er, så återfinns de oftast på dessa sigill
05:39
that are very, very tiny.
133
339260
2000
som är väldigt, väldigt små.
05:41
And so given these formidable obstacles,
134
341260
2000
Och med tanke på dessa väldiga hinder,
05:43
one might wonder and worry
135
343260
2000
kan man fundera och ängslas över
05:45
whether one will ever be able to decipher the Indus script.
136
345260
3000
om man någonsin kommer att kunna uttyda Indusskriften.
05:48
In the rest of my talk,
137
348260
2000
Under återstoden av min föreläsning,
05:50
I'd like to tell you about how I learned to stop worrying
138
350260
2000
ska jag berätta hur jag slutade ängslas
05:52
and love the challenge posed by the Indus script.
139
352260
2000
och lärde mig älska utmaningen som Indusskriften ger.
05:54
I've always been fascinated by the Indus script
140
354260
3000
Jag har alltid varit fascinerad av Indusskriften
05:57
ever since I read about it in a middle school textbook.
141
357260
2000
ända sedan jag läste om den i en lärobok på högstadiet.
05:59
And why was I fascinated?
142
359260
2000
Och varför blev jag fascinerad?
06:01
Well it's the last major undeciphered script in the ancient world.
143
361260
4000
Jo, det är den sista mer betydande forntida skriften som ännu inte uttolkats.
06:05
My career path led me to become a computational neuroscientist,
144
365260
3000
Professionellt är jag beräkningsneurobiolog,
06:08
so in my day job,
145
368260
2000
så på mitt vanliga jobb
06:10
I create computer models of the brain
146
370260
2000
skapar jag datormodeller av hjärnan
06:12
to try to understand how the brain makes predictions,
147
372260
3000
för att försöka förstå hur hjärnan gör förutsägelser,
06:15
how the brain makes decisions,
148
375260
2000
hur hjärnan fattar beslut,
06:17
how the brain learns and so on.
149
377260
2000
hur hjärnan lär sig saker och så vidare.
06:19
But in 2007, my path crossed again with the Indus script.
150
379260
3000
Men 2007 stötte jag på Indusskriften igen.
06:22
That's when I was in India,
151
382260
2000
Det var när jag var i Indien,
06:24
and I had the wonderful opportunity
152
384260
2000
och jag fick den fantastiska möjligheten
06:26
to meet with some Indian scientists
153
386260
2000
att träffa några indiska vetenskapsmän
06:28
who were using computer models to try to analyze the script.
154
388260
3000
som använde datormodeller för att försöka analysera skriften.
06:31
And so it was then that I realized
155
391260
2000
Och det var då jag insåg
06:33
there was an opportunity for me to collaborate with these scientists,
156
393260
3000
att det fanns en möjlighet för mig att samarbeta med de här vetenskapsmännen,
06:36
and so I jumped at that opportunity.
157
396260
2000
och jag tog den chansen.
06:38
And I'd like to describe some of the results that we have found.
158
398260
2000
Och jag skulle vilja beskriva några av de resultat som vi har fått fram.
06:40
Or better yet, let's all collectively decipher.
159
400260
3000
Eller varför inte försöka uttolka tillsammans?
06:43
Are you ready?
160
403260
2000
Är ni med?
06:45
The first thing that you need to do when you have an undeciphered script
161
405260
3000
Det första som man måste göra när man har en outtydd skrift
06:48
is try to figure out the direction of writing.
162
408260
2000
är att försöka komma på skriftens riktning.
06:50
Here are two texts that contain some symbols on them.
163
410260
3000
Här följer två texter som består av några symboler.
06:53
Can you tell me
164
413260
2000
Kan ni säga mig
06:55
if the direction of writing is right to left or left to right?
165
415260
3000
om skriften skrivs från höger till vänster eller från vänster till höger?
06:58
I'll give you a couple of seconds.
166
418260
3000
Jag ger er några sekunder.
07:01
Okay. Right to left, how many? Okay.
167
421260
3000
Okej. Höger till vänster, hur många? Okej.
07:04
Okay. Left to right?
168
424260
2000
Okej. Vänster till höger?
07:06
Oh, it's almost 50/50. Okay.
169
426260
2000
Åh, det är nästan 50-50. Okej.
07:08
The answer is:
170
428260
2000
Svaret är:
07:10
if you look at the left-hand side of the two texts,
171
430260
2000
om man tittar på den vänstra sidan av de två texterna,
07:12
you'll notice that there's a cramping of signs,
172
432260
3000
ser man att tecknen trängts ihop där,
07:15
and it seems like 4,000 years ago,
173
435260
2000
och det verkar som att för 4000 år sedan,
07:17
when the scribe was writing from right to left,
174
437260
2000
när skrivaren skrev från höger till vänster,
07:19
they ran out of space.
175
439260
2000
fick de slut på utrymme.
07:21
And so they had to cram the sign.
176
441260
2000
Och så blev de tvungna att tränga ihop tecknet.
07:23
One of the signs is also below the text on the top.
177
443260
2000
Ett av tecknen är också under texten högst upp.
07:25
This suggests the direction of writing
178
445260
2000
Detta antyder att skriftriktningen
07:27
was probably from right to left,
179
447260
2000
antagligen gick från höger till vänster,
07:29
and so that's one of the first things we know,
180
449260
2000
så en av de första sakerna som vi vet,
07:31
that directionality is a very key aspect of linguistic scripts.
181
451260
3000
är att riktning är en grundläggande aspekt hos skrivtecken.
07:34
And the Indus script now has
182
454260
2000
Och Indusskriften har
07:36
this particular property.
183
456260
2000
den här egenskapen.
07:38
What other properties of language does the script show?
184
458260
2000
Vilka andra språkliga egenskaper har skriften?
07:40
Languages contain patterns.
185
460260
2000
Språk innehåller mönster.
07:42
If I give you the letter Q
186
462260
2000
Om jag ger er bokstaven Q
07:44
and ask you to predict the next letter, what do you think that would be?
187
464260
3000
och ber er att förutsäga nästa bokstav, vilken tror ni att det är?
07:47
Most of you said U, which is right.
188
467260
2000
De flesta av er sade U, vilket är riktigt.
07:49
Now if I asked you to predict one more letter,
189
469260
2000
Om jag nu ber er att förutsäga ytterligare en bokstav,
07:51
what do you think that would be?
190
471260
2000
vilken tror ni att det är?
07:53
Now there's several thoughts. There's E. It could be I. It could be A,
191
473260
3000
Nu finns det flera möjligheter. Det skulle kunna vara E, I eller A,
07:56
but certainly not B, C or D, right?
192
476260
3000
Men absolut inte B, C eller D, eller hur?
07:59
The Indus script also exhibits similar kinds of patterns.
193
479260
3000
Indusskriften uppvisar också liknande typer av mönster.
08:02
There's a lot of text that start with this diamond-shaped symbol.
194
482260
3000
Det finns mycket text som börjar med den här diamantformade symbolen.
08:05
And this in turn tends to be followed
195
485260
2000
Och den brukar i sin tur följas av
08:07
by this quotation marks-like symbol.
196
487260
2000
den här symbolen som ser ut som ett citattecken.
08:09
And this is very similar to a Q and U example.
197
489260
2000
Och det är väldigt likt exemplet med Q och U.
08:11
This symbol can in turn be followed
198
491260
2000
Denna symbol kan i sin tur följas av
08:13
by these fish-like symbols and some other signs,
199
493260
3000
de här fiskliknande symbolerna och och några andra tecken,
08:16
but never by these other signs at the bottom.
200
496260
2000
men aldrig av de här andra tecknen längst ner.
08:18
And furthermore, there's some signs
201
498260
2000
Dessutom finns det några tecken
08:20
that really prefer the end of texts,
202
500260
2000
som främst återfinns i slutet av texter,
08:22
such as this jar-shaped sign,
203
502260
2000
som det här kannformade tecknet,
08:24
and this sign, in fact, happens to be
204
504260
2000
och det tecknet råkar faktiskt vara
08:26
the most frequently occurring sign in the script.
205
506260
2000
det vanligast förekommande tecknet i skriften.
08:28
Given such patterns, here was our idea.
206
508260
3000
Med tanke på dessa mönster hade vi den här idén.
08:31
The idea was to use a computer
207
511260
2000
Idén var att använda en dator
08:33
to learn these patterns,
208
513260
2000
för att ta reda på dessa mönster,
08:35
and so we gave the computer the existing texts.
209
515260
3000
därför matade vi in de befintliga texterna i datorn.
08:38
And the computer learned a statistical model
210
518260
2000
Och datorn lärde sig en statistisk modell
08:40
of which symbols tend to occur together
211
520260
2000
över vilka symboler som brukar uppträda tillsammans
08:42
and which symbols tend to follow each other.
212
522260
2000
och vilka symboler som brukar följa på varandra.
08:44
Given the computer model,
213
524260
2000
Med hjälp av datormodellen
08:46
we can test the model by essentially quizzing it.
214
526260
3000
kan vi testa modellen helt enkelt genom att fråga ut den.
08:49
So we could deliberately erase some symbols,
215
529260
2000
Vi skulle exempelvis avsiktligt kunna radera några symboler,
08:51
and we can ask it to predict the missing symbols.
216
531260
3000
och vi kan be den att förutsäga de symboler som saknas.
08:54
Here are some examples.
217
534260
3000
Här följer några exempel.
09:00
You may regard this
218
540260
2000
Du kanske tycker att detta
09:02
as perhaps the most ancient game
219
542260
2000
ser ut som det urgamla spelet
09:04
of Wheel of Fortune.
220
544260
3000
lyckohjulet.
09:08
What we found
221
548260
2000
Vad vi fann
09:10
was that the computer was successful in 75 percent of the cases
222
550260
2000
var att datorn i 75 procent av fallen lyckades
09:12
in predicting the correct symbol.
223
552260
2000
förutsäga rätt symbol.
09:14
In the rest of the cases,
224
554260
2000
I övriga fall
09:16
typically the second best guess or third best guess was the right answer.
225
556260
3000
var oftast den andra eller tredje gissningen rätt.
09:19
There's also practical use
226
559260
2000
Det finns också praktiska tillämpningar
09:21
for this particular procedure.
227
561260
2000
för den här arbetsmetoden.
09:23
There's a lot of these texts that are damaged.
228
563260
2000
Många av dessa texter är skadade.
09:25
Here's an example of one such text.
229
565260
2000
Här är ett exempel på en sådan text.
09:27
And we can use the computer model now to try to complete this text
230
567260
3000
Och nu kan vi använda datormodellen för att försöka komplettera texten
09:30
and make a best guess prediction.
231
570260
2000
och göra en så bra gissning som möjligt.
09:32
Here's an example of a symbol that was predicted.
232
572260
3000
Här är ett exempel på en symbol som gissades.
09:35
And this could be really useful as we try to decipher the script
233
575260
2000
Och det här kan vara väldigt användbart när vi försöker uttyda skriften
09:37
by generating more data that we can analyze.
234
577260
3000
genom att generera mer data som vi kan analysera.
09:40
Now here's one other thing you can do with the computer model.
235
580260
3000
Här är en annan sak som man kan göra med datormodellen.
09:43
So imagine a monkey
236
583260
2000
Tänk er en apa
09:45
sitting at a keyboard.
237
585260
2000
som sitter vid ett tangentbord
09:47
I think you might get a random jumble of letters that looks like this.
238
587260
3000
Jag tror att man skulle få en slumpartad radda bokstäver, så här.
09:50
Such a random jumble of letters
239
590260
2000
En sådan slumpartad radda bokstäver
09:52
is said to have a very high entropy.
240
592260
2000
sägs ha en mycket hög entropi.
09:54
This is a physics and information theory term.
241
594260
2000
Detta är en term från fysik och informationsteori.
09:56
But just imagine it's a really random jumble of letters.
242
596260
3000
Men tänk er att det helt enkelt är en slumpmässig radda bokstäver.
09:59
How many of you have ever spilled coffee on a keyboard?
243
599260
4000
Hur många av er har någon gång spillt kaffe på ett tangentbord?
10:03
You might have encountered the stuck-key problem --
244
603260
2000
Ni kanske har fått problem med en tangent som sitter fast --
10:05
so basically the same symbol being repeated over and over again.
245
605260
3000
så att samma tecken upprepas om och om igen.
10:08
This kind of a sequence is said to have a very low entropy
246
608260
3000
En sådan sekvens sägs ha en mycket låg entropi
10:11
because there's no variation at all.
247
611260
2000
eftersom det inte finns någon variation alls.
10:13
Language, on the other hand, has an intermediate level of entropy;
248
613260
3000
Språk, å andra sidan, har en medelhög nivå av entropi;
10:16
it's neither too rigid,
249
616260
2000
den är varken för strikt
10:18
nor is it too random.
250
618260
2000
eller för slumpartad.
10:20
What about the Indus script?
251
620260
2000
Hur är det med Indusskriften?
10:22
Here's a graph that plots the entropies of a whole bunch of sequences.
252
622260
4000
Här är en graf som visar entropin för en grupp sekvenser.
10:26
At the very top you find the uniformly random sequence,
253
626260
2000
Högst upp ser ni den fullständigt slumpartade sekvensen,
10:28
which is a random jumble of letters --
254
628260
2000
som är en slumpartad radda bokstäver --
10:30
and interestingly, we also find
255
630260
2000
och, intressant nog, hittar vi också
10:32
the DNA sequence from the human genome and instrumental music.
256
632260
3000
DNA-sekvensen från det mänskliga genomet och instrumental musik.
10:35
And both of these are very, very flexible,
257
635260
2000
Båda dessa är ytterst flexibla,
10:37
which is why you find them in the very high range.
258
637260
2000
vilket är orsaken till att de återfinns högst upp i skalan.
10:39
At the lower end of the scale,
259
639260
2000
På skalans lägsta del
10:41
you find a rigid sequence, a sequence of all A's,
260
641260
2000
finner man en rigid sekvens, en sekvens med bara A:n,
10:43
and you also find a computer program,
261
643260
2000
och man finner också ett datorprogram,
10:45
in this case in the language Fortran,
262
645260
2000
i det här fallet språket Fortran,
10:47
which obeys really strict rules.
263
647260
2000
som följer mycket strikta regler.
10:49
Linguistic scripts
264
649260
2000
Skrivtecken
10:51
occupy the middle range.
265
651260
2000
ligger i mitten av skalan
10:53
Now what about the Indus script?
266
653260
2000
Hur är det då med Indusskriften?
10:55
We found that the Indus script
267
655260
2000
Vi fann att Indusskriften
10:57
actually falls within the range of the linguistic scripts.
268
657260
2000
faktiskt ligger inom intervallet för skrivtecken.
10:59
When this result was first published,
269
659260
2000
När detta resultat först publicerades
11:01
it was highly controversial.
270
661260
3000
var det mycket kontroversiellt.
11:04
There were people who raised a hue and cry,
271
664260
3000
Det blev ett ramaskri från vissa personer,
11:07
and these people were the ones who believed
272
667260
2000
och dessa personer var de som ansåg
11:09
that the Indus script does not represent language.
273
669260
3000
att Indusskriften inte representerar språk.
11:12
I even started to get some hate mail.
274
672260
2000
Jag fick till och med hatmejl.
11:14
My students said
275
674260
2000
Mina studenter sade
11:16
that I should really seriously consider getting some protection.
276
676260
3000
att jag verkligen borde överväga att skaffa mig skydd av något slag.
11:19
Who'd have thought
277
679260
2000
Vem hade kunnat tro
11:21
that deciphering could be a dangerous profession?
278
681260
2000
att skrifttolkning var ett farligt yrke?
11:23
What does this result really show?
279
683260
2000
Vad visar det här resultatet egentligen?
11:25
It shows that the Indus script
280
685260
2000
Det visar att Indusskriften
11:27
shares an important property of language.
281
687260
2000
har en viktig egenskap gemensam med språk.
11:29
So, as the old saying goes,
282
689260
2000
Som det gamla talesättet säger,
11:31
if it looks like a linguistic script
283
691260
2000
om det ser ut som skrivtecken
11:33
and it acts like a linguistic script,
284
693260
2000
och det beter sig som skrivtecken
11:35
then perhaps we may have a linguistic script on our hands.
285
695260
3000
så kanske det är skrivtecken som vi har stött på.
11:38
What other evidence is there
286
698260
2000
Vad finns det för ytterligare bevis
11:40
that the script could actually encode language?
287
700260
2000
för att skriften faktiskt kunde användas för språk?
11:42
Well linguistic scripts can actually encode multiple languages.
288
702260
3000
Jo, skrivtecken kan ju faktiskt användas för flera olika språk.
11:45
So for example, here's the same sentence written in English
289
705260
3000
Här är till exempel samma mening skriven på engelska
11:48
and the same sentence written in Dutch
290
708260
2000
och samma mening skriven på nederländska
11:50
using the same letters of the alphabet.
291
710260
2000
med hjälp av samma bokstäver i alfabetet.
11:52
If you don't know Dutch and you only know English
292
712260
3000
Om ni inte kan nederländska utan bara engelska
11:55
and I give you some words in Dutch,
293
715260
2000
och jag visar er några ord på nederländska,
11:57
you'll tell me that these words contain
294
717260
2000
kommer ni att säga till mig att de här orden innehåller
11:59
some very unusual patterns.
295
719260
2000
några mycket ovanliga mönster.
12:01
Some things are not right,
296
721260
2000
En del saker stämmer inte,
12:03
and you'll say these words are probably not English words.
297
723260
3000
och ni kommer att säga att de här orden antagligen inte är engelska ord.
12:06
The same thing happens in the case of the Indus script.
298
726260
2000
Samma sak händer när det gäller Indusskriften.
12:08
The computer found several texts --
299
728260
2000
Datorn hittade flera texter
12:10
two of them are shown here --
300
730260
2000
varav två visas här
12:12
that have very unusual patterns.
301
732260
2000
som har mycket ovanliga mönster.
12:14
So for example the first text:
302
734260
2000
Till exempel den första texten:
12:16
there's a doubling of this jar-shaped sign.
303
736260
3000
här är en dubblering av det kannformade tecknet.
12:19
This sign is the most frequently-occurring sign
304
739260
2000
Detta tecknet är det oftast förekommande
12:21
in the Indus script,
305
741260
2000
i Indusskriften,
12:23
and it's only in this text
306
743260
2000
och det är bara i den här texten
12:25
that it occurs as a doubling pair.
307
745260
2000
som det förekommer dubblerat.
12:27
Why is that the case?
308
747260
2000
Hur kommer det sig?
12:29
We went back and looked at where these particular texts were found,
309
749260
3000
Vi gick tillbaka och tittade efter var just dessa texter hade hittats,
12:32
and it turns out that they were found
310
752260
2000
och det visade sig att de hade hittats
12:34
very, very far away from the Indus Valley.
311
754260
2000
mycket långt bort från Indusdalen.
12:36
They were found in present day Iraq and Iran.
312
756260
3000
De hittades i det som nu är Irak och Iran.
12:39
And why were they found there?
313
759260
2000
Och varför hittades de där?
12:41
What I haven't told you is that
314
761260
2000
Vad jag inte har berättat för er är att
12:43
the Indus people were very, very enterprising.
315
763260
2000
Indusfolket var mycket företagsamma.
12:45
They used to trade with people pretty far away from where they lived,
316
765260
3000
De bedrev handel med folk ganska långt bort från sina hem,
12:48
and so in this case, they were traveling by sea
317
768260
3000
och i det här fallet reste de till sjöss
12:51
all the way to Mesopotamia, present-day Iraq.
318
771260
3000
hela vägen till Mesopotamien, det nutida Irak.
12:54
And what seems to have happened here
319
774260
2000
Och det som förefaller ha skett här
12:56
is that the Indus traders, the merchants,
320
776260
3000
är att köpmännen från Indus
12:59
were using this script to write a foreign language.
321
779260
3000
använde den här skriften för att skriva på ett främmande språk
13:02
It's just like our English and Dutch example.
322
782260
2000
Det är precis som våra engelska och nederländska exempel
13:04
And that would explain why we have these strange patterns
323
784260
2000
Och det skulle förklara varför vi har de här underliga mönstren
13:06
that are very different from the kinds of patterns you see in the text
324
786260
3000
som är helt olika från de mönster som man ser i texter
13:09
that are found within the Indus Valley.
325
789260
3000
som hittas i Indusdalen.
13:12
This suggests that the same script, the Indus script,
326
792260
2000
Detta antyder att samma skrivtecken, Indusskriften,
13:14
could be used to write different languages.
327
794260
3000
kunde användas för att skriva på olika språk.
13:17
The results we have so far seem to point to the conclusion
328
797260
3000
De resultat vi har sett hittills verkar peka mot slutsatsen
13:20
that the Indus script probably does represent language.
329
800260
3000
att Indusskriften antagligen representerar språk.
13:23
If it does represent language,
330
803260
2000
Om det representerar språk,
13:25
then how do we read the symbols?
331
805260
2000
hur ska vi då läsa symbolerna?
13:27
That's our next big challenge.
332
807260
2000
Det är vår nästa stora utmaning.
13:29
So you'll notice that many of the symbols
333
809260
2000
Ni kommer att märka att många av symbolerna
13:31
look like pictures of humans, of insects,
334
811260
2000
ser ut som bilder av människor, insekter,
13:33
of fishes, of birds.
335
813260
3000
fiskar, fåglar.
13:36
Most ancient scripts
336
816260
2000
De flesta forntida skrifter
13:38
use the rebus principle,
337
818260
2000
använder rebusprincipen,
13:40
which is, using pictures to represent words.
338
820260
3000
vilken innebär att bilder används för att representera ord.
13:43
So as an example, here's a word.
339
823260
3000
Här är exempelvis ett ord.
13:46
Can you write it using pictures?
340
826260
2000
Kan ni skriva det med hjälp av bilder?
13:48
I'll give you a couple seconds.
341
828260
2000
Jag ger er några sekunder.
13:50
Got it?
342
830260
2000
Är ni med?
13:52
Okay. Great.
343
832260
2000
Okej. Bra.
13:54
Here's my solution.
344
834260
2000
Här är min lösning.
13:56
You could use the picture of a bee followed by a picture of a leaf --
345
836260
2000
Man skulle kunna använda en bild av ett bi [bee] följt av en bild av ett löv [leaf] --
13:58
and that's "belief," right.
346
838260
2000
och det är "tro" [belief], precis.
14:00
There could be other solutions.
347
840260
2000
Man kan tänka sig andra lösningar.
14:02
In the case of the Indus script,
348
842260
2000
Gällande Indusskriften
14:04
the problem is the reverse.
349
844260
2000
är problemet det omvända.
14:06
You have to figure out the sounds of each of these pictures
350
846260
3000
Man måste lista ut ljudet för var och en av de här bilderna
14:09
such that the entire sequence makes sense.
351
849260
2000
så att hela sekvensen blir begriplig.
14:11
So this is just like a crossword puzzle,
352
851260
3000
Så det här är precis som ett korsord,
14:14
except that this is the mother of all crossword puzzles
353
854260
3000
förutom att det är alla korsords moder
14:17
because the stakes are so high if you solve it.
354
857260
4000
eftersom belöningen är så stor om du löser det.
14:21
My colleagues, Iravatham Mahadevan and Asko Parpola,
355
861260
3000
Mina kolleger, Iravatham Mahadevan och Asko Parpola,
14:24
have been making some headway on this particular problem.
356
864260
2000
har gjort en del framsteg med just det här problemet.
14:26
And I'd like to give you a quick example of Parpola's work.
357
866260
2000
Och jag skulle vilja ge er ett kort exempel på Parpolas arbete.
14:28
Here's a really short text.
358
868260
2000
Här är en väldigt kort text.
14:30
It contains seven vertical strokes followed by this fish-like sign.
359
870260
3000
Den består av sju vertikala streck följt av det här fiskliknande tecknet.
14:33
And I want to mention that these seals were used
360
873260
2000
Och jag vill nämna att de här sigillen användes
14:35
for stamping clay tags
361
875260
2000
för att sätta stämpelmärken
14:37
that were attached to bundles of goods,
362
877260
2000
som fästes vid buntar av varor,
14:39
so it's quite likely that these tags, at least some of them,
363
879260
3000
så det är högst sannolikt att dessa märken, i vilket fall några av dem,
14:42
contain names of merchants.
364
882260
2000
består av namn på köpmän.
14:44
And it turns out that in India
365
884260
2000
Och det har visat sig att i Indien
14:46
there's a long tradition
366
886260
2000
finns det en lång tradition
14:48
of names being based on horoscopes
367
888260
2000
av namn som baseras på horoskop
14:50
and star constellations present at the time of birth.
368
890260
3000
och aktuella stjärnkonstellationer vid tiden för födelsen.
14:53
In Dravidian languages,
369
893260
2000
I dravidiska språk
14:55
the word for fish is "meen"
370
895260
2000
är ordet för fisk "meen"
14:57
which happens to sound just like the word for star.
371
897260
3000
vilket råkar låta just som ordet för stjärna.
15:00
And so seven stars
372
900260
2000
Och sju stjärnor
15:02
would stand for "elu meen,"
373
902260
2000
står för "elu meen",
15:04
which is the Dravidian word
374
904260
2000
vilket är det dravidiska ordet
15:06
for the Big Dipper star constellation.
375
906260
2000
för stjärnbilden Karlavagnen.
15:08
Similarly, there's another sequence of six stars,
376
908260
3000
På samma sätt finns det en annan sekvens bestående av sex stjärnor,
15:11
and that translates to "aru meen,"
377
911260
2000
och det blir i översättning "aru meen",
15:13
which is the old Dravidian name
378
913260
2000
vilket är det gammaldravidiska namnet
15:15
for the star constellation Pleiades.
379
915260
2000
på stjärnbilden Plejaderna.
15:17
And finally, there's other combinations,
380
917260
3000
Sluligen finns det andra kombinationer,
15:20
such as this fish sign with something that looks like a roof on top of it.
381
920260
3000
som det här fisktecknet med något som ser ut som ett tak ovanpå sig.
15:23
And that could be translated into "mey meen,"
382
923260
3000
Och det skulle kunna översättas till "mey meen",
15:26
which is the old Dravidian name for the planet Saturn.
383
926260
3000
vilket är det gammaldravidiska namnet på planeten Saturnus.
15:29
So that was pretty exciting.
384
929260
2000
Det var klart spännande.
15:31
It looks like we're getting somewhere.
385
931260
2000
Det verkar som att vi kommer någonstans.
15:33
But does this prove
386
933260
2000
Men bevisar detta
15:35
that these seals contain Dravidian names
387
935260
2000
att de här sigillen innehåller dravidiska namn
15:37
based on planets and star constellations?
388
937260
2000
baserade på planeter och stjärnbilder?
15:39
Well not yet.
389
939260
2000
Nej, inte ännu.
15:41
So we have no way of validating
390
941260
2000
Vi har alltså inget sätt att säkerställa
15:43
these particular readings,
391
943260
2000
att dessa tolkningar är korrekta,
15:45
but if more and more of these readings start making sense,
392
945260
3000
men om fler och fler av de här tolkningarna börjar bli begripliga,
15:48
and if longer and longer sequences
393
948260
2000
och om längre och längre sekvenser
15:50
appear to be correct,
394
950260
2000
förefaller vara korrekta,
15:52
then we know that we are on the right track.
395
952260
2000
så vet vi att vi är på rätt spår.
15:54
Today,
396
954260
2000
I dag
15:56
we can write a word such as TED
397
956260
3000
kan vi skriva ett ord som TED
15:59
in Egyptian hieroglyphics and in cuneiform script,
398
959260
3000
med egyptiska hieroglyfer och med kilskrift,
16:02
because both of these were deciphered
399
962260
2000
eftersom båda dessa uttyddes
16:04
in the 19th century.
400
964260
2000
under 1800-talet.
16:06
The decipherment of these two scripts
401
966260
2000
Genom uttydningen av dessa två skrifter
16:08
enabled these civilizations to speak to us again directly.
402
968260
3000
kunde dessa kulturer åter tala till oss direkt.
16:11
The Mayans
403
971260
2000
Maya
16:13
started speaking to us in the 20th century,
404
973260
2000
började tala till oss under 1900-talet.
16:15
but the Indus civilization remains silent.
405
975260
3000
Men Induskulturen är fortfarande tyst.
16:18
Why should we care?
406
978260
2000
Varför ska vi bry oss om det?
16:20
The Indus civilization does not belong
407
980260
2000
Induskulturen tillhör inte bara
16:22
to just the South Indians or the North Indians
408
982260
2000
enbart sydindierna eller nordindierna
16:24
or the Pakistanis;
409
984260
2000
eller pakistanierna;
16:26
it belongs to all of us.
410
986260
2000
den tillhör oss alla.
16:28
These are our ancestors --
411
988260
2000
De är våra förfäder --
16:30
yours and mine.
412
990260
2000
era och mina.
16:32
They were silenced
413
992260
2000
De tystades
16:34
by an unfortunate accident of history.
414
994260
2000
genom en olycklig historiens slump.
16:36
If we decipher the script,
415
996260
2000
Om vi uttyder skriften
16:38
we would enable them to speak to us again.
416
998260
2000
gör vi det möjligt för dem att tala till oss igen.
16:40
What would they tell us?
417
1000260
3000
Vad skulle de berätta för oss?
16:43
What would we find out about them? About us?
418
1003260
3000
Vad skulle vi få reda på om dem? Om oss?
16:46
I can't wait to find out.
419
1006260
3000
Jag längtar verkligen efter att få veta.
16:49
Thank you.
420
1009260
2000
Tack så mycket.
16:51
(Applause)
421
1011260
4000
(Applåder)
Om denna webbplats

På den här webbplatsen hittar du YouTube-videor som är användbara för att lära sig engelska. Du kommer att få se engelska lektioner som ges av förstklassiga lärare från hela världen. Dubbelklicka på de engelska undertexterna som visas på varje videosida för att spela upp videon därifrån. Undertexterna rullar i takt med videouppspelningen. Om du har några kommentarer eller önskemål kan du kontakta oss via detta kontaktformulär.

https://forms.gle/WvT1wiN1qDtmnspy7