Rajesh Rao: Computing a Rosetta Stone for the Indus script

1,210,240 views ・ 2011-06-28

TED


Toista video kaksoisnapsauttamalla alla olevaa englanninkielistä tekstitystä.

Kääntäjä: Yrjö Immonen Oikolukija: Ulla Vainio
00:15
I'd like to begin with a thought experiment.
0
15260
3000
Haluan aloittaa ajatuskokeella.
00:19
Imagine that it's 4,000 years into the future.
1
19260
3000
Kuvitelkaa aikaa 4000 vuoden kuluttua.
00:22
Civilization as we know it
2
22260
2000
Tuntemaamme sivilisaatiota
00:24
has ceased to exist --
3
24260
2000
ei enää ole --
00:26
no books,
4
26260
2000
ei kirjoja,
00:28
no electronic devices,
5
28260
3000
ei elektronisia laitteita,
00:31
no Facebook or Twitter.
6
31260
3000
ei Facebookia eikä Twitteriä.
00:34
All knowledge of the English language and the English alphabet
7
34260
3000
Kaikki tieto englannin kielestä ja aakkosista
00:37
has been lost.
8
37260
2000
on kadonnut.
00:39
Now imagine archeologists
9
39260
2000
Kuvitelkaa arkeologeja
00:41
digging through the rubble of one of our cities.
10
41260
2000
kaivelemassa jonkin kaupunkimme raunioita.
00:43
What might they find?
11
43260
2000
Mitähän he löytäisivät?
00:45
Well perhaps some rectangular pieces of plastic
12
45260
3000
Ehkäpä suorakaiteen muotoisia muovinpaloja
00:48
with strange symbols on them.
13
48260
3000
outoine symboleineen.
00:51
Perhaps some circular pieces of metal.
14
51260
3000
Ehkä pyöreitä metallinpaloja.
00:54
Maybe some cylindrical containers
15
54260
2000
Ehkä lieriön muotoisia purkkeja
00:56
with some symbols on them.
16
56260
2000
symboleineen.
00:58
And perhaps one archeologist becomes an instant celebrity
17
58260
3000
Jostain arkeologista saattaa tulla hetkessä julkkis
01:01
when she discovers --
18
61260
2000
löytäessään --
01:03
buried in the hills somewhere in North America --
19
63260
2000
jonnekin Pohjois-Amerikan vuoristoon hautautuneina --
01:05
massive versions of these same symbols.
20
65260
3000
samojen symbolien valtavia versioita.
01:10
Now let's ask ourselves,
21
70260
2000
Pohditaanpa,
01:12
what could such artifacts say about us
22
72260
3000
mitä tällaiset löydöt kertoisivat meistä
01:15
to people 4,000 years into the future?
23
75260
3000
ihmisille 4000 vuoden kuluttua.
01:18
This is no hypothetical question.
24
78260
2000
Tämä ei ole vain hypoteettinen kysymys.
01:20
In fact, this is exactly the kind of question we're faced with
25
80260
3000
Itse asiassa juuri tällaiseen kysymykseen törmäämme
01:23
when we try to understand the Indus Valley civilization,
26
83260
3000
yrittäessämme ymmärtää Indus-laakson
01:26
which existed 4,000 years ago.
27
86260
2000
4000 vuotta vanhaa sivilisaatiota.
01:28
The Indus civilization was roughly contemporaneous
28
88260
3000
Indus-sivilisaatio kukoisti suunnilleen samaan aikaan
01:31
with the much better known Egyptian and the Mesopotamian civilizations,
29
91260
3000
kuin paremmin tunnetut Egyptin ja Mesopotamian sivilisaatiot,
01:34
but it was actually much larger than either of these two civilizations.
30
94260
3000
mutta se oli itse asiassa näitä paljon suurempi.
01:37
It occupied the area
31
97260
2000
Se käsitti noin
01:39
of approximately one million square kilometers,
32
99260
2000
miljoonan neliökilometrin alueen:
01:41
covering what is now Pakistan,
33
101260
2000
nykyisen Pakistanin,
01:43
Northwestern India
34
103260
2000
Luoteis-Intian
01:45
and parts of Afghanistan and Iran.
35
105260
2000
ja osia Afganistanista ja Iranista.
01:47
Given that it was such a vast civilization,
36
107260
2000
Kun kyseessä oli niin laaja sivilisaatio,
01:49
you might expect to find really powerful rulers, kings,
37
109260
4000
sieltä olettaisi löytyvän mahtavia hallitsijoita, kuninkaita
01:53
and huge monuments glorifying these powerful kings.
38
113260
3000
ja heitä ylistäviä valtavia monumentteja.
01:56
In fact,
39
116260
2000
Itse asiassa
01:58
what archeologists have found is none of that.
40
118260
2000
arkeologit eivät ole löytäneet mitään sellaista.
02:00
They've found small objects such as these.
41
120260
3000
He ovat löytäneet tällaisia pikkuesineitä.
02:03
Here's an example of one of these objects.
42
123260
3000
Tässä esimerkki yhdestä niistä.
02:06
Well obviously this is a replica.
43
126260
2000
Tietysti tämä on jäljennös.
02:08
But who is this person?
44
128260
3000
Mutta kuka tämä henkilö on?
02:11
A king? A god?
45
131260
2000
Kuningas, jumala?
02:13
A priest?
46
133260
2000
Pappi?
02:15
Or perhaps an ordinary person
47
135260
2000
Vaiko ihan tavallinen
02:17
like you or me?
48
137260
2000
ihminen?
02:19
We don't know.
49
139260
2000
Sitä ei tiedetä.
02:21
But the Indus people also left behind artifacts with writing on them.
50
141260
3000
Mutta Induksen ihmisiltä jäi myös esineitä, joissa oli kirjoitusta.
02:24
Well no, not pieces of plastic,
51
144260
2000
Ei muoviläpyköitä,
02:26
but stone seals, copper tablets,
52
146260
3000
vaan kivisinettejä, kuparilaattoja
02:29
pottery and, surprisingly,
53
149260
2000
ja keramiikkaa sekä yllättävästi
02:31
one large sign board,
54
151260
2000
yksi iso merkkikilpi,
02:33
which was found buried near the gate of a city.
55
153260
2000
hautautuneena kaupungin portin lähelle.
02:35
Now we don't know if it says Hollywood,
56
155260
2000
Ei tiedetä, lukeeko siinä Hollywood,
02:37
or even Bollywood for that matter.
57
157260
2000
tai edes Bollywood.
02:39
In fact, we don't even know
58
159260
2000
Tosiasiassa yhdenkään esineen
02:41
what any of these objects say,
59
161260
2000
sanomaa ei ymmärretä.
02:43
and that's because the Indus script is undeciphered.
60
163260
3000
Siksi, ettei Indus-kirjoitusta ole kyetty tulkitsemaan.
02:46
We don't know what any of these symbols mean.
61
166260
2000
Kaikkien näiden symbolien merkitys on avaamatta.
02:48
The symbols are most commonly found on seals.
62
168260
3000
Yleensä symbolit esiintyvät sineteissä.
02:51
So you see up there one such object.
63
171260
2000
Tuolla näkyy yksi sellainen.
02:53
It's the square object with the unicorn-like animal on it.
64
173260
3000
Neliönmuotoisessa esineessä on yksisarvista muistuttava eläin.
02:56
Now that's a magnificent piece of art.
65
176260
2000
Se on upeaa taidetta.
02:58
So how big do you think that is?
66
178260
2000
Kuinka suureksi luulette sitä?
03:00
Perhaps that big?
67
180260
2000
Näin suureksi?
03:02
Or maybe that big?
68
182260
2000
Tai ehkä näin suureksi?
03:04
Well let me show you.
69
184260
2000
Katsokaapa.
03:07
Here's a replica of one such seal.
70
187260
3000
Tässä on yhden sinetin jäljennös.
03:10
It's only about one inch by one inch in size --
71
190260
2000
Sen koko on vain noin 3 cm x 3 cm --
03:12
pretty tiny.
72
192260
2000
aika pieni.
03:14
So what were these used for?
73
194260
2000
Mihin näitä käytettiin?
03:16
We know that these were used for stamping clay tags
74
196260
3000
Tiedetään, että niitä käytettiin savimerkkien painantaan,
03:19
that were attached to bundles of goods that were sent from one place to the other.
75
199260
3000
kiinnitettäviksi tavaranippuihin, jotka lähetettiin paikasta toiseen.
03:22
So you know those packing slips you get on your FedEx boxes?
76
202260
3000
Tiedättehän lähetysluettelot FedEx-laatikoissa?
03:25
These were used to make those kinds of packing slips.
77
205260
3000
Merkkejä käytettiin samanlaisten lähetyslistojen tekemiseen.
03:28
You might wonder what these objects contain
78
208260
3000
Joutuu kysymään, mitä näiden esineiden
03:31
in terms of their text.
79
211260
2000
teksti sisälsi.
03:33
Perhaps they're the name of the sender
80
213260
2000
Mahdollisesti lähettäjän nimen
03:35
or some information about the goods
81
215260
2000
tai tietoa lähetettävistä tavaroista --
03:37
that are being sent from one place to the other -- we don't know.
82
217260
3000
varmaa tietoa ei ole.
03:40
We need to decipher the script to answer that question.
83
220260
2000
Kysymykseen vastaaminen vaatii kirjoituksen tulkitsemisen.
03:42
Deciphering the script
84
222260
2000
Kirjoituksen tulkinta
03:44
is not just an intellectual puzzle;
85
224260
2000
ei ole pelkkä älyllinen pulma;
03:46
it's actually become a question
86
226260
2000
siitä on tullut kysymys,
03:48
that's become deeply intertwined
87
228260
2000
joka on lujasti kietoutunut
03:50
with the politics and the cultural history of South Asia.
88
230260
3000
Etelä-Aasian politiikkaan ja kulttuurihistoriaan.
03:53
In fact, the script has become a battleground of sorts
89
233260
3000
Kirjoitus on itse asiassa tullut kiistakapulaksi
03:56
between three different groups of people.
90
236260
2000
kolmen eri ihmisryhmän välille.
03:58
First, there's a group of people
91
238260
2000
Ensiksi ryhmä ihmisiä
04:00
who are very passionate in their belief
92
240260
2000
uskoo intohimoisesti,
04:02
that the Indus script
93
242260
2000
ettei Indus-kirjoitus
04:04
does not represent a language at all.
94
244260
2000
edusta kieltä lainkaan.
04:06
These people believe that the symbols
95
246260
2000
Nämä ihmiset uskovat, että symbolit
04:08
are very similar to the kind of symbols you find on traffic signs
96
248260
3000
muistuttavat kovasti liikennemerkkien symboleita
04:11
or the emblems you find on shields.
97
251260
3000
tai kilpien tunnuskuvia.
04:14
There's a second group of people
98
254260
2000
Toinen ihmisryhmä
04:16
who believe that the Indus script represents an Indo-European language.
99
256260
3000
uskoo Indus-kirjoituksen edustavan indoeurooppalaista kieltä.
04:19
If you look at a map of India today,
100
259260
2000
Kun tarkastelee nyky-Intian karttaa,
04:21
you'll see that most of the languages spoken in North India
101
261260
3000
huomaa useimpien Pohjois-Intiassa puhuttavista kielistä
04:24
belong to the Indo-European language family.
102
264260
3000
kuuluvan indoeurooppalaiseen kielikuntaan.
04:27
So some people believe that the Indus script
103
267260
2000
Jotkut siis uskovat Indus-kirjoituksen
04:29
represents an ancient Indo-European language such as Sanskrit.
104
269260
3000
edustavan sanskritin tapaista muinaista indoeurooppalaista kieltä.
04:32
There's a last group of people
105
272260
2000
Kolmas ryhmä
04:34
who believe that the Indus people
106
274260
3000
uskoo Induksen asukkaiden
04:37
were the ancestors of people living in South India today.
107
277260
3000
olleen nykyään Etelä-Intiassa asuvien ihmisten esi-isiä.
04:40
These people believe that the Indus script
108
280260
2000
Ryhmä uskoo Indus-kirjoituksen
04:42
represents an ancient form
109
282260
2000
edustavan dravidakielten
04:44
of the Dravidian language family,
110
284260
2000
muinaista muotoa.
04:46
which is the language family spoken in much of South India today.
111
286260
3000
Monet Etelä-Intian nykykielet kuuluvat tähän kielikuntaan.
04:49
And the proponents of this theory
112
289260
2000
Tämän teorian kannattajat
04:51
point to that small pocket of Dravidian-speaking people in the North,
113
291260
3000
viittaavat pieneen dravidakieliseen saarekkeeseen pohjoisessa,
04:54
actually near Afghanistan,
114
294260
2000
oikeastaan Afganistanin lähellä,
04:56
and they say that perhaps, sometime in the past,
115
296260
3000
ja he väittävät, että joskus menneisyydessä
04:59
Dravidian languages were spoken all over India
116
299260
3000
dravidakieliä puhuttiin kaikkialla Intiassa,
05:02
and that this suggests
117
302260
2000
ja tämän mukaan
05:04
that the Indus civilization is perhaps also Dravidian.
118
304260
3000
Indus-sivilisaatio kuulunee myös dravida-yhteisöön.
05:07
Which of these hypotheses can be true?
119
307260
3000
Mikä näistä hypoteeseista on tosi?
05:10
We don't know, but perhaps if you deciphered the script,
120
310260
2000
Sitä ei tiedetä, mutta jos kirjoituksen avain löydettäisiin,
05:12
you would be able to answer this question.
121
312260
2000
saataisiin ehkä vastaus.
05:14
But deciphering the script is a very challenging task.
122
314260
2000
Mutta kirjoituksen tulkitseminen on kova haaste.
05:16
First, there's no Rosetta Stone.
123
316260
2000
Ensinnäkin puuttuu Rosettan kivi.
05:18
I don't mean the software;
124
318260
2000
En tarkoita softaa;
05:20
I mean an ancient artifact
125
320260
2000
tarkoitan muinaisjäännöstä,
05:22
that contains in the same text
126
322260
2000
jossa on sama sisältö
05:24
both a known text and an unknown text.
127
324260
3000
sekä tunnetulla että tuntemattomalla kirjoituksella.
05:27
We don't have such an artifact for the Indus script.
128
327260
3000
Sellaista artefaktia ei Indus-kirjoitukselle ole löytynyt.
05:30
And furthermore, we don't even know what language they spoke.
129
330260
3000
Ei edes tiedetä, mitä kieltä induslaiset puhuivat.
05:33
And to make matters even worse,
130
333260
2000
Mikä pahinta,
05:35
most of the text that we have are extremely short.
131
335260
2000
useimmat löydetyt tekstit ovat perin lyhyitä.
05:37
So as I showed you, they're usually found on these seals
132
337260
2000
Kuten esitin, tavallisesti tekstit ovat sineteissä,
05:39
that are very, very tiny.
133
339260
2000
jotka ovat hyvin, hyvin pieniä.
05:41
And so given these formidable obstacles,
134
341260
2000
Näiden valtavien vastusten takia
05:43
one might wonder and worry
135
343260
2000
voisi piinata itseään kysymyksellä,
05:45
whether one will ever be able to decipher the Indus script.
136
345260
3000
onko Indus-kirjoituksen tulkitseminen koskaan mahdollista.
05:48
In the rest of my talk,
137
348260
2000
Puheeni loppuosassa
05:50
I'd like to tell you about how I learned to stop worrying
138
350260
2000
kerron, kuinka lakkasin huolehtimasta
05:52
and love the challenge posed by the Indus script.
139
352260
2000
ja opin rakastamaan Indus-kirjoituksen haastetta.
05:54
I've always been fascinated by the Indus script
140
354260
3000
Indus-kirjoitus on kiehtonut mieltäni
05:57
ever since I read about it in a middle school textbook.
141
357260
2000
aina siitä lähtien, kun luin siitä koulussa.
05:59
And why was I fascinated?
142
359260
2000
Mikä siinä viehätti?
06:01
Well it's the last major undeciphered script in the ancient world.
143
361260
4000
Se on viimeinen merkittävä muinainen tulkitsematon kieli.
06:05
My career path led me to become a computational neuroscientist,
144
365260
3000
Urallani päädyin laskennalliseksi neurotietelijäksi,
06:08
so in my day job,
145
368260
2000
joten päivätyökseni
06:10
I create computer models of the brain
146
370260
2000
luon tietokonemalleja aivoista
06:12
to try to understand how the brain makes predictions,
147
372260
3000
pyrkiessäni ymmärtämään, kuinka aivot tekevät ennusteita,
06:15
how the brain makes decisions,
148
375260
2000
kuinka aivot tekevät päätöksiä,
06:17
how the brain learns and so on.
149
377260
2000
kuinka aivot oppivat jne.
06:19
But in 2007, my path crossed again with the Indus script.
150
379260
3000
Vuonna 2007 jouduin taas tekemisiin Indus-kirjoituksen kanssa.
06:22
That's when I was in India,
151
382260
2000
Se tapahtui Intiassa
06:24
and I had the wonderful opportunity
152
384260
2000
saadessani hienon tilaisuuden
06:26
to meet with some Indian scientists
153
386260
2000
tavata intialaisia tieteilijöitä,
06:28
who were using computer models to try to analyze the script.
154
388260
3000
jotka käyttivät tietokonemalleja kirjoituksen analysointiin.
06:31
And so it was then that I realized
155
391260
2000
Silloin tajusin,
06:33
there was an opportunity for me to collaborate with these scientists,
156
393260
3000
saaneeni tilaisuuden yhteistyöhön näiden tieteilijöiden kanssa,
06:36
and so I jumped at that opportunity.
157
396260
2000
ja siihen tilaisuuteen tarrasin kiinni.
06:38
And I'd like to describe some of the results that we have found.
158
398260
2000
Haluaisin kuvailla joitakin saamistamme tuloksista.
06:40
Or better yet, let's all collectively decipher.
159
400260
3000
Tai oikeastaan voisimme yhdessä purkaa tekstiä.
06:43
Are you ready?
160
403260
2000
Valmiina?
06:45
The first thing that you need to do when you have an undeciphered script
161
405260
3000
Ensiksi on yritettävä ratkaista vielä tulkitsemattoman tekstin
06:48
is try to figure out the direction of writing.
162
408260
2000
kirjoitussuunta.
06:50
Here are two texts that contain some symbols on them.
163
410260
3000
Näissä kahdessa tekstissä on joitain symboleja.
06:53
Can you tell me
164
413260
2000
Voitteko kertoa,
06:55
if the direction of writing is right to left or left to right?
165
415260
3000
kulkeeko kirjoitus vasemmalta oikealle vai oikealta vasemmalle?
06:58
I'll give you a couple of seconds.
166
418260
3000
Miettikää pari sekuntia.
07:01
Okay. Right to left, how many? Okay.
167
421260
3000
OK. Oikealta vasemmalle, montako?
07:04
Okay. Left to right?
168
424260
2000
OK. Vasemmalta oikealle?
07:06
Oh, it's almost 50/50. Okay.
169
426260
2000
Miltei 50/50. OK.
07:08
The answer is:
170
428260
2000
Vastaus:
07:10
if you look at the left-hand side of the two texts,
171
430260
2000
jos katsoo tekstien vasenta puolta,
07:12
you'll notice that there's a cramping of signs,
172
432260
3000
voi huomata merkkien pakkautumisen.
07:15
and it seems like 4,000 years ago,
173
435260
2000
ja kirjurilta näyttää 4000 vuotta sitten
07:17
when the scribe was writing from right to left,
174
437260
2000
oikealta vasemmalle kirjoittaessaan
07:19
they ran out of space.
175
439260
2000
loppuneen tila.
07:21
And so they had to cram the sign.
176
441260
2000
Merkit täytyi sulloa pieneen tilaan.
07:23
One of the signs is also below the text on the top.
177
443260
2000
Yksi merkeistä on myös yläpuolisen tekstin alla.
07:25
This suggests the direction of writing
178
445260
2000
Tämä vihjaa kirjoituksen kulkeneen
07:27
was probably from right to left,
179
447260
2000
mahdollisesti oikealta vasemmalle.
07:29
and so that's one of the first things we know,
180
449260
2000
Yksi tärkeimmistä tiedoistamme on,
07:31
that directionality is a very key aspect of linguistic scripts.
181
451260
3000
että kirjoitussuunta on kielellisen kirjoituksen avainasia.
07:34
And the Indus script now has
182
454260
2000
Indus-kirjoituksessa on
07:36
this particular property.
183
456260
2000
tämä erityisominaisuus.
07:38
What other properties of language does the script show?
184
458260
2000
Mitä muita kielen ominaisuuksia kirjoituksessa on?
07:40
Languages contain patterns.
185
460260
2000
Kielissä on rakennemalleja.
07:42
If I give you the letter Q
186
462260
2000
Jos aloitetaan q-kirjaimella,
07:44
and ask you to predict the next letter, what do you think that would be?
187
464260
3000
minkä kirjaimen ennustaisitte tulevan seuraavaksi?
07:47
Most of you said U, which is right.
188
467260
2000
Useimmat sanoivat u, mikä on oikein.
07:49
Now if I asked you to predict one more letter,
189
469260
2000
Jos pyytäisin vielä seuraavaa kirjainta,
07:51
what do you think that would be?
190
471260
2000
mikähän se olisi?
07:53
Now there's several thoughts. There's E. It could be I. It could be A,
191
473260
3000
Mieleen tulee useampia. Se voisi olla e, i tai a.
07:56
but certainly not B, C or D, right?
192
476260
3000
mutta ei varmaankaan b, c tai d?
07:59
The Indus script also exhibits similar kinds of patterns.
193
479260
3000
Indus-kirjoituksessa on samankaltaisia malleja.
08:02
There's a lot of text that start with this diamond-shaped symbol.
194
482260
3000
Monet tekstit alkavat tällä timantin muotoisella symbolilla.
08:05
And this in turn tends to be followed
195
485260
2000
Tätä puolestaan seuraa usein
08:07
by this quotation marks-like symbol.
196
487260
2000
lainausmerkin kaltainen symboli.
08:09
And this is very similar to a Q and U example.
197
489260
2000
Tämä muistuttaa kovasti q ja u -esimerkkiä.
08:11
This symbol can in turn be followed
198
491260
2000
Tätä symbolia voivat puolestaan seurata
08:13
by these fish-like symbols and some other signs,
199
493260
3000
kalaa muistuttavat ja jotkut muut merkit,
08:16
but never by these other signs at the bottom.
200
496260
2000
mutta eivät koskaan alla olevat muut merkit.
08:18
And furthermore, there's some signs
201
498260
2000
Lisäksi jotkut merkit sijaitsevat
08:20
that really prefer the end of texts,
202
500260
2000
todella usein tekstin lopussa,
08:22
such as this jar-shaped sign,
203
502260
2000
kuten tämä ruukun muotoinen merkki.
08:24
and this sign, in fact, happens to be
204
504260
2000
Itse asiassa tämä merkki sattuu olemaan
08:26
the most frequently occurring sign in the script.
205
506260
2000
kirjoituksen yleisin merkki.
08:28
Given such patterns, here was our idea.
206
508260
3000
Näistä malleista saimme seuraavan idean.
08:31
The idea was to use a computer
207
511260
2000
Syötimme tietokoneelle
08:33
to learn these patterns,
208
513260
2000
nämä mallit
08:35
and so we gave the computer the existing texts.
209
515260
3000
ja olemassa olevat tekstit.
08:38
And the computer learned a statistical model
210
518260
2000
Tietokone oppi tilastollisen mallin
08:40
of which symbols tend to occur together
211
520260
2000
usein yhdessä esiintyvistä symboleista
08:42
and which symbols tend to follow each other.
212
522260
2000
ja usein toisiaan seuraavista symboleista.
08:44
Given the computer model,
213
524260
2000
Tietokonemallia
08:46
we can test the model by essentially quizzing it.
214
526260
3000
voimme testata pääasiassa kyselemällä siltä.
08:49
So we could deliberately erase some symbols,
215
529260
2000
Voimme tarkoituksellisesti poistaa symboleja
08:51
and we can ask it to predict the missing symbols.
216
531260
3000
ja pyytää sitä ennustamaan puuttuvat symbolit.
08:54
Here are some examples.
217
534260
3000
Tässä esimerkkejä.
09:00
You may regard this
218
540260
2000
Tätä voisi ehkä pitää
09:02
as perhaps the most ancient game
219
542260
2000
muinaisaikojen
09:04
of Wheel of Fortune.
220
544260
3000
Onnenpyörä-pelinä.
09:08
What we found
221
548260
2000
Tietokone
09:10
was that the computer was successful in 75 percent of the cases
222
550260
2000
onnistui 75-prosenttisesti
09:12
in predicting the correct symbol.
223
552260
2000
ennustamaan oikean symbolin.
09:14
In the rest of the cases,
224
554260
2000
Muissa tapauksissa
09:16
typically the second best guess or third best guess was the right answer.
225
556260
3000
oikea vastaus oli tyypillisesti toiseksi tai kolmanneksi paras veikkaus.
09:19
There's also practical use
226
559260
2000
Tästä erityismenettelystä
09:21
for this particular procedure.
227
561260
2000
on myös käytännön hyötyä.
09:23
There's a lot of these texts that are damaged.
228
563260
2000
Monet tekstit ovat vaurioituneet.
09:25
Here's an example of one such text.
229
565260
2000
Tässä esimerkki yhdestä.
09:27
And we can use the computer model now to try to complete this text
230
567260
3000
Tietokonemallin avulla voidaan pyrkiä täydentämään teksti
09:30
and make a best guess prediction.
231
570260
2000
ja saamaan paras ennuste.
09:32
Here's an example of a symbol that was predicted.
232
572260
3000
Tässä on esimerkki ennustetusta symbolista.
09:35
And this could be really useful as we try to decipher the script
233
575260
2000
Tästä voisi olla paljon hyötyä, kun pyritään avaamaan kirjoitusta
09:37
by generating more data that we can analyze.
234
577260
3000
luomalla lisää analysoitavaa dataa.
09:40
Now here's one other thing you can do with the computer model.
235
580260
3000
Tässä vielä toinen esimerkki tetokonemallin käytöstä.
09:43
So imagine a monkey
236
583260
2000
Kuvitelkaa apina
09:45
sitting at a keyboard.
237
585260
2000
näppäimistön ääreen.
09:47
I think you might get a random jumble of letters that looks like this.
238
587260
3000
Tulos voisi olla tällainen umpimähkäinen kirjainhässäkkä.
09:50
Such a random jumble of letters
239
590260
2000
Satunnaisella kirjainsotkulla
09:52
is said to have a very high entropy.
240
592260
2000
sanotaan olevan suuri entropia.
09:54
This is a physics and information theory term.
241
594260
2000
Se on fysiikan ja informaatioteorian termi.
09:56
But just imagine it's a really random jumble of letters.
242
596260
3000
Mutta pitäkää sitä vain summittaisena kirjainseoksena.
09:59
How many of you have ever spilled coffee on a keyboard?
243
599260
4000
Kuinka moni on läikyttänyt kahvia näppäimistölle?
10:03
You might have encountered the stuck-key problem --
244
603260
2000
Näppäimistönne on ehkä jumiutunut --
10:05
so basically the same symbol being repeated over and over again.
245
605260
3000
sama symboli toistuu yhä uudelleen.
10:08
This kind of a sequence is said to have a very low entropy
246
608260
3000
Tällaisella jaksolla sanotaan olevan hyvin pieni entropia,
10:11
because there's no variation at all.
247
611260
2000
koska kaikki vaihtelu puuttuu.
10:13
Language, on the other hand, has an intermediate level of entropy;
248
613260
3000
Toisaalta, kielellä on keskitason entropia;
10:16
it's neither too rigid,
249
616260
2000
se ei ole liian jähmeä,
10:18
nor is it too random.
250
618260
2000
eikä liian satunnainen.
10:20
What about the Indus script?
251
620260
2000
Entä Indus-kirjoitus?
10:22
Here's a graph that plots the entropies of a whole bunch of sequences.
252
622260
4000
Tämä kaavio kuvaa monien merkkiryppäiden entropiaa.
10:26
At the very top you find the uniformly random sequence,
253
626260
2000
Ihan ylimpänä on täysin sattumanvarainen merkkisarja,
10:28
which is a random jumble of letters --
254
628260
2000
summittainen kirjainten sekoitus --
10:30
and interestingly, we also find
255
630260
2000
huomiota herättää, että siellä ovat myös
10:32
the DNA sequence from the human genome and instrumental music.
256
632260
3000
ihmisen genomin DNA-jakso ja instrumentaalimusiikki.
10:35
And both of these are very, very flexible,
257
635260
2000
Ne molemmat ovat hyvin, hyvin joustavia,
10:37
which is why you find them in the very high range.
258
637260
2000
mistä johtuen ne ovat aivan yläasteikolla.
10:39
At the lower end of the scale,
259
639260
2000
Asteikon alapäässä on
10:41
you find a rigid sequence, a sequence of all A's,
260
641260
2000
pelkkien a-kirjainten jähmeä jakso
10:43
and you also find a computer program,
261
643260
2000
sekä tietokoneohjelma,
10:45
in this case in the language Fortran,
262
645260
2000
tällä kertaa Fortran-kielinen,
10:47
which obeys really strict rules.
263
647260
2000
joka noudattaa todella tiukkoja sääntöjä.
10:49
Linguistic scripts
264
649260
2000
Kielelliset kirjoitukset
10:51
occupy the middle range.
265
651260
2000
sijaitsevat keskiasteikolla.
10:53
Now what about the Indus script?
266
653260
2000
Entäpä Indus-kirjoitus?
10:55
We found that the Indus script
267
655260
2000
Indus-kirjoituksen huomattiin
10:57
actually falls within the range of the linguistic scripts.
268
657260
2000
todellakin sijoittuvan kielellisten kirjoitusten joukkoon.
10:59
When this result was first published,
269
659260
2000
Kun tulos julkistettiin,
11:01
it was highly controversial.
270
661260
3000
se oli hyvin kiistanalainen.
11:04
There were people who raised a hue and cry,
271
664260
3000
Jotkut nostivat kauhean älämölön,
11:07
and these people were the ones who believed
272
667260
2000
ja he olivat niitä, jotka uskoivat,
11:09
that the Indus script does not represent language.
273
669260
3000
että Indus-kirjoitus ei edusta kieltä.
11:12
I even started to get some hate mail.
274
672260
2000
Aloin saada jopa vihapostia.
11:14
My students said
275
674260
2000
Oppilaani kehottivat
11:16
that I should really seriously consider getting some protection.
276
676260
3000
minua harkitsemaan vakavasti suojelun hankkimista.
11:19
Who'd have thought
277
679260
2000
Kuka olisi uskonut,
11:21
that deciphering could be a dangerous profession?
278
681260
2000
että tulkitseminen voisi olla vaarallinen ammatti?
11:23
What does this result really show?
279
683260
2000
Mitä tämä tulos todella osoittaa?
11:25
It shows that the Indus script
280
685260
2000
Sen, että Indus-kirjoituksella
11:27
shares an important property of language.
281
687260
2000
on tärkeä kielellinen ominaisuus.
11:29
So, as the old saying goes,
282
689260
2000
Vanhan sanonnan mukaan,
11:31
if it looks like a linguistic script
283
691260
2000
jos se näyttää kielelliseltä kirjoitukselta
11:33
and it acts like a linguistic script,
284
693260
2000
ja toimii kuin kielellinen kirjoitus,
11:35
then perhaps we may have a linguistic script on our hands.
285
695260
3000
niin ollaan ehkä tekemisissä kielellisen kirjoituksen kanssa.
11:38
What other evidence is there
286
698260
2000
Mitä muu todistaa,
11:40
that the script could actually encode language?
287
700260
2000
että kirjoitus voisi todella koodata kieltä?
11:42
Well linguistic scripts can actually encode multiple languages.
288
702260
3000
Kielelliset kirjoitukset voivat itse asiassa koodata useita kieliä.
11:45
So for example, here's the same sentence written in English
289
705260
3000
Esimerkiksi tässä sama lause on kirjoitettu
11:48
and the same sentence written in Dutch
290
708260
2000
englanniksi ja hollanniksi
11:50
using the same letters of the alphabet.
291
710260
2000
samoja aakkosia käyttäen.
11:52
If you don't know Dutch and you only know English
292
712260
3000
Jos osaa vain englantia,
11:55
and I give you some words in Dutch,
293
715260
2000
ja saa eteensä sanoja hollanniksi,
11:57
you'll tell me that these words contain
294
717260
2000
voi todeta, että sanat sisältävät
11:59
some very unusual patterns.
295
719260
2000
hyvin epätavallisia malleja.
12:01
Some things are not right,
296
721260
2000
Jokin ei täsmää,
12:03
and you'll say these words are probably not English words.
297
723260
3000
ja voi väittää, etteivät sanat luultavasti ole englantia.
12:06
The same thing happens in the case of the Indus script.
298
726260
2000
Samaa sattuu Indus-kirjoituksessa.
12:08
The computer found several texts --
299
728260
2000
Tietokone löysi useita tekstejä --
12:10
two of them are shown here --
300
730260
2000
kaksi niistä tässä --
12:12
that have very unusual patterns.
301
732260
2000
joiden mallit ovat hyvin epätavalliset.
12:14
So for example the first text:
302
734260
2000
Esimerkiksi ensimmäinen teksti:
12:16
there's a doubling of this jar-shaped sign.
303
736260
3000
siinä on kannun muotoisen merkin kahdennus.
12:19
This sign is the most frequently-occurring sign
304
739260
2000
Tämä merkki on yleisin
12:21
in the Indus script,
305
741260
2000
Indus-kirjoituksessa,
12:23
and it's only in this text
306
743260
2000
ja vain tässä tekstissä
12:25
that it occurs as a doubling pair.
307
745260
2000
se esiintyy kahdentuneena.
12:27
Why is that the case?
308
747260
2000
Mistä tämä johtuu?
12:29
We went back and looked at where these particular texts were found,
309
749260
3000
Palasimme tutkimaan, mistä kyseiset tekstit löydettiin,
12:32
and it turns out that they were found
310
752260
2000
ja kävi ilmi, että ne löydettiin
12:34
very, very far away from the Indus Valley.
311
754260
2000
hyvin, hyvin kaukana Indus-laaksosta.
12:36
They were found in present day Iraq and Iran.
312
756260
3000
Ne löydettiin nykyisestä Irakista ja Iranista.
12:39
And why were they found there?
313
759260
2000
Miksi ne löydettiin sieltä?
12:41
What I haven't told you is that
314
761260
2000
En ole kertonut,
12:43
the Indus people were very, very enterprising.
315
763260
2000
että induslaiset olivat hyvin, hyvin yritteliäitä.
12:45
They used to trade with people pretty far away from where they lived,
316
765260
3000
He tekivät kauppaa melko kaukana omasta asuinpaikastaan.
12:48
and so in this case, they were traveling by sea
317
768260
3000
Tässä tapauksessa he matkasivat meritse
12:51
all the way to Mesopotamia, present-day Iraq.
318
771260
3000
aina Mesopotamiaan asti, nykyiseen Irakiin.
12:54
And what seems to have happened here
319
774260
2000
Näyttää siltä,
12:56
is that the Indus traders, the merchants,
320
776260
3000
että Indus-kauppiaat
12:59
were using this script to write a foreign language.
321
779260
3000
käyttivät kirjoitustaan vieraan kielen kirjoittamiseen.
13:02
It's just like our English and Dutch example.
322
782260
2000
Aivan kuin esimerkissä englannista ja hollannista.
13:04
And that would explain why we have these strange patterns
323
784260
2000
Se selittäisi oudot mallit,
13:06
that are very different from the kinds of patterns you see in the text
324
786260
3000
jotka poikkeavat suuresti Indus-laakson alueelta löydettyjen
13:09
that are found within the Indus Valley.
325
789260
3000
tekstien malleista.
13:12
This suggests that the same script, the Indus script,
326
792260
2000
Voisi ajatella, että samaa kirjoitusta, Indus-kirjoitusta,
13:14
could be used to write different languages.
327
794260
3000
voitiin käyttää eri kielten kirjoittamiseen.
13:17
The results we have so far seem to point to the conclusion
328
797260
3000
Tähänastiset tuloksemme viittaavat päätelmään,
13:20
that the Indus script probably does represent language.
329
800260
3000
että Indus-kirjoitus luultavasti edustaa kieltä.
13:23
If it does represent language,
330
803260
2000
Jos näin on,
13:25
then how do we read the symbols?
331
805260
2000
miten symbolit tulkitaan?
13:27
That's our next big challenge.
332
807260
2000
Se on seuraava suuri haasteemme.
13:29
So you'll notice that many of the symbols
333
809260
2000
Huomaatte, että monet symbolit
13:31
look like pictures of humans, of insects,
334
811260
2000
näyttävät ihmisten, hyönteisten,
13:33
of fishes, of birds.
335
813260
3000
kalojen ja lintujen kuvilta.
13:36
Most ancient scripts
336
816260
2000
Useimmat muinaiset kirjoitukset
13:38
use the rebus principle,
337
818260
2000
käyttävät kuva-arvoitusten periaatetta,
13:40
which is, using pictures to represent words.
338
820260
3000
käyttäen kuvia edustamaan sanoja.
13:43
So as an example, here's a word.
339
823260
3000
Tässä on esimerkkisana.
13:46
Can you write it using pictures?
340
826260
2000
Voiko sen kirjoittaa kuvin?
13:48
I'll give you a couple seconds.
341
828260
2000
Muutama sekunti miettimisaikaa.
13:50
Got it?
342
830260
2000
Selvisikö?
13:52
Okay. Great.
343
832260
2000
OK. Hyvä.
13:54
Here's my solution.
344
834260
2000
Tässä minun ratkaisuni.
13:56
You could use the picture of a bee followed by a picture of a leaf --
345
836260
2000
Voisi käyttää mehiläisen kuvaa ja sen jälkeistä lehden kuvaa --
13:58
and that's "belief," right.
346
838260
2000
josta muodostuu "belief".
14:00
There could be other solutions.
347
840260
2000
Muitakin ratkaisuja voisi olla.
14:02
In the case of the Indus script,
348
842260
2000
Indus-kirjoituksen kohdalla
14:04
the problem is the reverse.
349
844260
2000
ongelma on päinvastainen.
14:06
You have to figure out the sounds of each of these pictures
350
846260
3000
Täytyy keksiä kutakin kuvaa vastaavat äänteet,
14:09
such that the entire sequence makes sense.
351
849260
2000
jotta koko kuvasarja saa merkityksen.
14:11
So this is just like a crossword puzzle,
352
851260
3000
Tämä muistuttaa ristisanatehtävää,
14:14
except that this is the mother of all crossword puzzles
353
854260
3000
mutta tämä on kaikkien ristisanatehtävien äiti,
14:17
because the stakes are so high if you solve it.
354
857260
4000
koska panokset ovat niin kovat, jos ratkaisu löytyy.
14:21
My colleagues, Iravatham Mahadevan and Asko Parpola,
355
861260
3000
Kollegani Iravatham Mahadevan ja Asko Parpola
14:24
have been making some headway on this particular problem.
356
864260
2000
ovat edistäneet tämän erityisongelman ratkaisua.
14:26
And I'd like to give you a quick example of Parpola's work.
357
866260
2000
Annan lyhyen esimerkin Parpolan työstä.
14:28
Here's a really short text.
358
868260
2000
Tässä on todella lyhyt teksti.
14:30
It contains seven vertical strokes followed by this fish-like sign.
359
870260
3000
Siihen kuuluu seitsemän pystyviivaa ennen kalannäköistä merkkiä.
14:33
And I want to mention that these seals were used
360
873260
2000
Muistutan, että näitä sinettejä käytettiin
14:35
for stamping clay tags
361
875260
2000
painettaessa savimerkkejä,
14:37
that were attached to bundles of goods,
362
877260
2000
jotka kiinnitettiin tavaranippuihin,
14:39
so it's quite likely that these tags, at least some of them,
363
879260
3000
joten on todennäköistä, että ainakin jotkut merkeistä
14:42
contain names of merchants.
364
882260
2000
sisältävät kauppiaiden nimiä.
14:44
And it turns out that in India
365
884260
2000
Käy ilmi, että vanhan intialaisen
14:46
there's a long tradition
366
886260
2000
tradition mukaan
14:48
of names being based on horoscopes
367
888260
2000
nimet perustuvat horoskooppeihin
14:50
and star constellations present at the time of birth.
368
890260
3000
ja synnyinhetken tähtikuvioihin.
14:53
In Dravidian languages,
369
893260
2000
Dravidakielissä
14:55
the word for fish is "meen"
370
895260
2000
kala-sana on "meen",
14:57
which happens to sound just like the word for star.
371
897260
3000
joka sattuu kuulostaamaan ihan tähti-sanalta.
15:00
And so seven stars
372
900260
2000
Seitsemän tähteä
15:02
would stand for "elu meen,"
373
902260
2000
tarkoittaisi "elu meen",
15:04
which is the Dravidian word
374
904260
2000
joka on dravidakielinen sana
15:06
for the Big Dipper star constellation.
375
906260
2000
Otavan tähtikuviolle.
15:08
Similarly, there's another sequence of six stars,
376
908260
3000
On myös kuuden tähden jakso,
15:11
and that translates to "aru meen,"
377
911260
2000
jonka käännökseksi tulee "aru meen",
15:13
which is the old Dravidian name
378
913260
2000
vanha dravidalainen nimitys
15:15
for the star constellation Pleiades.
379
915260
2000
Pleiadien tähtikuviolle
15:17
And finally, there's other combinations,
380
917260
3000
Lisäksi on muita yhdistelmiä,
15:20
such as this fish sign with something that looks like a roof on top of it.
381
920260
3000
kuten kala-merkki yläpuolellaan jokin kattoa muistuttava osa.
15:23
And that could be translated into "mey meen,"
382
923260
3000
Sen voisi kääntää "mey meen",
15:26
which is the old Dravidian name for the planet Saturn.
383
926260
3000
joka on Saturnus-planeetan vanha dravidalainen nimitys.
15:29
So that was pretty exciting.
384
929260
2000
Aika jännittävää.
15:31
It looks like we're getting somewhere.
385
931260
2000
Jotain tuntuu olevan selviämässä.
15:33
But does this prove
386
933260
2000
Mutta todistaako tämä,
15:35
that these seals contain Dravidian names
387
935260
2000
että sineteissä on planeettoihin
15:37
based on planets and star constellations?
388
937260
2000
ja tähtikuvioihin perustuvia dravidalaisia nimiä?
15:39
Well not yet.
389
939260
2000
Ei vielä.
15:41
So we have no way of validating
390
941260
2000
Ei ole mahdollista todistaa oikeaksi
15:43
these particular readings,
391
943260
2000
näitä erityisiä tulkintoja,
15:45
but if more and more of these readings start making sense,
392
945260
3000
mutta jos yhä useammista tulee järkeenkäyviä,
15:48
and if longer and longer sequences
393
948260
2000
ja jos yhä pitemmät jaksot
15:50
appear to be correct,
394
950260
2000
ovat ilmeisesti oikein,
15:52
then we know that we are on the right track.
395
952260
2000
tiedetään, että ollaan oikeilla jäljillä.
15:54
Today,
396
954260
2000
Nykyään
15:56
we can write a word such as TED
397
956260
3000
voidaan kirjoittaa vaikkapa TED-sana
15:59
in Egyptian hieroglyphics and in cuneiform script,
398
959260
3000
egyptiläisillä hieroglyfeillä ja nuolenpääkirjoituksella,
16:02
because both of these were deciphered
399
962260
2000
koska ne molemmat tulkittiin
16:04
in the 19th century.
400
964260
2000
1800-luvulla.
16:06
The decipherment of these two scripts
401
966260
2000
Näiden kirjoitusten tulkinta
16:08
enabled these civilizations to speak to us again directly.
402
968260
3000
auttoi noita sivilisaatioita puhuttelemaan meitä jälleen suoraan.
16:11
The Mayans
403
971260
2000
Mayat
16:13
started speaking to us in the 20th century,
404
973260
2000
alkoivat puhua meille 1900-luvulla,
16:15
but the Indus civilization remains silent.
405
975260
3000
mutta Indus-sivilisaatio on yhä hiljaa.
16:18
Why should we care?
406
978260
2000
Mitä väliä sillä on?
16:20
The Indus civilization does not belong
407
980260
2000
Indus-sivilisaatio ei kuulu vain
16:22
to just the South Indians or the North Indians
408
982260
2000
etelä- tai pohjoisintialaisille
16:24
or the Pakistanis;
409
984260
2000
tai pakistanilaisille;
16:26
it belongs to all of us.
410
986260
2000
Se kuuluu meille kaikille.
16:28
These are our ancestors --
411
988260
2000
He ovat esi-isiämme --
16:30
yours and mine.
412
990260
2000
sinun ja minun.
16:32
They were silenced
413
992260
2000
Heidät hiljensi
16:34
by an unfortunate accident of history.
414
994260
2000
historian onneton käänne.
16:36
If we decipher the script,
415
996260
2000
Jos kirjoitus tulkitaan,
16:38
we would enable them to speak to us again.
416
998260
2000
he voisivat jälleen puhutella meitä.
16:40
What would they tell us?
417
1000260
3000
Mitä he kertoisivat?
16:43
What would we find out about them? About us?
418
1003260
3000
Mitä saisimme selville heistä? Meistä?
16:46
I can't wait to find out.
419
1006260
3000
Maltan tuskin odottaa vastausta.
16:49
Thank you.
420
1009260
2000
Kiitoksia.
16:51
(Applause)
421
1011260
4000
(Suosionosoituksia)
Tietoja tästä verkkosivustosta

Tällä sivustolla esitellään YouTube-videoita, jotka ovat hyödyllisiä englannin oppimisessa. Näet englannin oppitunteja, joita opettavat huippuluokan opettajat ympäri maailmaa. Kaksoisnapsauta kullakin videosivulla näkyvää englanninkielistä tekstitystä, niin voit toistaa videon sieltä. Tekstitykset vierivät synkronoidusti videon toiston kanssa. Jos sinulla on kommentteja tai toiveita, ota meihin yhteyttä käyttämällä tätä yhteydenottolomaketta.

https://forms.gle/WvT1wiN1qDtmnspy7