Rajesh Rao: Computing a Rosetta Stone for the Indus script

1,208,232 views ・ 2011-06-28

TED


Моля, кликнете два пъти върху английските субтитри по-долу, за да пуснете видеото.

Translator: Svetlana Leneva Reviewer: Anton Hikov
00:15
I'd like to begin with a thought experiment.
0
15260
3000
Искам да започна с един мисловен опит.
00:19
Imagine that it's 4,000 years into the future.
1
19260
3000
Представете си, че сме 4000 години напред в бъдещето.
00:22
Civilization as we know it
2
22260
2000
Цивилизацията, такава каквато я познаваме,
00:24
has ceased to exist --
3
24260
2000
е престанала да съществува --
00:26
no books,
4
26260
2000
няма книги,
00:28
no electronic devices,
5
28260
3000
няма електронни устройства,
00:31
no Facebook or Twitter.
6
31260
3000
няма Фейсбук или Туитър.
00:34
All knowledge of the English language and the English alphabet
7
34260
3000
Цялото знание за английския език и английската азбука
00:37
has been lost.
8
37260
2000
е загубено.
00:39
Now imagine archeologists
9
39260
2000
Сега си представете археолози,
00:41
digging through the rubble of one of our cities.
10
41260
2000
които разкопават останките на някой наш град.
00:43
What might they find?
11
43260
2000
Какво могат да открият?
00:45
Well perhaps some rectangular pieces of plastic
12
45260
3000
Може би някакви правоъгълни парчета пластмаса
00:48
with strange symbols on them.
13
48260
3000
със странни символи по тях.
00:51
Perhaps some circular pieces of metal.
14
51260
3000
Може би някакви кръгли метални парченца.
00:54
Maybe some cylindrical containers
15
54260
2000
Може би цилиндрични контейнери
00:56
with some symbols on them.
16
56260
2000
с някакви символи по тях.
00:58
And perhaps one archeologist becomes an instant celebrity
17
58260
3000
И може би някой археолог ще стане истинска знаменитост,
01:01
when she discovers --
18
61260
2000
когато открие --
01:03
buried in the hills somewhere in North America --
19
63260
2000
погребани в хълмовете някъде в Северна Америка --
01:05
massive versions of these same symbols.
20
65260
3000
гигантски версии на същите тези символи.
01:10
Now let's ask ourselves,
21
70260
2000
Нека се запитаме,
01:12
what could such artifacts say about us
22
72260
3000
какво биха казали за нас подобни артефакти
01:15
to people 4,000 years into the future?
23
75260
3000
на хората, 4000 години напред в бъдещето?
01:18
This is no hypothetical question.
24
78260
2000
Това не е хипотетичен въпрос.
01:20
In fact, this is exactly the kind of question we're faced with
25
80260
3000
Всъщност, това е точно въпроса, пред който сме изправени,
01:23
when we try to understand the Indus Valley civilization,
26
83260
3000
когато се опитваме да разберем цивилизацията от долината на Инд,
01:26
which existed 4,000 years ago.
27
86260
2000
която е съществувала преди 4000 години.
01:28
The Indus civilization was roughly contemporaneous
28
88260
3000
Индуската цивилизация е съществувала успоредно
01:31
with the much better known Egyptian and the Mesopotamian civilizations,
29
91260
3000
с много по-известните египетска и месопотамска цивилизации,
01:34
but it was actually much larger than either of these two civilizations.
30
94260
3000
но всъщност е била много по-голяма от тези две цивилизации.
01:37
It occupied the area
31
97260
2000
Заемала е площ
01:39
of approximately one million square kilometers,
32
99260
2000
от около един милион квадратни километри,
01:41
covering what is now Pakistan,
33
101260
2000
покривайки това, което днес е Пакистан,
01:43
Northwestern India
34
103260
2000
северозападна Индия
01:45
and parts of Afghanistan and Iran.
35
105260
2000
и части от Афганистан и Иран.
01:47
Given that it was such a vast civilization,
36
107260
2000
Имайки предвид обширността на тази цивилизация,
01:49
you might expect to find really powerful rulers, kings,
37
109260
4000
може би очаквате да откриете силни управници, крале,
01:53
and huge monuments glorifying these powerful kings.
38
113260
3000
и огромни монументи, величаещи тези властни управници.
01:56
In fact,
39
116260
2000
Всъщност,
01:58
what archeologists have found is none of that.
40
118260
2000
откритото от археолозите няма нищо общо с това.
02:00
They've found small objects such as these.
41
120260
3000
Те са открили малки предмети, като тези.
02:03
Here's an example of one of these objects.
42
123260
3000
Ето един пример от тези предмети.
02:06
Well obviously this is a replica.
43
126260
2000
Е, това естествено е реплика.
02:08
But who is this person?
44
128260
3000
Но кой е този човек?
02:11
A king? A god?
45
131260
2000
Крал? Божество?
02:13
A priest?
46
133260
2000
Жрец?
02:15
Or perhaps an ordinary person
47
135260
2000
Или може би най-обикновен човек
02:17
like you or me?
48
137260
2000
като вас или мен?
02:19
We don't know.
49
139260
2000
Не знаем.
02:21
But the Indus people also left behind artifacts with writing on them.
50
141260
3000
Но хората от Инд са оставили и артефакти с надписи по тях.
02:24
Well no, not pieces of plastic,
51
144260
2000
Е, не са пластмасови парчета,
02:26
but stone seals, copper tablets,
52
146260
3000
а каменни печати, медни табелки,
02:29
pottery and, surprisingly,
53
149260
2000
керамика и, най-изненадващо,
02:31
one large sign board,
54
151260
2000
един голям надпис,
02:33
which was found buried near the gate of a city.
55
153260
2000
открит погребан близо до портата на един град.
02:35
Now we don't know if it says Hollywood,
56
155260
2000
Не знаем, дали той казва "Холивуд",
02:37
or even Bollywood for that matter.
57
157260
2000
или дори "Боливуд".
02:39
In fact, we don't even know
58
159260
2000
Всъщност, дори не знаем
02:41
what any of these objects say,
59
161260
2000
какво казва който и да е от тези предмети.
02:43
and that's because the Indus script is undeciphered.
60
163260
3000
А това е, защото писмеността на Инд не е дешифрирана.
02:46
We don't know what any of these symbols mean.
61
166260
2000
Не знаем какво означава който и да е от тези символи.
02:48
The symbols are most commonly found on seals.
62
168260
3000
Те се откриват най-вече върху печати.
02:51
So you see up there one such object.
63
171260
2000
Виждате тук горе един такъв предмет.
02:53
It's the square object with the unicorn-like animal on it.
64
173260
3000
Той е квадратен, с нещо като еднорог върху него.
02:56
Now that's a magnificent piece of art.
65
176260
2000
Наистина завладяващо произведение на изкуството.
02:58
So how big do you think that is?
66
178260
2000
Как мислите, колко е голям?
03:00
Perhaps that big?
67
180260
2000
Толкова?
03:02
Or maybe that big?
68
182260
2000
Или може би толкова?
03:04
Well let me show you.
69
184260
2000
Нека ви покажа.
03:07
Here's a replica of one such seal.
70
187260
3000
Ето реплика на такъв печат.
03:10
It's only about one inch by one inch in size --
71
190260
2000
Размерът му е само около инч на инч --
03:12
pretty tiny.
72
192260
2000
много мъничък.
03:14
So what were these used for?
73
194260
2000
За какво е бил използван?
03:16
We know that these were used for stamping clay tags
74
196260
3000
Знаем, че са били използвани за подпечатване на глинени табелки,
03:19
that were attached to bundles of goods that were sent from one place to the other.
75
199260
3000
които са били прикрепяни към вързопи от стоки, изпращани от едно място до друго.
03:22
So you know those packing slips you get on your FedEx boxes?
76
202260
3000
Нали се сещате за тези бланки, които получавате с колетите на ФедЕкс?
03:25
These were used to make those kinds of packing slips.
77
205260
3000
Използвани са за правене на подобен вид товарителници.
03:28
You might wonder what these objects contain
78
208260
3000
Може би се чудите какво са съдържали пакетите
03:31
in terms of their text.
79
211260
2000
от гледна точка на текста.
03:33
Perhaps they're the name of the sender
80
213260
2000
Може би името на изпращача
03:35
or some information about the goods
81
215260
2000
или някаква информация за стоките,
03:37
that are being sent from one place to the other -- we don't know.
82
217260
3000
които са били пращани -- не знаем.
03:40
We need to decipher the script to answer that question.
83
220260
2000
Необходимо е да дешифрираме надписите, за да отговорим на този въпрос.
03:42
Deciphering the script
84
222260
2000
Дешифрирането на писмеността
03:44
is not just an intellectual puzzle;
85
224260
2000
не е просто интелектуален ребус;
03:46
it's actually become a question
86
226260
2000
то се превръща във въпрос
03:48
that's become deeply intertwined
87
228260
2000
дълбоко преплетен
03:50
with the politics and the cultural history of South Asia.
88
230260
3000
с политическата и културна история на южна Азия.
03:53
In fact, the script has become a battleground of sorts
89
233260
3000
Всъщност, тази писменост се превърна в бойно поле
03:56
between three different groups of people.
90
236260
2000
на три различни групировки.
03:58
First, there's a group of people
91
238260
2000
Първо, има група от хора,
04:00
who are very passionate in their belief
92
240260
2000
които пламенно вярват,
04:02
that the Indus script
93
242260
2000
че надписите от Инд
04:04
does not represent a language at all.
94
244260
2000
изобщо не представят език.
04:06
These people believe that the symbols
95
246260
2000
Те вярват, че символите
04:08
are very similar to the kind of symbols you find on traffic signs
96
248260
3000
са много подобни на тези, които виждаме на пътните знаци,
04:11
or the emblems you find on shields.
97
251260
3000
или емблемите върху щитовете.
04:14
There's a second group of people
98
254260
2000
Има втора група от хора,
04:16
who believe that the Indus script represents an Indo-European language.
99
256260
3000
които вярват, че надписите от Инд представят индо-европейски език.
04:19
If you look at a map of India today,
100
259260
2000
Ако погледнете в днешната карта на Индия,
04:21
you'll see that most of the languages spoken in North India
101
261260
3000
ще видите, че повечето езици говорени в северна Индия,
04:24
belong to the Indo-European language family.
102
264260
3000
принадлежат на семейството на индо-европейските езици.
04:27
So some people believe that the Indus script
103
267260
2000
Така че, някои хора вярват, че индуската писменост
04:29
represents an ancient Indo-European language such as Sanskrit.
104
269260
3000
представлява древен индо-европейски език, примерно като санскрит.
04:32
There's a last group of people
105
272260
2000
Има и трета група хора,
04:34
who believe that the Indus people
106
274260
3000
които вярват че индуските хора
04:37
were the ancestors of people living in South India today.
107
277260
3000
са прародителите на хора, които днес живеят в южна Индия.
04:40
These people believe that the Indus script
108
280260
2000
Те вярват, че индуските надписи
04:42
represents an ancient form
109
282260
2000
представят древна форма
04:44
of the Dravidian language family,
110
284260
2000
на семейството от дравидски езици,
04:46
which is the language family spoken in much of South India today.
111
286260
3000
които днес се говорят на много места в южна Индия.
04:49
And the proponents of this theory
112
289260
2000
Защитниците на тази теория
04:51
point to that small pocket of Dravidian-speaking people in the North,
113
291260
3000
сочат тази малка част от дравидски-говорещи хора на север,
04:54
actually near Afghanistan,
114
294260
2000
всъщност близко до Афганистан,
04:56
and they say that perhaps, sometime in the past,
115
296260
3000
и казват, че може би някога
04:59
Dravidian languages were spoken all over India
116
299260
3000
дравидският език е бил използван в цяла Индия,
05:02
and that this suggests
117
302260
2000
което предполага,
05:04
that the Indus civilization is perhaps also Dravidian.
118
304260
3000
че цивилизацията на Инд е също дравидска.
05:07
Which of these hypotheses can be true?
119
307260
3000
Коя от тези хипотези може да е вярна?
05:10
We don't know, but perhaps if you deciphered the script,
120
310260
2000
Не знаем, но може би ако дешифрирате писмеността
05:12
you would be able to answer this question.
121
312260
2000
ще можете да отговорите на този въпрос.
05:14
But deciphering the script is a very challenging task.
122
314260
2000
Но разчитането на надписите е много предизвикателна задача.
05:16
First, there's no Rosetta Stone.
123
316260
2000
Първо, нямаме Розетски камък.
05:18
I don't mean the software;
124
318260
2000
Нямам предвид софтуера;
05:20
I mean an ancient artifact
125
320260
2000
имам предвид древен артефакт,
05:22
that contains in the same text
126
322260
2000
който да съдържа един и същ текст
05:24
both a known text and an unknown text.
127
324260
3000
едновременно на познат и непознат език.
05:27
We don't have such an artifact for the Indus script.
128
327260
3000
Ние нямаме такъв предмет за индуската писменост.
05:30
And furthermore, we don't even know what language they spoke.
129
330260
3000
Дори не знаем, какъв език е бил говорен.
05:33
And to make matters even worse,
130
333260
2000
И за да станат нещата още по-заплетени,
05:35
most of the text that we have are extremely short.
131
335260
2000
повечето от текстовете, които имаме, са твърде кратки.
05:37
So as I showed you, they're usually found on these seals
132
337260
2000
Както ви показах, обикновено ги откриваме върху тези печати,
05:39
that are very, very tiny.
133
339260
2000
които са много, много мънички.
05:41
And so given these formidable obstacles,
134
341260
2000
И така с тези трудни препятствия
05:43
one might wonder and worry
135
343260
2000
бихме се чудили и тревожили,
05:45
whether one will ever be able to decipher the Indus script.
136
345260
3000
дали някой някога изобщо ще разчете надписите от Инд.
05:48
In the rest of my talk,
137
348260
2000
В оставащата част от моето представяне,
05:50
I'd like to tell you about how I learned to stop worrying
138
350260
2000
ще ви разкажа как се научих да не се тревожа
05:52
and love the challenge posed by the Indus script.
139
352260
2000
и да заобичам предизвикателството на надписите от Инд.
05:54
I've always been fascinated by the Indus script
140
354260
3000
Винаги съм бил привличан от тях --
05:57
ever since I read about it in a middle school textbook.
141
357260
2000
още когато прочетох за тях в учебник от гимназията.
05:59
And why was I fascinated?
142
359260
2000
И защо бях толкова запленен?
06:01
Well it's the last major undeciphered script in the ancient world.
143
361260
4000
Ами това е последната останала неразчетена писменост от древността.
06:05
My career path led me to become a computational neuroscientist,
144
365260
3000
Аз направих кариера като компютърен невролог,
06:08
so in my day job,
145
368260
2000
така че в работата си
06:10
I create computer models of the brain
146
370260
2000
създавам компютърни модели на мозъка,
06:12
to try to understand how the brain makes predictions,
147
372260
3000
за да се опитам да разбера как мозъка прави предположения,
06:15
how the brain makes decisions,
148
375260
2000
как взима решения,
06:17
how the brain learns and so on.
149
377260
2000
как мозъкът се учи и т.н.
06:19
But in 2007, my path crossed again with the Indus script.
150
379260
3000
Но през 2007 пътищата ни с индуската писменост отново се пресякоха.
06:22
That's when I was in India,
151
382260
2000
Тогава бях в Индия
06:24
and I had the wonderful opportunity
152
384260
2000
и имах чудесната възможност
06:26
to meet with some Indian scientists
153
386260
2000
да се запозная с някои индийски учени,
06:28
who were using computer models to try to analyze the script.
154
388260
3000
които използваха компютърни модели, в опит да анализират надписите.
06:31
And so it was then that I realized
155
391260
2000
Тогава осъзнах,
06:33
there was an opportunity for me to collaborate with these scientists,
156
393260
3000
че бих могъл да работя съвместно с тях
06:36
and so I jumped at that opportunity.
157
396260
2000
и тогава приех това предизвикателство.
06:38
And I'd like to describe some of the results that we have found.
158
398260
2000
Искам да разкажа за някои от резултатите, които постигнахме.
06:40
Or better yet, let's all collectively decipher.
159
400260
3000
Или по-добре, хайде заедно да разчитаме.
06:43
Are you ready?
160
403260
2000
Готови ли сте?
06:45
The first thing that you need to do when you have an undeciphered script
161
405260
3000
Първото нещо, което трябва да направите, когато имате неразчетен текст
06:48
is try to figure out the direction of writing.
162
408260
2000
е да се опитате да разберете посоката на писане.
06:50
Here are two texts that contain some symbols on them.
163
410260
3000
Ето два текста с няколко символа.
06:53
Can you tell me
164
413260
2000
Можете ли да ми кажете
06:55
if the direction of writing is right to left or left to right?
165
415260
3000
дали посоката на писане е отдясно наляво или обратното?
06:58
I'll give you a couple of seconds.
166
418260
3000
Ще ви дам няколко секунди.
07:01
Okay. Right to left, how many? Okay.
167
421260
3000
Добре. Отдясно наляво, колко мислят така? ОК.
07:04
Okay. Left to right?
168
424260
2000
Отляво надясно?
07:06
Oh, it's almost 50/50. Okay.
169
426260
2000
О, почти 50/50. Добре.
07:08
The answer is:
170
428260
2000
Отговорът е:
07:10
if you look at the left-hand side of the two texts,
171
430260
2000
Ако погледнете лявата страна на двата текста,
07:12
you'll notice that there's a cramping of signs,
172
432260
3000
ще забележите, че има струпване на знаците
07:15
and it seems like 4,000 years ago,
173
435260
2000
и изглежда, че преди 4000 години,
07:17
when the scribe was writing from right to left,
174
437260
2000
докато са писали надписа отдясно наляво
07:19
they ran out of space.
175
439260
2000
не им е стигнало мястото.
07:21
And so they had to cram the sign.
176
441260
2000
За това се е наложило да сбутат знака.
07:23
One of the signs is also below the text on the top.
177
443260
2000
Един от символите е също така под основния текст.
07:25
This suggests the direction of writing
178
445260
2000
Това предполага, че посоката на писане
07:27
was probably from right to left,
179
447260
2000
най-вероятно е отдясно наляво.
07:29
and so that's one of the first things we know,
180
449260
2000
И това е едно от първите неща, които знаем --
07:31
that directionality is a very key aspect of linguistic scripts.
181
451260
3000
посоката на писане е ключов аспект в лингвистиката.
07:34
And the Indus script now has
182
454260
2000
И сега индуската писменост разполага
07:36
this particular property.
183
456260
2000
с този ключов аспект.
07:38
What other properties of language does the script show?
184
458260
2000
Какви други характерни особености виждаме в надписа?
07:40
Languages contain patterns.
185
460260
2000
Езиците съдържат модели.
07:42
If I give you the letter Q
186
462260
2000
Ако ви дам буквата "Q"
07:44
and ask you to predict the next letter, what do you think that would be?
187
464260
3000
и ви помоля да предположите коя буква следва, какво ще кажете?
07:47
Most of you said U, which is right.
188
467260
2000
Повечето ще кажат "U", което е вярно.
07:49
Now if I asked you to predict one more letter,
189
469260
2000
Ако ви помоля да предложите още една буква,
07:51
what do you think that would be?
190
471260
2000
каква би могла да е тя?
07:53
Now there's several thoughts. There's E. It could be I. It could be A,
191
473260
3000
Ето няколко варианта. Имаме "Е". Може да е "I". Може да е "А",
07:56
but certainly not B, C or D, right?
192
476260
3000
но със сигурност няма да е "В", "С" или "D", нали така?
07:59
The Indus script also exhibits similar kinds of patterns.
193
479260
3000
Индуският надпис също притежава подобни модели.
08:02
There's a lot of text that start with this diamond-shaped symbol.
194
482260
3000
Има много текстове, които започват със символ с формата на диамант.
08:05
And this in turn tends to be followed
195
485260
2000
И той често е следван
08:07
by this quotation marks-like symbol.
196
487260
2000
от този подобен на кавички символ.
08:09
And this is very similar to a Q and U example.
197
489260
2000
Това е много подобно на примера с "Q" и "U".
08:11
This symbol can in turn be followed
198
491260
2000
Този символ от своя страна може да бъде последван
08:13
by these fish-like symbols and some other signs,
199
493260
3000
от тези подобни на риба символи или някои други,
08:16
but never by these other signs at the bottom.
200
496260
2000
но никога от тези символи най-долу.
08:18
And furthermore, there's some signs
201
498260
2000
Още повече, има някои знаци,
08:20
that really prefer the end of texts,
202
500260
2000
които в повечето случаи завършват текста,
08:22
such as this jar-shaped sign,
203
502260
2000
подобно на този знак с формата на делва.
08:24
and this sign, in fact, happens to be
204
504260
2000
Всъщност този знак се явява
08:26
the most frequently occurring sign in the script.
205
506260
2000
най-често срещания знак в писмеността.
08:28
Given such patterns, here was our idea.
206
508260
3000
Въз основа на тези модели, ето и нашата идея.
08:31
The idea was to use a computer
207
511260
2000
Решихме да използваме компютър,
08:33
to learn these patterns,
208
513260
2000
който да научи тези модели,
08:35
and so we gave the computer the existing texts.
209
515260
3000
така че дадохме на компютъра съществуващите текстове.
08:38
And the computer learned a statistical model
210
518260
2000
И компютърът научи статистически модел,
08:40
of which symbols tend to occur together
211
520260
2000
за това кои символи по-често се срещат заедно
08:42
and which symbols tend to follow each other.
212
522260
2000
и кои са с тенденция да следват един след друг.
08:44
Given the computer model,
213
524260
2000
След като дадем на компютъра модел,
08:46
we can test the model by essentially quizzing it.
214
526260
3000
ние можем да го тестваме, като му задаваме въпроси.
08:49
So we could deliberately erase some symbols,
215
529260
2000
Можем нарочно да изтрием някои символи
08:51
and we can ask it to predict the missing symbols.
216
531260
3000
и да питаме компютъра кои са липсващите знаци.
08:54
Here are some examples.
217
534260
3000
Ето някои примери.
09:00
You may regard this
218
540260
2000
Може да гледате на това
09:02
as perhaps the most ancient game
219
542260
2000
като на най-древния вариант
09:04
of Wheel of Fortune.
220
544260
3000
на Колелото на Късмета.
09:08
What we found
221
548260
2000
В резултат
09:10
was that the computer was successful in 75 percent of the cases
222
550260
2000
компютъра успяваше в 75 % от случаите
09:12
in predicting the correct symbol.
223
552260
2000
да предложи верния символ.
09:14
In the rest of the cases,
224
554260
2000
В останалите случаи,
09:16
typically the second best guess or third best guess was the right answer.
225
556260
3000
обикновено второто или третото предположение бяха верните.
09:19
There's also practical use
226
559260
2000
Има и практическа полза
09:21
for this particular procedure.
227
561260
2000
точно от това упражнение.
09:23
There's a lot of these texts that are damaged.
228
563260
2000
Много от тези текстове са повредени.
09:25
Here's an example of one such text.
229
565260
2000
Ето пример на един подобен надпис.
09:27
And we can use the computer model now to try to complete this text
230
567260
3000
Ние можем да използваме компютърния модел, за да допълним текста
09:30
and make a best guess prediction.
231
570260
2000
и да направим правдоподобно предположение.
09:32
Here's an example of a symbol that was predicted.
232
572260
3000
Ето пример за такъв предположен символ.
09:35
And this could be really useful as we try to decipher the script
233
575260
2000
Това може да бъде наистина полезно в опитите ни да разчетем текста,
09:37
by generating more data that we can analyze.
234
577260
3000
като генерираме повече данни, които да анализираме.
09:40
Now here's one other thing you can do with the computer model.
235
580260
3000
Ето и друго нещо, което може да се прави с компютърния модел.
09:43
So imagine a monkey
236
583260
2000
Представете си маймуна
09:45
sitting at a keyboard.
237
585260
2000
седнала зад клавиатурата.
09:47
I think you might get a random jumble of letters that looks like this.
238
587260
3000
Ще получите случайна бъркотия от букви, която би изглеждала така.
09:50
Such a random jumble of letters
239
590260
2000
За такава случайна бърканица от букви
09:52
is said to have a very high entropy.
240
592260
2000
казваме, че има много висока ентропия.
09:54
This is a physics and information theory term.
241
594260
2000
Това е термин от физиката и информатиката.
09:56
But just imagine it's a really random jumble of letters.
242
596260
3000
Но си представете, че това е наистина случаен сбор от букви.
09:59
How many of you have ever spilled coffee on a keyboard?
243
599260
4000
Колко от вас са изливали кафе върху клавиатурата?
10:03
You might have encountered the stuck-key problem --
244
603260
2000
Може да сте се сблъскали с проблема на залепналия клавиш --
10:05
so basically the same symbol being repeated over and over again.
245
605260
3000
когато един и същ знак се повтаря отново и отново.
10:08
This kind of a sequence is said to have a very low entropy
246
608260
3000
За такъв ред от знаци казваме, че имат много ниска ентропия,
10:11
because there's no variation at all.
247
611260
2000
защото няма никаква вариация.
10:13
Language, on the other hand, has an intermediate level of entropy;
248
613260
3000
Езикът, от друга страна, има средно ниво на ентропия;
10:16
it's neither too rigid,
249
616260
2000
не е нито много строго,
10:18
nor is it too random.
250
618260
2000
нито твърде случайно.
10:20
What about the Indus script?
251
620260
2000
Какво е положението при индуската писменост?
10:22
Here's a graph that plots the entropies of a whole bunch of sequences.
252
622260
4000
Ето графика, която сравнява най-различни последователности.
10:26
At the very top you find the uniformly random sequence,
253
626260
2000
Най-горе имаме винаги случайна последователност,
10:28
which is a random jumble of letters --
254
628260
2000
каквато е случайна бърканица от букви --
10:30
and interestingly, we also find
255
630260
2000
и интересно, също имаме
10:32
the DNA sequence from the human genome and instrumental music.
256
632260
3000
ДНК кодът на човешкия геном и инструменталната музика.
10:35
And both of these are very, very flexible,
257
635260
2000
И двете са много, много променливи,
10:37
which is why you find them in the very high range.
258
637260
2000
за това ги намираме високо в графиката.
10:39
At the lower end of the scale,
259
639260
2000
Най-долу в скалата
10:41
you find a rigid sequence, a sequence of all A's,
260
641260
2000
можем да открием строгата последователност, тази на всички "А"-та,
10:43
and you also find a computer program,
261
643260
2000
също и компютърна програма,
10:45
in this case in the language Fortran,
262
645260
2000
в този случай езикът Фортран,
10:47
which obeys really strict rules.
263
647260
2000
който се подчинява на наистина строги правила.
10:49
Linguistic scripts
264
649260
2000
Лингвистичните надписи
10:51
occupy the middle range.
265
651260
2000
заемат средните стойности.
10:53
Now what about the Indus script?
266
653260
2000
Къде е писмеността от Инд?
10:55
We found that the Indus script
267
655260
2000
Виждаме, че индуската писменост
10:57
actually falls within the range of the linguistic scripts.
268
657260
2000
всъщност попада в зоната на лингвистичните надписи.
10:59
When this result was first published,
269
659260
2000
Когато този резултат беше публикуван за първи път
11:01
it was highly controversial.
270
661260
3000
беше много противоречив.
11:04
There were people who raised a hue and cry,
271
664260
3000
Имаше хора, които вдигнаха много шум,
11:07
and these people were the ones who believed
272
667260
2000
това бяха хората, които вярваха,
11:09
that the Indus script does not represent language.
273
669260
3000
че индуската писменост не представлява език.
11:12
I even started to get some hate mail.
274
672260
2000
Дори започнах да получавам заплашителни писма.
11:14
My students said
275
674260
2000
Студентите ми казаха,
11:16
that I should really seriously consider getting some protection.
276
676260
3000
че е добре сериозно да помисля за някаква защита.
11:19
Who'd have thought
277
679260
2000
Кой би помислил,
11:21
that deciphering could be a dangerous profession?
278
681260
2000
че дешифрирането може да е опасна професия?
11:23
What does this result really show?
279
683260
2000
Какво показва този резултат наистина?
11:25
It shows that the Indus script
280
685260
2000
Показва, че индуската писменост
11:27
shares an important property of language.
281
687260
2000
съдържа важна част, характерна за език.
11:29
So, as the old saying goes,
282
689260
2000
Така че, както се казва,
11:31
if it looks like a linguistic script
283
691260
2000
ако изглежда като езиков надпис
11:33
and it acts like a linguistic script,
284
693260
2000
и се държи като езиков надпис,
11:35
then perhaps we may have a linguistic script on our hands.
285
695260
3000
то най-вероятно имаме езиков надпис в ръцете си.
11:38
What other evidence is there
286
698260
2000
Какво друго доказателство имаме,
11:40
that the script could actually encode language?
287
700260
2000
за това, че надписите наистина представляват език?
11:42
Well linguistic scripts can actually encode multiple languages.
288
702260
3000
Езиковите надписи могат всъщност да кодират различни езици.
11:45
So for example, here's the same sentence written in English
289
705260
3000
Ето, примерно, едно и също изречение написано на английски
11:48
and the same sentence written in Dutch
290
708260
2000
и на холандски,
11:50
using the same letters of the alphabet.
291
710260
2000
използвайки едни и същи букви от азбуката.
11:52
If you don't know Dutch and you only know English
292
712260
3000
Ако не знаете холандски, а само английски
11:55
and I give you some words in Dutch,
293
715260
2000
и аз ви дам няколко думи на холандски,
11:57
you'll tell me that these words contain
294
717260
2000
ще кажете, че тези думи съдържат
11:59
some very unusual patterns.
295
719260
2000
няколко много необичайни модели.
12:01
Some things are not right,
296
721260
2000
Някои неща не са вярни
12:03
and you'll say these words are probably not English words.
297
723260
3000
и за това ще кажете, че това вероятно не са английски думи.
12:06
The same thing happens in the case of the Indus script.
298
726260
2000
Същото се получава и в случая с индуските надписи.
12:08
The computer found several texts --
299
728260
2000
Компютърът откри няколко текста --
12:10
two of them are shown here --
300
730260
2000
два от тях са показани тук --
12:12
that have very unusual patterns.
301
732260
2000
които имат много необичайни модели.
12:14
So for example the first text:
302
734260
2000
Например в първия текст:
12:16
there's a doubling of this jar-shaped sign.
303
736260
3000
има дублиране на знакът с форма на делва.
12:19
This sign is the most frequently-occurring sign
304
739260
2000
Това е най-често срещания знак
12:21
in the Indus script,
305
741260
2000
в индуските надписи
12:23
and it's only in this text
306
743260
2000
и единствено в този текст
12:25
that it occurs as a doubling pair.
307
745260
2000
той е дублиран.
12:27
Why is that the case?
308
747260
2000
Защо това е така?
12:29
We went back and looked at where these particular texts were found,
309
749260
3000
Върнахме се назад, за да видим къде е открит точно този текст
12:32
and it turns out that they were found
310
752260
2000
и се оказа, че той е намерен
12:34
very, very far away from the Indus Valley.
311
754260
2000
много, много далеч от долината на Инд.
12:36
They were found in present day Iraq and Iran.
312
756260
3000
Открит е на територията на днешните Ирак и Иран.
12:39
And why were they found there?
313
759260
2000
Защо е открит чак там?
12:41
What I haven't told you is that
314
761260
2000
Това, което не ви казах е,
12:43
the Indus people were very, very enterprising.
315
763260
2000
че хората от Инд са били много, много предприемчиви.
12:45
They used to trade with people pretty far away from where they lived,
316
765260
3000
Търгували са с хора надалеч от мястото, където са живеели.
12:48
and so in this case, they were traveling by sea
317
768260
3000
В този случай са пътували по море
12:51
all the way to Mesopotamia, present-day Iraq.
318
771260
3000
целия път до Месопотамия, днешен Ирак.
12:54
And what seems to have happened here
319
774260
2000
И това, което изглежда се е случило там е,
12:56
is that the Indus traders, the merchants,
320
776260
3000
че търговците от Инд, продавачите,
12:59
were using this script to write a foreign language.
321
779260
3000
са използвали тези знаци, за да пишат на чужд език.
13:02
It's just like our English and Dutch example.
322
782260
2000
Точно както в нашия английско-холандски пример.
13:04
And that would explain why we have these strange patterns
323
784260
2000
Това обяснява наличието на тези странни модели,
13:06
that are very different from the kinds of patterns you see in the text
324
786260
3000
които са много различни от моделите на текстовете,
13:09
that are found within the Indus Valley.
325
789260
3000
намерени в долината на Инд.
13:12
This suggests that the same script, the Indus script,
326
792260
2000
Това предполага, че същите символи, индуските символи,
13:14
could be used to write different languages.
327
794260
3000
могат да бъдат използвани за писане на различни езици.
13:17
The results we have so far seem to point to the conclusion
328
797260
3000
Резултатите, които имаме до момента водят към заключението,
13:20
that the Indus script probably does represent language.
329
800260
3000
че индуската писменост най-вероятно представлява език.
13:23
If it does represent language,
330
803260
2000
Ако тя представлява език,
13:25
then how do we read the symbols?
331
805260
2000
то тогава как ще четем тези символи?
13:27
That's our next big challenge.
332
807260
2000
Това е следващото ни предизвикателство.
13:29
So you'll notice that many of the symbols
333
809260
2000
Забелязвате, че повечето от символите
13:31
look like pictures of humans, of insects,
334
811260
2000
наподобяват картини на хора, на насекоми,
13:33
of fishes, of birds.
335
813260
3000
на риби, на птици.
13:36
Most ancient scripts
336
816260
2000
Повечето древни надписи
13:38
use the rebus principle,
337
818260
2000
използват принципа на ребуса,
13:40
which is, using pictures to represent words.
338
820260
3000
който е да използваш картинки за представяне на думи.
13:43
So as an example, here's a word.
339
823260
3000
Като пример, ето една дума.
13:46
Can you write it using pictures?
340
826260
2000
Можете ли да я напишете, използвайки картинки?
13:48
I'll give you a couple seconds.
341
828260
2000
Ще ви дам няколко секунди.
13:50
Got it?
342
830260
2000
Имате ли я?
13:52
Okay. Great.
343
832260
2000
Добре. Чудесно.
13:54
Here's my solution.
344
834260
2000
Ето моето предложение.
13:56
You could use the picture of a bee followed by a picture of a leaf --
345
836260
2000
Може да използвате картинка на пчела (bee), следвана от картинка на листо (leaf) --
13:58
and that's "belief," right.
346
838260
2000
и се получава "вяра" (belief), точно.
14:00
There could be other solutions.
347
840260
2000
Може да има и други решения.
14:02
In the case of the Indus script,
348
842260
2000
В случая на индуската писменост,
14:04
the problem is the reverse.
349
844260
2000
проблемът е възпроизвеждането.
14:06
You have to figure out the sounds of each of these pictures
350
846260
3000
Трябва да се познаят звуците на всяка от картинките,
14:09
such that the entire sequence makes sense.
351
849260
2000
така че цялата последователност да има смисъл.
14:11
So this is just like a crossword puzzle,
352
851260
3000
Това е точно като кръстословица,
14:14
except that this is the mother of all crossword puzzles
353
854260
3000
само дето е майката на кръстословиците,
14:17
because the stakes are so high if you solve it.
354
857260
4000
защото залогът за решаването й е толкова висок.
14:21
My colleagues, Iravatham Mahadevan and Asko Parpola,
355
861260
3000
Моите колеги, Ираватам Махадеван и Аско Парпола
14:24
have been making some headway on this particular problem.
356
864260
2000
имат известен напредък по този конкретен проблем.
14:26
And I'd like to give you a quick example of Parpola's work.
357
866260
2000
Бих искал да ви дам бърз пример за работата на Парпола.
14:28
Here's a really short text.
358
868260
2000
Ето един наистина кратък текст.
14:30
It contains seven vertical strokes followed by this fish-like sign.
359
870260
3000
Съдържа седем вертикални чертички, следвани от знак с формата на риба.
14:33
And I want to mention that these seals were used
360
873260
2000
Само да спомена, че тези печати са били използвани
14:35
for stamping clay tags
361
875260
2000
за отпечатване върху глинени табелки,
14:37
that were attached to bundles of goods,
362
877260
2000
закачени за товарите със стоки,
14:39
so it's quite likely that these tags, at least some of them,
363
879260
3000
за това е много вероятно тези табелки или поне част от тях,
14:42
contain names of merchants.
364
882260
2000
да съдържат имена на търговци.
14:44
And it turns out that in India
365
884260
2000
Оказва се, че в Индия
14:46
there's a long tradition
366
886260
2000
има стара традиция
14:48
of names being based on horoscopes
367
888260
2000
на даване на имена, съобразно хороскопи
14:50
and star constellations present at the time of birth.
368
890260
3000
и съзвездията, които са били в небето по време на раждането.
14:53
In Dravidian languages,
369
893260
2000
В дравидските езици
14:55
the word for fish is "meen"
370
895260
2000
думата за риба е "миин",
14:57
which happens to sound just like the word for star.
371
897260
3000
което се произнася точно както думата за звезда.
15:00
And so seven stars
372
900260
2000
И така, седем звезди
15:02
would stand for "elu meen,"
373
902260
2000
ще се използват за "елу миин",
15:04
which is the Dravidian word
374
904260
2000
което е дравидската дума за
15:06
for the Big Dipper star constellation.
375
906260
2000
съзвездието Голяма Мечка.
15:08
Similarly, there's another sequence of six stars,
376
908260
3000
По подобен начин, има ред от седем звезди,
15:11
and that translates to "aru meen,"
377
911260
2000
който се превежда "ару миин",
15:13
which is the old Dravidian name
378
913260
2000
което е старото дравидско име
15:15
for the star constellation Pleiades.
379
915260
2000
на съзвездието Плеяди.
15:17
And finally, there's other combinations,
380
917260
3000
И накрая, има други комбинации,
15:20
such as this fish sign with something that looks like a roof on top of it.
381
920260
3000
като тази риба с нещо подобно на покрив над нея.
15:23
And that could be translated into "mey meen,"
382
923260
3000
Това може да се преведе като "мей миин",
15:26
which is the old Dravidian name for the planet Saturn.
383
926260
3000
което е старото дравидско название на Сатурн.
15:29
So that was pretty exciting.
384
929260
2000
Всичко това беше толкова вълнуващо.
15:31
It looks like we're getting somewhere.
385
931260
2000
Изглежда, че все пак сме на верен път.
15:33
But does this prove
386
933260
2000
Но дали това доказва,
15:35
that these seals contain Dravidian names
387
935260
2000
че тези печати съдържат дравидски имена,
15:37
based on planets and star constellations?
388
937260
2000
кръстени на планети и съзвездия?
15:39
Well not yet.
389
939260
2000
Не съвсем.
15:41
So we have no way of validating
390
941260
2000
Нямаме начин да потвърдим
15:43
these particular readings,
391
943260
2000
това конкретно прочитане,
15:45
but if more and more of these readings start making sense,
392
945260
3000
но ако повече и повече от тези прочити започнат да имат смисъл,
15:48
and if longer and longer sequences
393
948260
2000
и ако все по-дълги и по-дълги последователности
15:50
appear to be correct,
394
950260
2000
се оказват верни,
15:52
then we know that we are on the right track.
395
952260
2000
тогава ще знаем, че посоката е вярна.
15:54
Today,
396
954260
2000
Днес,
15:56
we can write a word such as TED
397
956260
3000
ние можем да напишем дума като TED
15:59
in Egyptian hieroglyphics and in cuneiform script,
398
959260
3000
с египетски йероглифи и клиновидно писмо,
16:02
because both of these were deciphered
399
962260
2000
защото и двете писмености са били разчетени
16:04
in the 19th century.
400
964260
2000
през 19-ти век.
16:06
The decipherment of these two scripts
401
966260
2000
Дешифрирането на тези писмености
16:08
enabled these civilizations to speak to us again directly.
402
968260
3000
позволява на тези цивилизации да ни говорят директно.
16:11
The Mayans
403
971260
2000
Маите
16:13
started speaking to us in the 20th century,
404
973260
2000
започнаха да ни говорят през 20-ти век,
16:15
but the Indus civilization remains silent.
405
975260
3000
но индуската цивилизация все още мълчи.
16:18
Why should we care?
406
978260
2000
Защо да ни е грижа?
16:20
The Indus civilization does not belong
407
980260
2000
Индуската цивилизация не принадлежи
16:22
to just the South Indians or the North Indians
408
982260
2000
само на южните индийци или на северните индийци,
16:24
or the Pakistanis;
409
984260
2000
или на пакистанците;
16:26
it belongs to all of us.
410
986260
2000
тя принадлежи на всички нас.
16:28
These are our ancestors --
411
988260
2000
Това са нашите прадеди --
16:30
yours and mine.
412
990260
2000
ваши и мои.
16:32
They were silenced
413
992260
2000
Те са останали нечути
16:34
by an unfortunate accident of history.
414
994260
2000
заради злощастен инцидент в историята.
16:36
If we decipher the script,
415
996260
2000
Ако разчетем писмеността,
16:38
we would enable them to speak to us again.
416
998260
2000
ще им позволим да говорят отново.
16:40
What would they tell us?
417
1000260
3000
Какво ще ни кажат?
16:43
What would we find out about them? About us?
418
1003260
3000
Какво ще открием за тях? За нас?
16:46
I can't wait to find out.
419
1006260
3000
Нямам търпение да разбера.
16:49
Thank you.
420
1009260
2000
Благодаря ви.
16:51
(Applause)
421
1011260
4000
(Аплодисменти)
Относно този уебсайт

Този сайт ще ви запознае с видеоклипове в YouTube, които са полезни за изучаване на английски език. Ще видите уроци по английски език, преподавани от първокласни учители от цял свят. Кликнете два пъти върху английските субтитри, показани на всяка страница с видеоклипове, за да възпроизведете видеото оттам. Субтитрите се превъртат в синхрон с възпроизвеждането на видеото. Ако имате някакви коментари или искания, моля, свържете се с нас, като използвате тази форма за контакт.

https://forms.gle/WvT1wiN1qDtmnspy7