Rajesh Rao: Computing a Rosetta Stone for the Indus script

1,206,714 views ・ 2011-06-28

TED


Будь ласка, двічі клацніть на англійські субтитри нижче, щоб відтворити відео.

Перекладач: Olena Konstantinova Утверджено: Kateryna Kozhukhar
00:15
I'd like to begin with a thought experiment.
0
15260
3000
Я б хотів розпочати з уявного експерименту.
00:19
Imagine that it's 4,000 years into the future.
1
19260
3000
Уявіть, що ми перенеслися в майбутнє на 4 000 років.
00:22
Civilization as we know it
2
22260
2000
Наша теперішня цивілізація
00:24
has ceased to exist --
3
24260
2000
припинила своє існування --
00:26
no books,
4
26260
2000
немає ані книжок,
00:28
no electronic devices,
5
28260
3000
ані електронних пристроїв,
00:31
no Facebook or Twitter.
6
31260
3000
ані Фейсбука чи Твіттера.
00:34
All knowledge of the English language and the English alphabet
7
34260
3000
Усі знання про англійську мову, чи навіть абетку
00:37
has been lost.
8
37260
2000
втрачено.
00:39
Now imagine archeologists
9
39260
2000
А тепер уявіть археологів,
00:41
digging through the rubble of one of our cities.
10
41260
2000
що проводять розкопки на руїнах одного з наших міст.
00:43
What might they find?
11
43260
2000
Як гадаєте, що вони знайдуть?
00:45
Well perhaps some rectangular pieces of plastic
12
45260
3000
Можливо, якісь прямокутні шматочки пластика
00:48
with strange symbols on them.
13
48260
3000
з дивними символами,
00:51
Perhaps some circular pieces of metal.
14
51260
3000
або металеві кружальця,
00:54
Maybe some cylindrical containers
15
54260
2000
чи циліндричні контейнери
00:56
with some symbols on them.
16
56260
2000
з певними символами.
00:58
And perhaps one archeologist becomes an instant celebrity
17
58260
3000
Якійсь археолог, можливо, прославиться,
01:01
when she discovers --
18
61260
2000
коли відшукає
01:03
buried in the hills somewhere in North America --
19
63260
2000
десь на пагорбах Північної Америки
01:05
massive versions of these same symbols.
20
65260
3000
величезні символи, подібні до вищезгаданих.
01:10
Now let's ask ourselves,
21
70260
2000
А тепер спитаємо себе:
01:12
what could such artifacts say about us
22
72260
3000
"Що ці артефакти зможуть розповісти про нас
01:15
to people 4,000 years into the future?
23
75260
3000
людям, що житимуть через 4 000 років?"
01:18
This is no hypothetical question.
24
78260
2000
І це не гіпотетичне питання.
01:20
In fact, this is exactly the kind of question we're faced with
25
80260
3000
Насправді, саме з такими питаннями ми стикаємося,
01:23
when we try to understand the Indus Valley civilization,
26
83260
3000
коли намагаємося зрозуміти Індську цивілізацію,
01:26
which existed 4,000 years ago.
27
86260
2000
що існувала понад 4 000 років тому.
01:28
The Indus civilization was roughly contemporaneous
28
88260
3000
Індська цивілізація існувала приблизно в той самий час,
01:31
with the much better known Egyptian and the Mesopotamian civilizations,
29
91260
3000
що й відоміші за неї Єгипетська та Месопотамська,
01:34
but it was actually much larger than either of these two civilizations.
30
94260
3000
але вона охоплювала набагато ширший регіон.
01:37
It occupied the area
31
97260
2000
Регіон її поширення --
01:39
of approximately one million square kilometers,
32
99260
2000
приблизно один мільйон кв. км,
01:41
covering what is now Pakistan,
33
101260
2000
територія сучасного Пакистану,
01:43
Northwestern India
34
103260
2000
Північно-Західної Індії,
01:45
and parts of Afghanistan and Iran.
35
105260
2000
а також частина Афганістану та Ірану.
01:47
Given that it was such a vast civilization,
36
107260
2000
Позаяк цивілізація була такою величезною,
01:49
you might expect to find really powerful rulers, kings,
37
109260
4000
ми сподівалися, що знайдемо згадки про могутніх правителів, царів,
01:53
and huge monuments glorifying these powerful kings.
38
113260
3000
а також величні монументи, що уславлюють цих володарів.
01:56
In fact,
39
116260
2000
Насправді
01:58
what archeologists have found is none of that.
40
118260
2000
археологи нічого такого не знайшли.
02:00
They've found small objects such as these.
41
120260
3000
Вони відкопали невеликі предмети, схожі на ці.
02:03
Here's an example of one of these objects.
42
123260
3000
Ось один із них.
02:06
Well obviously this is a replica.
43
126260
2000
Звісно ж це -- репродукція.
02:08
But who is this person?
44
128260
3000
Але хто ця людина?
02:11
A king? A god?
45
131260
2000
Цар? Бог?
02:13
A priest?
46
133260
2000
Жрець?
02:15
Or perhaps an ordinary person
47
135260
2000
Чи, можливо, звичайна людина,
02:17
like you or me?
48
137260
2000
як ви чи я?
02:19
We don't know.
49
139260
2000
Невідомо.
02:21
But the Indus people also left behind artifacts with writing on them.
50
141260
3000
Однак люди Індської цивілізації також залишили артефакти з написами.
02:24
Well no, not pieces of plastic,
51
144260
2000
Це, звичайно, не шматки пластику,
02:26
but stone seals, copper tablets,
52
146260
3000
а кам'яні печатки, мідні таблички,
02:29
pottery and, surprisingly,
53
149260
2000
горщики та, як не дивно,
02:31
one large sign board,
54
151260
2000
велика вивіска,
02:33
which was found buried near the gate of a city.
55
153260
2000
що її відкопали біля воріт міста.
02:35
Now we don't know if it says Hollywood,
56
155260
2000
Зараз ми ще не знаємо, чи там написано "Голівуд",
02:37
or even Bollywood for that matter.
57
157260
2000
чи "Болівуд", що було б доречніше в нашій ситуації.
02:39
In fact, we don't even know
58
159260
2000
Насправді невідомо,
02:41
what any of these objects say,
59
161260
2000
що взагалі ці предмети означають,
02:43
and that's because the Indus script is undeciphered.
60
163260
3000
а тому Індське письмо досі не розшифроване.
02:46
We don't know what any of these symbols mean.
61
166260
2000
Ми не знаємо значення жодного з цих символів.
02:48
The symbols are most commonly found on seals.
62
168260
3000
Найчастіше символи знаходять на печатках.
02:51
So you see up there one such object.
63
171260
2000
Ось тут зверху ви бачите один з таких предметів.
02:53
It's the square object with the unicorn-like animal on it.
64
173260
3000
Він квадратної форми, на ньому тварина, подібна до єдинорога.
02:56
Now that's a magnificent piece of art.
65
176260
2000
Чудовий витвір мистецтва.
02:58
So how big do you think that is?
66
178260
2000
Як гадаєте, якого він розміру?
03:00
Perhaps that big?
67
180260
2000
Можливо такого?
03:02
Or maybe that big?
68
182260
2000
А може такого?
03:04
Well let me show you.
69
184260
2000
Зараз я вам покажу.
03:07
Here's a replica of one such seal.
70
187260
3000
Ось копія однієї такої печатки.
03:10
It's only about one inch by one inch in size --
71
190260
2000
За розміром усього 2,5 см на 2,5 см,
03:12
pretty tiny.
72
192260
2000
доволі маленька.
03:14
So what were these used for?
73
194260
2000
Яке було її призначення?
03:16
We know that these were used for stamping clay tags
74
196260
3000
Ми знаємо, що їх використовували для відтискання глиняних ярликів,
03:19
that were attached to bundles of goods that were sent from one place to the other.
75
199260
3000
які чіпляли на товар, що відсилали з одного місця в інше.
03:22
So you know those packing slips you get on your FedEx boxes?
76
202260
3000
Бачили пакувальні ярлики на поштових пакунках?
03:25
These were used to make those kinds of packing slips.
77
205260
3000
За допомогою таких предметів тоді робили пакувальні ярлики.
03:28
You might wonder what these objects contain
78
208260
3000
Вам, мабуть, цікаво, що
03:31
in terms of their text.
79
211260
2000
написано на цих предметах.
03:33
Perhaps they're the name of the sender
80
213260
2000
Можливо, це ім'я відправника,
03:35
or some information about the goods
81
215260
2000
або якась інформація про товар,
03:37
that are being sent from one place to the other -- we don't know.
82
217260
3000
який пересилають з одного місця в інше -- ми не знаємо.
03:40
We need to decipher the script to answer that question.
83
220260
2000
Необхідно розшифрувати написи, щоб відповісти на питання.
03:42
Deciphering the script
84
222260
2000
Розшифровка письма --
03:44
is not just an intellectual puzzle;
85
224260
2000
не просто задачка на інтелект.
03:46
it's actually become a question
86
226260
2000
Насправді це питання
03:48
that's become deeply intertwined
87
228260
2000
тісно переплелося
03:50
with the politics and the cultural history of South Asia.
88
230260
3000
з політикою та культурною спадщиною Південної Азії.
03:53
In fact, the script has become a battleground of sorts
89
233260
3000
Ця писемність викликала суперечки
03:56
between three different groups of people.
90
236260
2000
між трьома різними групами людей.
03:58
First, there's a group of people
91
238260
2000
Перша група
04:00
who are very passionate in their belief
92
240260
2000
щиро вірить, що
04:02
that the Indus script
93
242260
2000
написи часів Індської цивілізації
04:04
does not represent a language at all.
94
244260
2000
взагалі не є мовою.
04:06
These people believe that the symbols
95
246260
2000
Вони вважають, що ці символи
04:08
are very similar to the kind of symbols you find on traffic signs
96
248260
3000
дуже подібні до наших дорожніх знаків,
04:11
or the emblems you find on shields.
97
251260
3000
або до емблем на щитах.
04:14
There's a second group of people
98
254260
2000
Існує друга група, яка вважає,
04:16
who believe that the Indus script represents an Indo-European language.
99
256260
3000
що Індське письмо належить до індо-європейської сім'ї мов.
04:19
If you look at a map of India today,
100
259260
2000
Якщо подивитися на карту сьогоднішньої Індії,
04:21
you'll see that most of the languages spoken in North India
101
261260
3000
побачимо, що більшість мов Північної Індії
04:24
belong to the Indo-European language family.
102
264260
3000
належать до індо-європейської сім'ї.
04:27
So some people believe that the Indus script
103
267260
2000
Отже, є думка, що Індське письмо
04:29
represents an ancient Indo-European language such as Sanskrit.
104
269260
3000
є давньою індо-європейською мовою на кшталт санскриту.
04:32
There's a last group of people
105
272260
2000
І остання група людей
04:34
who believe that the Indus people
106
274260
3000
вважає, що Індський народ
04:37
were the ancestors of people living in South India today.
107
277260
3000
є пращурами сучасних жителів Південної Індії.
04:40
These people believe that the Indus script
108
280260
2000
Ця група вважає, що Індське письмо
04:42
represents an ancient form
109
282260
2000
є древньою формою
04:44
of the Dravidian language family,
110
284260
2000
дравідської сім'ї мов,
04:46
which is the language family spoken in much of South India today.
111
286260
3000
мовами якої спілкується сьогодні майже весь Південь Індії.
04:49
And the proponents of this theory
112
289260
2000
Прихильники цієї теорії
04:51
point to that small pocket of Dravidian-speaking people in the North,
113
291260
3000
вказують на маленький острівець дравідських мов на Півночі,
04:54
actually near Afghanistan,
114
294260
2000
біля Афганістану,
04:56
and they say that perhaps, sometime in the past,
115
296260
3000
і зауважують, що, можливо, колись у минулому,
04:59
Dravidian languages were spoken all over India
116
299260
3000
дравідськими мовами говорила вся Індія.
05:02
and that this suggests
117
302260
2000
А це наштовхує на думку,
05:04
that the Indus civilization is perhaps also Dravidian.
118
304260
3000
що Індська цивілізація, можливо, теж дравідська.
05:07
Which of these hypotheses can be true?
119
307260
3000
Яка з цих гіпотез правдива?
05:10
We don't know, but perhaps if you deciphered the script,
120
310260
2000
Цього ніхто не знає, але якщо б вдалось розшифрувати це письмо,
05:12
you would be able to answer this question.
121
312260
2000
ми б дізналися відповідь.
05:14
But deciphering the script is a very challenging task.
122
314260
2000
Проте розшифрувати його дуже складно.
05:16
First, there's no Rosetta Stone.
123
316260
2000
По-перше, немає Розетського каменя.
05:18
I don't mean the software;
124
318260
2000
Я маю на увазі не програму з такою назвою,
05:20
I mean an ancient artifact
125
320260
2000
а древній артефакт,
05:22
that contains in the same text
126
322260
2000
на якому міститься один текст,
05:24
both a known text and an unknown text.
127
324260
3000
вибитий відомою і невідомою мовами.
05:27
We don't have such an artifact for the Indus script.
128
327260
3000
Для Індського письма немає такого артефакту.
05:30
And furthermore, we don't even know what language they spoke.
129
330260
3000
Більш того, ми не знаємо, якою мовою вони говорили.
05:33
And to make matters even worse,
130
333260
2000
І що гірше, більшість
05:35
most of the text that we have are extremely short.
131
335260
2000
наявних текстів дуже короткі.
05:37
So as I showed you, they're usually found on these seals
132
337260
2000
Як я вже показував, вони знаходяться на таких печатках -
05:39
that are very, very tiny.
133
339260
2000
дуже-дуже маленьких.
05:41
And so given these formidable obstacles,
134
341260
2000
Через такі серйозні перешкоди
05:43
one might wonder and worry
135
343260
2000
існують побоювання, що
05:45
whether one will ever be able to decipher the Indus script.
136
345260
3000
взагалі не вдасться розшифрувати Індське письмо.
05:48
In the rest of my talk,
137
348260
2000
Далі у своїй промові
05:50
I'd like to tell you about how I learned to stop worrying
138
350260
2000
я розповім, як перестав непокоїтися
05:52
and love the challenge posed by the Indus script.
139
352260
2000
і зацікавився проблемою Індського письма.
05:54
I've always been fascinated by the Indus script
140
354260
3000
Вона завжди мене приваблювала,
05:57
ever since I read about it in a middle school textbook.
141
357260
2000
ще за шкільними підручниками.
05:59
And why was I fascinated?
142
359260
2000
А чому ж я так захопився?
06:01
Well it's the last major undeciphered script in the ancient world.
143
361260
4000
Тому що це остання нерозшифрована писемність давнього світу.
06:05
My career path led me to become a computational neuroscientist,
144
365260
3000
Я професійно займаюся обчислювальною нейробіологією,
06:08
so in my day job,
145
368260
2000
тобто, я займаюся ось чим:
06:10
I create computer models of the brain
146
370260
2000
я створюю комп'ютерні моделі мозку,
06:12
to try to understand how the brain makes predictions,
147
372260
3000
щоб зрозуміти, як мозок робить передбачення,
06:15
how the brain makes decisions,
148
375260
2000
як він приймає рішення,
06:17
how the brain learns and so on.
149
377260
2000
як він навчається, і так далі.
06:19
But in 2007, my path crossed again with the Indus script.
150
379260
3000
Але 2007-го року я знову перетнувся з Індським письмом.
06:22
That's when I was in India,
151
382260
2000
Тоді я був в Індії
06:24
and I had the wonderful opportunity
152
384260
2000
і мав чудову нагоду
06:26
to meet with some Indian scientists
153
386260
2000
зустрітися з місцевими науковцями,
06:28
who were using computer models to try to analyze the script.
154
388260
3000
які за допомогою комп'ютерних моделей намагались аналізувати це письмо.
06:31
And so it was then that I realized
155
391260
2000
Саме тоді я і зрозумів,
06:33
there was an opportunity for me to collaborate with these scientists,
156
393260
3000
що у мене є шанс співпраці з цими науковцями.
06:36
and so I jumped at that opportunity.
157
396260
2000
І я скористався цим шансом.
06:38
And I'd like to describe some of the results that we have found.
158
398260
2000
Мені б хотілося озвучити деякі результати нашої роботи.
06:40
Or better yet, let's all collectively decipher.
159
400260
3000
А ще краще, розшифровуймо разом.
06:43
Are you ready?
160
403260
2000
Готові?
06:45
The first thing that you need to do when you have an undeciphered script
161
405260
3000
Перше, що необхідно зробити при розшифруванні -
06:48
is try to figure out the direction of writing.
162
408260
2000
визначити напрямок письма.
06:50
Here are two texts that contain some symbols on them.
163
410260
3000
Перед нами два тексти з символами.
06:53
Can you tell me
164
413260
2000
Можете вказати напрямок?
06:55
if the direction of writing is right to left or left to right?
165
415260
3000
Справа наліво чи зліва направо?
06:58
I'll give you a couple of seconds.
166
418260
3000
Дам вам декілька секунд.
07:01
Okay. Right to left, how many? Okay.
167
421260
3000
Хто за "справа наліво"? Добре.
07:04
Okay. Left to right?
168
424260
2000
А тепер за "зліва направо"?
07:06
Oh, it's almost 50/50. Okay.
169
426260
2000
Майже 50/50. Є.
07:08
The answer is:
170
428260
2000
Відповідь така:
07:10
if you look at the left-hand side of the two texts,
171
430260
2000
Якщо подивитися на ліву половинку обох текстів,
07:12
you'll notice that there's a cramping of signs,
172
432260
3000
видно, що знаки там вужчі.
07:15
and it seems like 4,000 years ago,
173
435260
2000
Здається, що 4 000 років тому,
07:17
when the scribe was writing from right to left,
174
437260
2000
коли писець писав це справа наліво,
07:19
they ran out of space.
175
439260
2000
йому забракло місця.
07:21
And so they had to cram the sign.
176
441260
2000
Тому йому довелося звузити значки.
07:23
One of the signs is also below the text on the top.
177
443260
2000
А один із знаків написано під текстом.
07:25
This suggests the direction of writing
178
445260
2000
Можна припустити, що напрямок письма
07:27
was probably from right to left,
179
447260
2000
був справа наліво.
07:29
and so that's one of the first things we know,
180
449260
2000
Отож, ми дізналися, що напрямок письма -
07:31
that directionality is a very key aspect of linguistic scripts.
181
451260
3000
це найголовніша характеристика мовних систем письма.
07:34
And the Indus script now has
182
454260
2000
Індські написи мають
07:36
this particular property.
183
456260
2000
саме таку властивість.
07:38
What other properties of language does the script show?
184
458260
2000
На які інші ознаки мови вказують ці написи?
07:40
Languages contain patterns.
185
460260
2000
Мовам притаманні певні комбінації знаків.
07:42
If I give you the letter Q
186
462260
2000
Якщо я назву літеру "Q"
07:44
and ask you to predict the next letter, what do you think that would be?
187
464260
3000
і попрошу відгадати наступну, якою вона може бути?
07:47
Most of you said U, which is right.
188
467260
2000
Більшість з вас скаже літера "U", і це правильно.
07:49
Now if I asked you to predict one more letter,
189
469260
2000
Якщо я попрошу відгадати ще одну букву,
07:51
what do you think that would be?
190
471260
2000
що б це могло бути?
07:53
Now there's several thoughts. There's E. It could be I. It could be A,
191
473260
3000
В англійській мові існує кілька варіантів - літери "E", "I", "A",
07:56
but certainly not B, C or D, right?
192
476260
3000
але аж ніяк не "В", "С" чи "D", правильно?
07:59
The Indus script also exhibits similar kinds of patterns.
193
479260
3000
Індське письмо також виявляє подібні закономірності.
08:02
There's a lot of text that start with this diamond-shaped symbol.
194
482260
3000
Багато текстів починаються з такого ромбовидного символу.
08:05
And this in turn tends to be followed
195
485260
2000
А за ним завжди йде символ
08:07
by this quotation marks-like symbol.
196
487260
2000
схожий на наші "лапки".
08:09
And this is very similar to a Q and U example.
197
489260
2000
Це подібно до прикладу з літерами "Q" та "U".
08:11
This symbol can in turn be followed
198
491260
2000
За цим символом, своєю чергою, йдуть
08:13
by these fish-like symbols and some other signs,
199
493260
3000
такі рибоподібні символи та деякі інші,
08:16
but never by these other signs at the bottom.
200
496260
2000
але ніколи не зустрічаються символи, показані внизу.
08:18
And furthermore, there's some signs
201
498260
2000
Крім того, існують знаки,
08:20
that really prefer the end of texts,
202
500260
2000
що зустрічаються переважно в кінці тексту,
08:22
such as this jar-shaped sign,
203
502260
2000
такі, як цей глекоподібний знак;
08:24
and this sign, in fact, happens to be
204
504260
2000
фактично, цей знак
08:26
the most frequently occurring sign in the script.
205
506260
2000
найчастіше зустрічається в текстах.
08:28
Given such patterns, here was our idea.
206
508260
3000
Повторюваність мовних комбінацій
08:31
The idea was to use a computer
207
511260
2000
наштовхнула на думку використати комп'ютер
08:33
to learn these patterns,
208
513260
2000
для їхнього вивчення;
08:35
and so we gave the computer the existing texts.
209
515260
3000
отже, ми ввели всі тексти в пам'ять комп'ютера,
08:38
And the computer learned a statistical model
210
518260
2000
комп'ютер вивів статистичну модель
08:40
of which symbols tend to occur together
211
520260
2000
комбінування символів між собою
08:42
and which symbols tend to follow each other.
212
522260
2000
і тенденції послідовності певних символів.
08:44
Given the computer model,
213
524260
2000
Коли існує комп'ютерна модель,
08:46
we can test the model by essentially quizzing it.
214
526260
3000
ми можемо практично її перевірити.
08:49
So we could deliberately erase some symbols,
215
529260
2000
Наприклад, стерти декілька символів
08:51
and we can ask it to predict the missing symbols.
216
531260
3000
і подивитися, чи програма передбачила випущені знаки.
08:54
Here are some examples.
217
534260
3000
Ось кілька прикладів.
09:00
You may regard this
218
540260
2000
Можете вважати це
09:02
as perhaps the most ancient game
219
542260
2000
найдревнішою грою
09:04
of Wheel of Fortune.
220
544260
3000
в "Поле Чудес".
09:08
What we found
221
548260
2000
Ми визначили,
09:10
was that the computer was successful in 75 percent of the cases
222
550260
2000
що комп'ютер давав 75% правильних відповідей,
09:12
in predicting the correct symbol.
223
552260
2000
передбачаючи потрібний символ.
09:14
In the rest of the cases,
224
554260
2000
У решті випадків,
09:16
typically the second best guess or third best guess was the right answer.
225
556260
3000
правильними були друга чи третя спроби.
09:19
There's also practical use
226
559260
2000
Цей метод має важливе
09:21
for this particular procedure.
227
561260
2000
практичне застосування.
09:23
There's a lot of these texts that are damaged.
228
563260
2000
Багато з цих текстів пошкоджено.
09:25
Here's an example of one such text.
229
565260
2000
Ось один із прикладів.
09:27
And we can use the computer model now to try to complete this text
230
567260
3000
Тепер ми можемо скористатися комп'ютерною моделлю,
09:30
and make a best guess prediction.
231
570260
2000
щоб знайти найвірогідніший варіант.
09:32
Here's an example of a symbol that was predicted.
232
572260
3000
Ось як було відгадано один із символів.
09:35
And this could be really useful as we try to decipher the script
233
575260
2000
Цей метод дуже корисний для розшифровування письма,
09:37
by generating more data that we can analyze.
234
577260
3000
він дає більше даних для аналізу.
09:40
Now here's one other thing you can do with the computer model.
235
580260
3000
Ця комп'ютерна модель має ще одне застосування.
09:43
So imagine a monkey
236
583260
2000
Уявіть мавпу,
09:45
sitting at a keyboard.
237
585260
2000
що бавиться з клавіатурою.
09:47
I think you might get a random jumble of letters that looks like this.
238
587260
3000
Гадаю, ми побачимо випадковий набір літер на зразок цього.
09:50
Such a random jumble of letters
239
590260
2000
Такий випадковий набір літер
09:52
is said to have a very high entropy.
240
592260
2000
має дуже високий ступінь ентропії.
09:54
This is a physics and information theory term.
241
594260
2000
Цей термін використовується у фізиці та теорії інформації.
09:56
But just imagine it's a really random jumble of letters.
242
596260
3000
Тепер уявимо ще більшу ступінь випадковості.
09:59
How many of you have ever spilled coffee on a keyboard?
243
599260
4000
Ви проливали коли-небудь каву на клавіатуру?
10:03
You might have encountered the stuck-key problem --
244
603260
2000
У вас, можливо, "заїдало" клавішу --
10:05
so basically the same symbol being repeated over and over again.
245
605260
3000
тоді один символ повторювався безліч разів.
10:08
This kind of a sequence is said to have a very low entropy
246
608260
3000
Така послідовність має дуже низьку ентропію,
10:11
because there's no variation at all.
247
611260
2000
тому що варіацій взагалі немає.
10:13
Language, on the other hand, has an intermediate level of entropy;
248
613260
3000
Мова має середній рівень ентропії - вона не є
10:16
it's neither too rigid,
249
616260
2000
ані занадто передбачуваною,
10:18
nor is it too random.
250
618260
2000
ані занадто випадковою.
10:20
What about the Indus script?
251
620260
2000
А який рівень у Індського письма?
10:22
Here's a graph that plots the entropies of a whole bunch of sequences.
252
622260
4000
Перед вами діаграма, що відображає рівень ентропії цілої низки послідовностей.
10:26
At the very top you find the uniformly random sequence,
253
626260
2000
Найвищий рівень має рівномірна випадкова послідовність,
10:28
which is a random jumble of letters --
254
628260
2000
тобто, випадковий набір літер.
10:30
and interestingly, we also find
255
630260
2000
Цікаво, що в цьому спектрі розташовані
10:32
the DNA sequence from the human genome and instrumental music.
256
632260
3000
послідовність (геном) ДНК людини та інструментальна музика.
10:35
And both of these are very, very flexible,
257
635260
2000
Ці обидві послідовності надзвичайно гнучкі,
10:37
which is why you find them in the very high range.
258
637260
2000
тому вони й розташовані найвище в спектрі.
10:39
At the lower end of the scale,
259
639260
2000
На найнижчому рівні цієї шкали
10:41
you find a rigid sequence, a sequence of all A's,
260
641260
2000
бачимо жорстку послідовність (з одних літер "а"),
10:43
and you also find a computer program,
261
643260
2000
а також комп'ютерну програму,
10:45
in this case in the language Fortran,
262
645260
2000
у нашому випадку мову Фортран,
10:47
which obeys really strict rules.
263
647260
2000
яка має дуже жорсткі правила.
10:49
Linguistic scripts
264
649260
2000
Мовні послідовності
10:51
occupy the middle range.
265
651260
2000
знаходяться посередині спектру.
10:53
Now what about the Indus script?
266
653260
2000
А де ж опиниться Індське письмо?
10:55
We found that the Indus script
267
655260
2000
Ми виявили, що Індське письмо
10:57
actually falls within the range of the linguistic scripts.
268
657260
2000
знаходиться якраз у діапазоні мовних систем.
10:59
When this result was first published,
269
659260
2000
Коли результати було вперше оприлюднено,
11:01
it was highly controversial.
270
661260
3000
вони спричинили шалену суперечку.
11:04
There were people who raised a hue and cry,
271
664260
3000
Дехто відкрито протестував -
11:07
and these people were the ones who believed
272
667260
2000
це була група людей, що не вважала
11:09
that the Indus script does not represent language.
273
669260
3000
Індське письмо мовою.
11:12
I even started to get some hate mail.
274
672260
2000
Мені навіть надходили листи з погрозами.
11:14
My students said
275
674260
2000
Мої студенти радили
11:16
that I should really seriously consider getting some protection.
276
676260
3000
серйозно подумати про власну безпеку.
11:19
Who'd have thought
277
679260
2000
Хто б міг подумати,
11:21
that deciphering could be a dangerous profession?
278
681260
2000
що розшифрування мови виявиться небезпечною справою?
11:23
What does this result really show?
279
683260
2000
Про що ж насправді свідчить цей результат?
11:25
It shows that the Indus script
280
685260
2000
Він показує, що Індське письмо
11:27
shares an important property of language.
281
687260
2000
володіє однією з важливих властивостей мови.
11:29
So, as the old saying goes,
282
689260
2000
Як вчить нас стара приказка,
11:31
if it looks like a linguistic script
283
691260
2000
якщо ці символи схожі на мовні знаки
11:33
and it acts like a linguistic script,
284
693260
2000
і поводяться, як знаки мови,
11:35
then perhaps we may have a linguistic script on our hands.
285
695260
3000
очевидно, маємо справу з мовною системою.
11:38
What other evidence is there
286
698260
2000
Які ще є ознаки того, що
11:40
that the script could actually encode language?
287
700260
2000
ці знаки насправді є якоюсь мовою?
11:42
Well linguistic scripts can actually encode multiple languages.
288
702260
3000
Певні лінгвістичні знаки можуть належати багатьом мовам.
11:45
So for example, here's the same sentence written in English
289
705260
3000
Наприклад, ось речення написане англійською,
11:48
and the same sentence written in Dutch
290
708260
2000
а це, те саме речення голландською
11:50
using the same letters of the alphabet.
291
710260
2000
з використанням тих самих літер латинської абетки.
11:52
If you don't know Dutch and you only know English
292
712260
3000
Якщо ви знаєте англійську, але не знаєте голландської,
11:55
and I give you some words in Dutch,
293
715260
2000
побачивши написане,
11:57
you'll tell me that these words contain
294
717260
2000
ви скажете, що в цих словах
11:59
some very unusual patterns.
295
719260
2000
якісь незвична послідовність літер.
12:01
Some things are not right,
296
721260
2000
Щось не так,
12:03
and you'll say these words are probably not English words.
297
723260
3000
і, напевно, це не англійські слова.
12:06
The same thing happens in the case of the Indus script.
298
726260
2000
Подібне трапляється і у випадку з Індським письмом.
12:08
The computer found several texts --
299
728260
2000
Комп'ютер знайшов кілька текстів --
12:10
two of them are shown here --
300
730260
2000
два з них бачимо на екрані, --
12:12
that have very unusual patterns.
301
732260
2000
в яких зафіксовано незвичайні послідовності.
12:14
So for example the first text:
302
734260
2000
Подивіться на перший текст:
12:16
there's a doubling of this jar-shaped sign.
303
736260
3000
бачимо подвоєння глекоподібного символу.
12:19
This sign is the most frequently-occurring sign
304
739260
2000
Це найпоширеніший символ
12:21
in the Indus script,
305
741260
2000
в Індському письмі,
12:23
and it's only in this text
306
743260
2000
але тільки в цьому тексті
12:25
that it occurs as a doubling pair.
307
745260
2000
його вжито двічі поспіль.
12:27
Why is that the case?
308
747260
2000
У чому справа?
12:29
We went back and looked at where these particular texts were found,
309
749260
3000
Ми уточнили, де саме було знайдено ці два тексти,
12:32
and it turns out that they were found
310
752260
2000
і виявилося, що їх знайшли
12:34
very, very far away from the Indus Valley.
311
754260
2000
дуже далеко від Індської долини,
12:36
They were found in present day Iraq and Iran.
312
756260
3000
на території сучасного Іраку та Ірану.
12:39
And why were they found there?
313
759260
2000
Чому їх там знайшли?
12:41
What I haven't told you is that
314
761260
2000
Я ще не казав, що
12:43
the Indus people were very, very enterprising.
315
763260
2000
Індський народ був дуже підприємливий.
12:45
They used to trade with people pretty far away from where they lived,
316
765260
3000
Його представники торгували далеко від власних земель.
12:48
and so in this case, they were traveling by sea
317
768260
3000
У згаданому випадку їм довелося подорожувати морем,
12:51
all the way to Mesopotamia, present-day Iraq.
318
771260
3000
аби дістатися Месопотамії (сучасний Ірак).
12:54
And what seems to have happened here
319
774260
2000
Існує припущення, що в цьому конкретному випадку
12:56
is that the Indus traders, the merchants,
320
776260
3000
Індські торговці -- купці --
12:59
were using this script to write a foreign language.
321
779260
3000
використовували свою писемність для запису іноземної мови.
13:02
It's just like our English and Dutch example.
322
782260
2000
Подібно до прикладу з англійською та голландською мовами.
13:04
And that would explain why we have these strange patterns
323
784260
2000
Це може пояснити незвичні послідовності,
13:06
that are very different from the kinds of patterns you see in the text
324
786260
3000
що різняться від решти комбінацій знаків,
13:09
that are found within the Indus Valley.
325
789260
3000
що їх знайшли в текстах з Індської долини.
13:12
This suggests that the same script, the Indus script,
326
792260
2000
Можна припустити, що одне й те саме письмо -- Індське --
13:14
could be used to write different languages.
327
794260
3000
використовували для різних мов.
13:17
The results we have so far seem to point to the conclusion
328
797260
3000
Отримані результати свідчать про те,
13:20
that the Indus script probably does represent language.
329
800260
3000
що Індське письмо, найімовірніше, є мовою.
13:23
If it does represent language,
330
803260
2000
Якщо це мова,
13:25
then how do we read the symbols?
331
805260
2000
як читати ці символи?
13:27
That's our next big challenge.
332
807260
2000
Це наступна велика проблема.
13:29
So you'll notice that many of the symbols
333
809260
2000
Ви помітили, що символи
13:31
look like pictures of humans, of insects,
334
811260
2000
нагадують зображення людей, комах,
13:33
of fishes, of birds.
335
813260
3000
риб, птахів.
13:36
Most ancient scripts
336
816260
2000
У більшості прадавніх мов
13:38
use the rebus principle,
337
818260
2000
використовувався принцип ребуса,
13:40
which is, using pictures to represent words.
338
820260
3000
коли малюнки заміщували слова.
13:43
So as an example, here's a word.
339
823260
3000
Ось, наприклад, слово belief [англ., віра, звучить як "біліф"].
13:46
Can you write it using pictures?
340
826260
2000
Можете записати його за допомогою малюнків?
13:48
I'll give you a couple seconds.
341
828260
2000
Дам вам кілька секунд.
13:50
Got it?
342
830260
2000
Написали?
13:52
Okay. Great.
343
832260
2000
Чудово.
13:54
Here's my solution.
344
834260
2000
А ось моє рішення.
13:56
You could use the picture of a bee followed by a picture of a leaf --
345
836260
2000
Можна намалювати бджолу (англійською звучить "бі") та листок (англійською звучить "ліф"),
13:58
and that's "belief," right.
346
838260
2000
і вийде "біліф", тобто віра.
14:00
There could be other solutions.
347
840260
2000
Можна знайти й інші рішення.
14:02
In the case of the Indus script,
348
842260
2000
У випадку з Індським письмом
14:04
the problem is the reverse.
349
844260
2000
маємо протилежну проблему.
14:06
You have to figure out the sounds of each of these pictures
350
846260
3000
Треба зрозуміти, як "звучали" всі ці малюнки,
14:09
such that the entire sequence makes sense.
351
849260
2000
щоби вся послідовність мала сенс.
14:11
So this is just like a crossword puzzle,
352
851260
3000
Це подібно до кросворда,
14:14
except that this is the mother of all crossword puzzles
353
854260
3000
але маємо справу з кросвордом усіх кросвордів,
14:17
because the stakes are so high if you solve it.
354
857260
4000
тому що ставки його розв'язку неймовірно високі.
14:21
My colleagues, Iravatham Mahadevan and Asko Parpola,
355
861260
3000
Мої колеги, Іраватам Магадеван та Аско Парпола
14:24
have been making some headway on this particular problem.
356
864260
2000
вже досягли деяких успіхів у розв'язанні цієї проблеми.
14:26
And I'd like to give you a quick example of Parpola's work.
357
866260
2000
Я хочу навести вам приклад з роботи Парполи.
14:28
Here's a really short text.
358
868260
2000
Ось коротенький текст,
14:30
It contains seven vertical strokes followed by this fish-like sign.
359
870260
3000
що складається з семи вертикальних ліній, за якими йде рибоподібний знак.
14:33
And I want to mention that these seals were used
360
873260
2000
Хочу нагадати, що ці печатки використовували
14:35
for stamping clay tags
361
875260
2000
для відтиску глиняних ярликів,
14:37
that were attached to bundles of goods,
362
877260
2000
що їх кріпили на товар.
14:39
so it's quite likely that these tags, at least some of them,
363
879260
3000
Отже, є ймовірність, що деякі з ярликів
14:42
contain names of merchants.
364
882260
2000
містять імена купців.
14:44
And it turns out that in India
365
884260
2000
Виявилося, що в Індії
14:46
there's a long tradition
366
886260
2000
існує давня традиція
14:48
of names being based on horoscopes
367
888260
2000
давати імена за гороскопом
14:50
and star constellations present at the time of birth.
368
890260
3000
та сузір'ям, під яким народилася людина.
14:53
In Dravidian languages,
369
893260
2000
У дравидських мовах
14:55
the word for fish is "meen"
370
895260
2000
слово "риба" -- "meen" --
14:57
which happens to sound just like the word for star.
371
897260
3000
звучить так само, як слово "зірка".
15:00
And so seven stars
372
900260
2000
Отже сім зірок
15:02
would stand for "elu meen,"
373
902260
2000
буде звучати як "elu meen",
15:04
which is the Dravidian word
374
904260
2000
що одночасно є дравидським словом
15:06
for the Big Dipper star constellation.
375
906260
2000
для позначення сузір'я Великої Ведмедиці.
15:08
Similarly, there's another sequence of six stars,
376
908260
3000
Сполучення символів для позначення 6-ти зірок
15:11
and that translates to "aru meen,"
377
911260
2000
звучить як "aru meen",
15:13
which is the old Dravidian name
378
913260
2000
що є древньою дравідською назвою
15:15
for the star constellation Pleiades.
379
915260
2000
сузір'я Плеяд.
15:17
And finally, there's other combinations,
380
917260
3000
І, насамкінець, є ще кілька комбінацій знаків,
15:20
such as this fish sign with something that looks like a roof on top of it.
381
920260
3000
таких, як сполучення рибоподібного знака із знаком, увінчаним чимось на кшталт даху.
15:23
And that could be translated into "mey meen,"
382
923260
3000
Це звучить як "mey meen",
15:26
which is the old Dravidian name for the planet Saturn.
383
926260
3000
і відповідає давній дравідській назві планети Сатурн.
15:29
So that was pretty exciting.
384
929260
2000
Все це доволі цікаво --
15:31
It looks like we're getting somewhere.
385
931260
2000
здається, ми намацали шлях.
15:33
But does this prove
386
933260
2000
Але чи це остаточно доводить,
15:35
that these seals contain Dravidian names
387
935260
2000
що згадані печатки містять дравідські імена,
15:37
based on planets and star constellations?
388
937260
2000
в основі яких лежать назви планет і сузір'їв?
15:39
Well not yet.
389
939260
2000
Поки що ні.
15:41
So we have no way of validating
390
941260
2000
Такий спосіб читання текстів
15:43
these particular readings,
391
943260
2000
ще не можна вважати остаточним,
15:45
but if more and more of these readings start making sense,
392
945260
3000
проте якщо дедалі більше таких відкриттів матимуть сенс,
15:48
and if longer and longer sequences
393
948260
2000
і якщо дедалі довші комбінації знаків
15:50
appear to be correct,
394
950260
2000
виявлятимуться правильними,
15:52
then we know that we are on the right track.
395
952260
2000
ми будемо впевнені, щодо вірності нашого шляху.
15:54
Today,
396
954260
2000
Сьогодні
15:56
we can write a word such as TED
397
956260
3000
ми можемо написати слова, як-от TED,
15:59
in Egyptian hieroglyphics and in cuneiform script,
398
959260
3000
єгипетськими ієрогліфами і клинописом,
16:02
because both of these were deciphered
399
962260
2000
тому що вони вже були розшифровані
16:04
in the 19th century.
400
964260
2000
ще у 19-му столітті.
16:06
The decipherment of these two scripts
401
966260
2000
Розшифровка цих писемностей
16:08
enabled these civilizations to speak to us again directly.
402
968260
3000
дала нам змогу спілкуватися з давніми цивілізаціями напряму.
16:11
The Mayans
403
971260
2000
Цивілізація Майя
16:13
started speaking to us in the 20th century,
404
973260
2000
озвалася до нас у 20-му столітті,
16:15
but the Indus civilization remains silent.
405
975260
3000
а Індська все ще мовчить.
16:18
Why should we care?
406
978260
2000
Навіщо вона нам потрібна?
16:20
The Indus civilization does not belong
407
980260
2000
Індська цивілізація не належить
16:22
to just the South Indians or the North Indians
408
982260
2000
виключно південним чи північним індусам,
16:24
or the Pakistanis;
409
984260
2000
або ж пакистанцям.
16:26
it belongs to all of us.
410
986260
2000
Вона належить усім нам.
16:28
These are our ancestors --
411
988260
2000
Це наші пращури -
16:30
yours and mine.
412
990260
2000
мої і ваші.
16:32
They were silenced
413
992260
2000
Вони стали мовчазними
16:34
by an unfortunate accident of history.
414
994260
2000
через прикрі історичні непорозуміння.
16:36
If we decipher the script,
415
996260
2000
Але якщо ми розшифруємо їхню мову,
16:38
we would enable them to speak to us again.
416
998260
2000
вони зможуть знову заговорити.
16:40
What would they tell us?
417
1000260
3000
Про що вони нам розкажуть?
16:43
What would we find out about them? About us?
418
1003260
3000
Що ми про них дізнаємося? А про нас?
16:46
I can't wait to find out.
419
1006260
3000
Не можу дочекатися!
16:49
Thank you.
420
1009260
2000
Дякую.
16:51
(Applause)
421
1011260
4000
(Оплески)
Про цей сайт

Цей сайт познайомить вас з відеороликами YouTube, корисними для вивчення англійської мови. Ви побачите уроки англійської мови, які проводять першокласні викладачі з усього світу. Двічі клацніть на англійських субтитрах, що відображаються на кожній сторінці відео, щоб відтворити відео з цієї сторінки. Субтитри прокручуються синхронно з відтворенням відео. Якщо у вас є коментарі або побажання, будь ласка, зв'яжіться з нами за допомогою цієї контактної форми.

https://forms.gle/WvT1wiN1qDtmnspy7