Rajesh Rao: Computing a Rosetta Stone for the Indus script

1,196,569 views

2011-06-28 ・ TED


New videos

Rajesh Rao: Computing a Rosetta Stone for the Indus script

1,196,569 views ・ 2011-06-28

TED


아래 영문자막을 더블클릭하시면 영상이 재생됩니다.

번역: Young-ho Park 검토: JY Kang
00:15
I'd like to begin with a thought experiment.
0
15260
3000
제 이야기에 앞서 사고실험을 하나 해보죠.
00:19
Imagine that it's 4,000 years into the future.
1
19260
3000
지금이 4000년 이후의 미래라고 상상하겠습니다.
00:22
Civilization as we know it
2
22260
2000
오늘의 문명은 이미
00:24
has ceased to exist --
3
24260
2000
더 이상 존재하지 않습니다.
00:26
no books,
4
26260
2000
책, 전자제품,
00:28
no electronic devices,
5
28260
3000
페이스북 그리고
00:31
no Facebook or Twitter.
6
31260
3000
트위터도 없습니다.
00:34
All knowledge of the English language and the English alphabet
7
34260
3000
영어와 영어 알파벳에 대한
00:37
has been lost.
8
37260
2000
모든 지식도 없어졌지요.
00:39
Now imagine archeologists
9
39260
2000
미래의 고고학자들이 폐허가 된 어떤 도시의
00:41
digging through the rubble of one of our cities.
10
41260
2000
잔해를 파헤치는 것을 상상해보죠.
00:43
What might they find?
11
43260
2000
그들은 무엇을 찾아내게 될까요?
00:45
Well perhaps some rectangular pieces of plastic
12
45260
3000
어쩌면 이상한 형상이 있는 4각형 플라스틱
00:48
with strange symbols on them.
13
48260
3000
조각들을 발견할 지도 모르겠네요.
00:51
Perhaps some circular pieces of metal.
14
51260
3000
둥그런 금속 조각들이 나올지도 모르죠.
00:54
Maybe some cylindrical containers
15
54260
2000
형상이 적힌 원통형 용기들을
00:56
with some symbols on them.
16
56260
2000
파낼지도 모릅니다.
00:58
And perhaps one archeologist becomes an instant celebrity
17
58260
3000
그러던중 어떤 고고학자가 북아메리카에 있는
01:01
when she discovers --
18
61260
2000
어떤 언덕에 파묻혀 있는
01:03
buried in the hills somewhere in North America --
19
63260
2000
이들과 똑같은 모양의 거대한 형상을 발견하여
01:05
massive versions of these same symbols.
20
65260
3000
하루아침에 유명인사가 될런지도 모릅니다.
01:10
Now let's ask ourselves,
21
70260
2000
이런 유물은
01:12
what could such artifacts say about us
22
72260
3000
4000년 이후의 사람들에게 우리들에 대해
01:15
to people 4,000 years into the future?
23
75260
3000
어떤 이야기를 해 줄까요?
01:18
This is no hypothetical question.
24
78260
2000
이것은 가상적인 질문이 아닙니다.
01:20
In fact, this is exactly the kind of question we're faced with
25
80260
3000
4000년 전에 존재했던 인더스 계곡의 문명을
01:23
when we try to understand the Indus Valley civilization,
26
83260
3000
이해하려고 할때 저희들이 묻는
01:26
which existed 4,000 years ago.
27
86260
2000
질문이 바로 이런 것들이지요.
01:28
The Indus civilization was roughly contemporaneous
28
88260
3000
인더스 문명은 훨씬 더 잘 알려진 이집트 또는
01:31
with the much better known Egyptian and the Mesopotamian civilizations,
29
91260
3000
메소포타미아 문명과 거의 비슷한 시기에 존재했었는데
01:34
but it was actually much larger than either of these two civilizations.
30
94260
3000
그들보다 훨씬 더 큰 지역에 퍼져 있었습니다.
01:37
It occupied the area
31
97260
2000
인더스 문명은
01:39
of approximately one million square kilometers,
32
99260
2000
약 백만 평방 킬로미터의 면적에 퍼져있었는데
01:41
covering what is now Pakistan,
33
101260
2000
오늘날의 파키스탄, 북서 인도,
01:43
Northwestern India
34
103260
2000
그리고 아프가니스탄과
01:45
and parts of Afghanistan and Iran.
35
105260
2000
이란의 일부를 포함했었습니다.
01:47
Given that it was such a vast civilization,
36
107260
2000
인더스 문명이 그렇게 큰 지역을 군림했었으니까
01:49
you might expect to find really powerful rulers, kings,
37
109260
4000
강력한 통치자나 왕에 대한 유적,
01:53
and huge monuments glorifying these powerful kings.
38
113260
3000
또는 이들을 찬양하는 기념물들이 있을만 하겠지요.
01:56
In fact,
39
116260
2000
그러나 고고학자들은
01:58
what archeologists have found is none of that.
40
118260
2000
그런것을 하나도 찾지 못했습니다.
02:00
They've found small objects such as these.
41
120260
3000
하지만, 이와같은 작은 유물들은 발견했지요.
02:03
Here's an example of one of these objects.
42
123260
3000
이것은 이러한 유물의 일례입니다.
02:06
Well obviously this is a replica.
43
126260
2000
물론 이건 복제품입니다.
02:08
But who is this person?
44
128260
3000
그런데 이건 누구일까요?
02:11
A king? A god?
45
131260
2000
왕일까요? 신일까요?
02:13
A priest?
46
133260
2000
성직자일까요?
02:15
Or perhaps an ordinary person
47
135260
2000
어쩌면 여러분이나 저와 같은
02:17
like you or me?
48
137260
2000
보통 사람이었을까요?
02:19
We don't know.
49
139260
2000
우리는 그 답을 모릅니다.
02:21
But the Indus people also left behind artifacts with writing on them.
50
141260
3000
그러나 인더스 사람들은 글자가 적힌 유물도 남겼는데 그중에는
02:24
Well no, not pieces of plastic,
51
144260
2000
플라스틱 조각은 없었지만,
02:26
but stone seals, copper tablets,
52
146260
3000
돌로 만든 인장, 구리 명판,
02:29
pottery and, surprisingly,
53
149260
2000
도자기 그리고 놀랍게도
02:31
one large sign board,
54
151260
2000
어떤 도시의 문 근처에
02:33
which was found buried near the gate of a city.
55
153260
2000
파묻혔던 게시판이 있었습니다.
02:35
Now we don't know if it says Hollywood,
56
155260
2000
어쩌면 헐리우드라고 쓴 것인지 또는
02:37
or even Bollywood for that matter.
57
157260
2000
심지어는 볼리우드라고 쓴것인지 모르겠습니다.
02:39
In fact, we don't even know
58
159260
2000
사실 우리는 이런 유물에
02:41
what any of these objects say,
59
161260
2000
무엇이 적혀 있는지 전혀 모릅니다.
02:43
and that's because the Indus script is undeciphered.
60
163260
3000
우리는 아직 인더스 글자를 못 읽으니까요.
02:46
We don't know what any of these symbols mean.
61
166260
2000
우리는 이런 형상의 의미를 하나도 모릅니다.
02:48
The symbols are most commonly found on seals.
62
168260
3000
이런 형상들은 인장에 가장 흔히 나타나는데요.
02:51
So you see up there one such object.
63
171260
2000
여기 그 중 하나가 있습니다.
02:53
It's the square object with the unicorn-like animal on it.
64
173260
3000
유니콘 같은 동물이 새겨진 4각형의 인장인데요.
02:56
Now that's a magnificent piece of art.
65
176260
2000
대단히 훌륭한 예술품입니다.
02:58
So how big do you think that is?
66
178260
2000
실제 크기가 얼마나 될 것 같으세요?
03:00
Perhaps that big?
67
180260
2000
이 정도 될까요?
03:02
Or maybe that big?
68
182260
2000
아니면 이정도?
03:04
Well let me show you.
69
184260
2000
제가 보여드리죠.
03:07
Here's a replica of one such seal.
70
187260
3000
이것은 이런 인장의 복제품인데요.
03:10
It's only about one inch by one inch in size --
71
190260
2000
가로 1인치 세로 1인치의 크기입니다.
03:12
pretty tiny.
72
192260
2000
꽤 작죠.
03:14
So what were these used for?
73
194260
2000
그런데 이런것은 무슨 용도로 쓰였을까요?
03:16
We know that these were used for stamping clay tags
74
196260
3000
우리는 이들이 운송되는 물건에 붙이는 진흙 태그에
03:19
that were attached to bundles of goods that were sent from one place to the other.
75
199260
3000
인장을 찍는데 사용됐다는 것을 알고 있습니다.
03:22
So you know those packing slips you get on your FedEx boxes?
76
202260
3000
여러분은 페덱스 박스에 붙혀진 운송장을 보신일이 있으시겠죠.
03:25
These were used to make those kinds of packing slips.
77
205260
3000
이것은 바로 그런 운송장 표식을 만드는데 사용된 것이죠.
03:28
You might wonder what these objects contain
78
208260
3000
우리들은 여기에 무슨 말이 적혀져
03:31
in terms of their text.
79
211260
2000
있는지 알고 싶습니다.
03:33
Perhaps they're the name of the sender
80
213260
2000
그것이 물건을 보내는 사람의 이름인지
03:35
or some information about the goods
81
215260
2000
또는 보내는 물건에 대한 어떤 정보인지
03:37
that are being sent from one place to the other -- we don't know.
82
217260
3000
우리는 아직 모릅니다.
03:40
We need to decipher the script to answer that question.
83
220260
2000
그 질문에 대한 답을 알려면 그 글을 해독할 줄 알아야죠.
03:42
Deciphering the script
84
222260
2000
그 글을 해독하는 것은
03:44
is not just an intellectual puzzle;
85
224260
2000
단순한 지적인 퍼즐이 아니라
03:46
it's actually become a question
86
226260
2000
남 아시아의 정치와
03:48
that's become deeply intertwined
87
228260
2000
문화적 역사가
03:50
with the politics and the cultural history of South Asia.
88
230260
3000
깊이 상호 연결된 문제입니다.
03:53
In fact, the script has become a battleground of sorts
89
233260
3000
사실 그 글은 3가지 그룹 사람들의
03:56
between three different groups of people.
90
236260
2000
일종의 전쟁터가 되고 말았습니다.
03:58
First, there's a group of people
91
238260
2000
첫번째 그룹의 사람들은
04:00
who are very passionate in their belief
92
240260
2000
인더스 문자는
04:02
that the Indus script
93
242260
2000
사실은 언어가 아니라고
04:04
does not represent a language at all.
94
244260
2000
열정적으로 믿고 있죠.
04:06
These people believe that the symbols
95
246260
2000
그사람들은 우리의 교통표지판에 있는 심볼이나
04:08
are very similar to the kind of symbols you find on traffic signs
96
248260
3000
또는 방패에 있는 표장과 매우 비슷한
04:11
or the emblems you find on shields.
97
251260
3000
것이라고 생각합니다.
04:14
There's a second group of people
98
254260
2000
두번째 그룹의 사람들은
04:16
who believe that the Indus script represents an Indo-European language.
99
256260
3000
인더스 문자가 인도유럽어라고 믿고 있습니다.
04:19
If you look at a map of India today,
100
259260
2000
현대 인도의 지도를 보면
04:21
you'll see that most of the languages spoken in North India
101
261260
3000
북부 인도에서 사용되는 대부분의 언어는 인도유럽어에
04:24
belong to the Indo-European language family.
102
264260
3000
속한다는 것을 볼수 있습니다.
04:27
So some people believe that the Indus script
103
267260
2000
즉, 인더스어는 산스크리트어와 같은
04:29
represents an ancient Indo-European language such as Sanskrit.
104
269260
3000
고대의 인도유럽어라고 생각하고 있는 거죠.
04:32
There's a last group of people
105
272260
2000
마지막 그룹의 사람들은
04:34
who believe that the Indus people
106
274260
3000
인더스 사람이 현재 남 인도에 사는
04:37
were the ancestors of people living in South India today.
107
277260
3000
사람들의 조상이라고 믿습니다.
04:40
These people believe that the Indus script
108
280260
2000
이들은 인더스 문자는
04:42
represents an ancient form
109
282260
2000
오늘날 남부 인도에서
04:44
of the Dravidian language family,
110
284260
2000
많이 사용되고 있는
04:46
which is the language family spoken in much of South India today.
111
286260
3000
드라비디안 언어계의 고대어라고 믿고 있습니다.
04:49
And the proponents of this theory
112
289260
2000
이 설의 옹호자들은
04:51
point to that small pocket of Dravidian-speaking people in the North,
113
291260
3000
아프가니스탄 근처에 위치한 인도 북부의
04:54
actually near Afghanistan,
114
294260
2000
한 작은 지역에 드라비디안어를
04:56
and they say that perhaps, sometime in the past,
115
296260
3000
사용하는 사람들이 있는 것으로 비추어 보아
04:59
Dravidian languages were spoken all over India
116
299260
3000
한때 인도 전체에 걸쳐
05:02
and that this suggests
117
302260
2000
드라비디안어가
05:04
that the Indus civilization is perhaps also Dravidian.
118
304260
3000
사용됐을 것이라고 주장하고 있습니다.
05:07
Which of these hypotheses can be true?
119
307260
3000
이들 3가지 가설 중에 어떤 것이 맞을까요?
05:10
We don't know, but perhaps if you deciphered the script,
120
310260
2000
우리는 아직 그 답을 모르지만 인더스 문자를
05:12
you would be able to answer this question.
121
312260
2000
해독할 수 있으면 그 질문의 답을 알게 되겠죠.
05:14
But deciphering the script is a very challenging task.
122
314260
2000
그러나 그 문자를 해독하는 것은 매우 어렵습니다.
05:16
First, there's no Rosetta Stone.
123
316260
2000
불행히도 우리에겐 로제타 스톤이 없습니다.
05:18
I don't mean the software;
124
318260
2000
로제터 스톤이라는 언어학습 소프트웨어를
05:20
I mean an ancient artifact
125
320260
2000
말하는게 아니고, 동일한 내용이
05:22
that contains in the same text
126
322260
2000
이미 알려진 언어와 모르는 말로 위아래로
05:24
both a known text and an unknown text.
127
324260
3000
적혀있는 고대 이집트의 비석을 말합니다.
05:27
We don't have such an artifact for the Indus script.
128
327260
3000
인더스 스크립트의 경우에는 그런 유물이 없지요.
05:30
And furthermore, we don't even know what language they spoke.
129
330260
3000
뿐만 아니라, 우리는 그들이 어떤 언어를 사용했는지도 모릅니다.
05:33
And to make matters even worse,
130
333260
2000
그리고 설상가상으로
05:35
most of the text that we have are extremely short.
131
335260
2000
거기에 씌여진 문장들은 매우 짧습니다.
05:37
So as I showed you, they're usually found on these seals
132
337260
2000
그리고 이 문자들은 아까 보여드린 매우 작은 인장에서
05:39
that are very, very tiny.
133
339260
2000
주로 볼 수 있습니다.
05:41
And so given these formidable obstacles,
134
341260
2000
이와같은 어려움을 참작해 볼때
05:43
one might wonder and worry
135
343260
2000
인더스 문자를 해독하는 것이
05:45
whether one will ever be able to decipher the Indus script.
136
345260
3000
가능하냐고 걱정하는 분들도 계시겠죠.
05:48
In the rest of my talk,
137
348260
2000
그럼에도 불구하고 제가 어떻게 해서
05:50
I'd like to tell you about how I learned to stop worrying
138
350260
2000
그런 걱정을 하지 않고 인더스 스크립트를 해독하는 일에
05:52
and love the challenge posed by the Indus script.
139
352260
2000
기꺼이 도전하게 되었는지 말씀드리지요.
05:54
I've always been fascinated by the Indus script
140
354260
3000
저는 중학교 교과서에서 인더스 스크립트에 대해
05:57
ever since I read about it in a middle school textbook.
141
357260
2000
배운 후 항상 인더스어에 매혹되어 있습니다.
05:59
And why was I fascinated?
142
359260
2000
그 이유는 인더스 문자는
06:01
Well it's the last major undeciphered script in the ancient world.
143
361260
4000
우리가 아직 해독하지 못한 유일한 주요 고대 문명 문자니까요.
06:05
My career path led me to become a computational neuroscientist,
144
365260
3000
그 후 저는 컴퓨터 신경과학자가 되어서
06:08
so in my day job,
145
368260
2000
두뇌가 어떻게 예측을 하고,
06:10
I create computer models of the brain
146
370260
2000
의사 결정을 내리며,
06:12
to try to understand how the brain makes predictions,
147
372260
3000
모르는것을 배우는가 등을 이해하기 위해
06:15
how the brain makes decisions,
148
375260
2000
두뇌의 컴퓨터 모델을
06:17
how the brain learns and so on.
149
377260
2000
만드는 일을 하고 있습니다.
06:19
But in 2007, my path crossed again with the Indus script.
150
379260
3000
그런데 2007년에 제가 인도에
06:22
That's when I was in India,
151
382260
2000
있었을때 다행히도
06:24
and I had the wonderful opportunity
152
384260
2000
컴퓨터 모델을 사용해서
06:26
to meet with some Indian scientists
153
386260
2000
인더스 스크립트를 분석하고 있는
06:28
who were using computer models to try to analyze the script.
154
388260
3000
인도 과학자들을 몇명 만났습니다.
06:31
And so it was then that I realized
155
391260
2000
그때 저는 이들 과학자들과
06:33
there was an opportunity for me to collaborate with these scientists,
156
393260
3000
함께 일할 수 있는 좋은 기회가 왔다는 것을 깨닫고
06:36
and so I jumped at that opportunity.
157
396260
2000
즉시로 이 연구에 도전했습니다.
06:38
And I'd like to describe some of the results that we have found.
158
398260
2000
그럼, 지금까지 저희들이 발견한 결과를 말씀드리지요.
06:40
Or better yet, let's all collectively decipher.
159
400260
3000
아- 그보다는 우리 모두가 지금 같이 해독해 보죠.
06:43
Are you ready?
160
403260
2000
그럴 준비가 되셨나요?
06:45
The first thing that you need to do when you have an undeciphered script
161
405260
3000
모르는 문자를 처음 해독할 때 제일 먼저 해야 하는 일은 그것이
06:48
is try to figure out the direction of writing.
162
408260
2000
어떤 방향으로 써졌는지 알아내는 것이죠.
06:50
Here are two texts that contain some symbols on them.
163
410260
3000
여기에 형상이 몇개 있는 텍스트가 2개 있습니다.
06:53
Can you tell me
164
413260
2000
이 글이 왼쪽에서 오른쪽으로 쓰여졌는지
06:55
if the direction of writing is right to left or left to right?
165
415260
3000
아니면 오른쪽에서 부터 쓰여졌는지 아시겠어요?
06:58
I'll give you a couple of seconds.
166
418260
3000
잠시 생각을 해 보시죠.
07:01
Okay. Right to left, how many? Okay.
167
421260
3000
오른쪽에서 부터 왼쪽이라고 생각하시는 분은?
07:04
Okay. Left to right?
168
424260
2000
완쪽에서 부터 오른쪽은?
07:06
Oh, it's almost 50/50. Okay.
169
426260
2000
흠..거의 반반 정도 이시군요.
07:08
The answer is:
170
428260
2000
제가 정답을 말씀드리지요.
07:10
if you look at the left-hand side of the two texts,
171
430260
2000
이 두 텍스트의 왼쪽을 보면
07:12
you'll notice that there's a cramping of signs,
172
432260
3000
비좁게 적힌 글자가 하나적혀있는데
07:15
and it seems like 4,000 years ago,
173
435260
2000
아마 4000년 전에 누가 오른쪽에서
07:17
when the scribe was writing from right to left,
174
437260
2000
왼쪽으로 글을 쓰다가 끝부분에서 글자를
07:19
they ran out of space.
175
439260
2000
쓸 자리가 모자랐던 모양입니다.
07:21
And so they had to cram the sign.
176
441260
2000
그래서 그 글자를 비좁게 썼지요.
07:23
One of the signs is also below the text on the top.
177
443260
2000
오른쪽 인장의 문장에는 한 글자가 밑에 적혀있는데요.
07:25
This suggests the direction of writing
178
445260
2000
이것은 아마도 글 쓰는 방향이 오른쪽에서
07:27
was probably from right to left,
179
447260
2000
왼쪽이라는것을 암시해 주지요.
07:29
and so that's one of the first things we know,
180
449260
2000
모든 문어의 가장 기본적인 특성의 하나는
07:31
that directionality is a very key aspect of linguistic scripts.
181
451260
3000
그 글을 어떤 방향으로 읽는가 하는 것인데
07:34
And the Indus script now has
182
454260
2000
우리는 이제 인더스어를 읽는
07:36
this particular property.
183
456260
2000
방향을 찾아낸 것입니다.
07:38
What other properties of language does the script show?
184
458260
2000
인더스어에는 또 다른 어떤 특성이 있을까요?
07:40
Languages contain patterns.
185
460260
2000
모든 언어에는 패턴이 있는데요.
07:42
If I give you the letter Q
186
462260
2000
예를들면, 한 단어에서 "Q"자가 나온
07:44
and ask you to predict the next letter, what do you think that would be?
187
464260
3000
다음에는 어떤 문자가 나올 확률이 가장 높을까요?
07:47
Most of you said U, which is right.
188
467260
2000
대부분은 "U"라고 추측하겠죠. 그렇습니다.
07:49
Now if I asked you to predict one more letter,
189
469260
2000
이제 알파벳 하나를 더 추측하라고 하면
07:51
what do you think that would be?
190
471260
2000
무엇을 고르시겠습니까?
07:53
Now there's several thoughts. There's E. It could be I. It could be A,
191
473260
3000
"E", "I", 또는 "A" 모두가 가능하겠지요
07:56
but certainly not B, C or D, right?
192
476260
3000
그러나 "B"나 "C" 또는 "D"는 절대로 아니겠지요.
07:59
The Indus script also exhibits similar kinds of patterns.
193
479260
3000
인더스 문자도 그런 패턴을 보여줍니다.
08:02
There's a lot of text that start with this diamond-shaped symbol.
194
482260
3000
예를들면, 많은 텍스트들이 다이아몬드 모양의 형상으로 시작되는데요.
08:05
And this in turn tends to be followed
195
485260
2000
그리고는 주로 따옴표 비슷한
08:07
by this quotation marks-like symbol.
196
487260
2000
형상이 뒤따르는 경향을 보입니다.
08:09
And this is very similar to a Q and U example.
197
489260
2000
예로 들었던 "Q" 다음의 "U"와 비슷한 경우죠.
08:11
This symbol can in turn be followed
198
491260
2000
그리고는 이런 물고기 모양의 형상,
08:13
by these fish-like symbols and some other signs,
199
493260
3000
그리고 다른 형상들이 나오는데
08:16
but never by these other signs at the bottom.
200
496260
2000
제일 밑에 있는 기호들은 절대로 나오지 않습니다.
08:18
And furthermore, there's some signs
201
498260
2000
또한, 항아리 모양의 형상 또는
08:20
that really prefer the end of texts,
202
500260
2000
일부 다른 형상들은 주로
08:22
such as this jar-shaped sign,
203
502260
2000
텍스트의 끝에 나타납니다.
08:24
and this sign, in fact, happens to be
204
504260
2000
그런데 이 기호는 사실 인더스 문자에서
08:26
the most frequently occurring sign in the script.
205
506260
2000
가장 자주 나타나는 형상입니다.
08:28
Given such patterns, here was our idea.
206
508260
3000
이런 패턴이 있다는 것을 깨달은 후
08:31
The idea was to use a computer
207
511260
2000
우리들은 컴퓨터를 사용해서
08:33
to learn these patterns,
208
513260
2000
이러한 패턴을 배우는 목적으로
08:35
and so we gave the computer the existing texts.
209
515260
3000
우리가 가지고 있는 문자를 모두 입력시켰지요.
08:38
And the computer learned a statistical model
210
518260
2000
그리고는 어떤 형상들이 주로 함께 나타나고,
08:40
of which symbols tend to occur together
211
520260
2000
어떤 형상이 어떤 형상에 뒤따라 나오는가에 대한
08:42
and which symbols tend to follow each other.
212
522260
2000
통계적 모델을 컴퓨터가 배우게 했지요.
08:44
Given the computer model,
213
524260
2000
간단히 말해서, 일단 컴퓨터 모델이 있으면
08:46
we can test the model by essentially quizzing it.
214
526260
3000
그 모델에 질문을 던져서 그 모델을 테스트 할 수 있습니다.
08:49
So we could deliberately erase some symbols,
215
529260
2000
예를들면, 일부러 형상을 몇개 지우고 어떤 형상이
08:51
and we can ask it to predict the missing symbols.
216
531260
3000
빠졌는지 알아 맞춰보라고 할 수도 있죠.
08:54
Here are some examples.
217
534260
3000
그럼 몇가지 예를 보여드리죠.
09:00
You may regard this
218
540260
2000
이것은 마치 역사상
09:02
as perhaps the most ancient game
219
542260
2000
가장 오래된 '행운의 뺑뺑이'를 가지고
09:04
of Wheel of Fortune.
220
544260
3000
노는것과 마찬가지죠.
09:08
What we found
221
548260
2000
우리가 조사한 결과
09:10
was that the computer was successful in 75 percent of the cases
222
550260
2000
우리 모델은 75%의 경우에 옳은 형상을
09:12
in predicting the correct symbol.
223
552260
2000
예측할 수 있다는 것을 알았습니다.
09:14
In the rest of the cases,
224
554260
2000
나머지의 25%의 경우에는
09:16
typically the second best guess or third best guess was the right answer.
225
556260
3000
대부분 두번째 아니면 세번째 추측에서 정답이 나왔죠.
09:19
There's also practical use
226
559260
2000
저희 모델은 특히 이런 작업을 할때
09:21
for this particular procedure.
227
561260
2000
실용적인 가치가 있습니다.
09:23
There's a lot of these texts that are damaged.
228
563260
2000
이들 유물에는 문자가 손상된 부분이
09:25
Here's an example of one such text.
229
565260
2000
많이있는데 이것이 좋은 한 예입니다.
09:27
And we can use the computer model now to try to complete this text
230
567260
3000
이런 경우에 컴퓨터 모델을 사용해서 어떤 글자가 빠졌을 가능성이
09:30
and make a best guess prediction.
231
570260
2000
가장 많은가를 추측할 수 있죠.
09:32
Here's an example of a symbol that was predicted.
232
572260
3000
이것은 그렇게 추측한 형상의 한 예입니다.
09:35
And this could be really useful as we try to decipher the script
233
575260
2000
그런데 이것은 우리가 분석할 수 있는
09:37
by generating more data that we can analyze.
234
577260
3000
데이터를 더 많이 생성해 주기 때문에
09:40
Now here's one other thing you can do with the computer model.
235
580260
3000
문자를 해독하는데 큰 도움이 됩니다.
09:43
So imagine a monkey
236
583260
2000
원숭이가 키보드 앞에서
09:45
sitting at a keyboard.
237
585260
2000
타자치는 것을 상상해보세요.
09:47
I think you might get a random jumble of letters that looks like this.
238
587260
3000
아마도 원숭이의 무작위적인 타이핑의 결과는 이렇겠죠.
09:50
Such a random jumble of letters
239
590260
2000
이와같이 무작위로 섞여진 글자들은
09:52
is said to have a very high entropy.
240
592260
2000
엔트로피가 높다고 말합니다.
09:54
This is a physics and information theory term.
241
594260
2000
엔트로피는 물리와 정보이론의 용어인데요.
09:56
But just imagine it's a really random jumble of letters.
242
596260
3000
이것을 완전히 임의로 뒤섞인 글자라고 상상하시면 됩니다.
09:59
How many of you have ever spilled coffee on a keyboard?
243
599260
4000
여러분중에 키보드에 커피를 쏟아보신 분이 계세요?
10:03
You might have encountered the stuck-key problem --
244
603260
2000
키보드가 붙어버리면 똑같은 글자가
10:05
so basically the same symbol being repeated over and over again.
245
605260
3000
계속 반복되며 입력되는 경우가 있는데요.
10:08
This kind of a sequence is said to have a very low entropy
246
608260
3000
이런 배열에는 변화가 전혀 없기 때문에
10:11
because there's no variation at all.
247
611260
2000
엔트로피가 매우 낮다고 말합니다.
10:13
Language, on the other hand, has an intermediate level of entropy;
248
613260
3000
언어는 중간 정도의 엔트로피를 가지고 있습니다.
10:16
it's neither too rigid,
249
616260
2000
언어는 지나치게 일정하지도 않고
10:18
nor is it too random.
250
618260
2000
지나치게 무작위하지 않으니까요.
10:20
What about the Indus script?
251
620260
2000
인더스 문자는 어떨까요?
10:22
Here's a graph that plots the entropies of a whole bunch of sequences.
252
622260
4000
이 그래프는 여러 종류의 배열에 대한 엔트로피를 나타낸 것입니다.
10:26
At the very top you find the uniformly random sequence,
253
626260
2000
제일 윗쪽은 균일하게 임의로
10:28
which is a random jumble of letters --
254
628260
2000
배열된 글자들을 나타내는데
10:30
and interestingly, we also find
255
630260
2000
흥미있게도 인간 게놈의
10:32
the DNA sequence from the human genome and instrumental music.
256
632260
3000
DNA 배열과 악기 음악도 이와 유사하지요.
10:35
And both of these are very, very flexible,
257
635260
2000
이 배열들은 매우 매우 신축성있게
10:37
which is why you find them in the very high range.
258
637260
2000
변하기 때문에 엔트로피가 매우 높다고 합니다.
10:39
At the lower end of the scale,
259
639260
2000
한편, 전혀 변함없이
10:41
you find a rigid sequence, a sequence of all A's,
260
641260
2000
모두 "A"로만 구성된 배열이나
10:43
and you also find a computer program,
261
643260
2000
엄격한 규칙을 따라야 하는
10:45
in this case in the language Fortran,
262
645260
2000
포트란 컴퓨터 프로그램은
10:47
which obeys really strict rules.
263
647260
2000
아랫쪽 부분에 있지요.
10:49
Linguistic scripts
264
649260
2000
언어 문자는
10:51
occupy the middle range.
265
651260
2000
중간 부분에 있습니다.
10:53
Now what about the Indus script?
266
653260
2000
그럼 인더스 문자는 어떨까요?
10:55
We found that the Indus script
267
655260
2000
우리는 인더스 문자가
10:57
actually falls within the range of the linguistic scripts.
268
657260
2000
언어 문자의 구역에 있다는 것을 알아냈습니다.
10:59
When this result was first published,
269
659260
2000
이 결과가 처음 발표되었을때
11:01
it was highly controversial.
270
661260
3000
큰 반대여론이 나왔었지요.
11:04
There were people who raised a hue and cry,
271
664260
3000
인더스 문자가 언어가 아니라고
11:07
and these people were the ones who believed
272
667260
2000
생각하는 사람들은 고함을 지르며
11:09
that the Indus script does not represent language.
273
669260
3000
큰 소동을 벌였습니다.
11:12
I even started to get some hate mail.
274
672260
2000
저는 심지어 항의메일도 받았죠.
11:14
My students said
275
674260
2000
제 제자들은
11:16
that I should really seriously consider getting some protection.
276
676260
3000
제 신변보호를 신중히 고려해야 한다고 까지 말했습니다.
11:19
Who'd have thought
277
679260
2000
고어를 해독하는 일이
11:21
that deciphering could be a dangerous profession?
278
681260
2000
위험한 직업이라고 누가 상상이나 했겠습니까?
11:23
What does this result really show?
279
683260
2000
이 도표는 어떤 결론을 말해 줄까요?
11:25
It shows that the Indus script
280
685260
2000
이것은 인더스 문자가 언어의
11:27
shares an important property of language.
281
687260
2000
중요한 한 특성을 가지고 있다는 것을 보여줍니다.
11:29
So, as the old saying goes,
282
689260
2000
그런데, 옛말에도 있듯이
11:31
if it looks like a linguistic script
283
691260
2000
이것이 언어 문자 같이 보이고,
11:33
and it acts like a linguistic script,
284
693260
2000
언어 문자 같이 움직이는 것을 보면
11:35
then perhaps we may have a linguistic script on our hands.
285
695260
3000
정말로 언어 문자일 가능성이 높지요.
11:38
What other evidence is there
286
698260
2000
인더스 문자가 실제로 언어를 적을 수
11:40
that the script could actually encode language?
287
700260
2000
있다는 다른 증거는 무엇일까요?
11:42
Well linguistic scripts can actually encode multiple languages.
288
702260
3000
언어 문자들은 여러개의 언어를 적을 수 있는데요.
11:45
So for example, here's the same sentence written in English
289
705260
3000
예를들면, 이것은 똑 같은 알파벳을 사용해서
11:48
and the same sentence written in Dutch
290
708260
2000
똑 같은 문장을 영어와
11:50
using the same letters of the alphabet.
291
710260
2000
홀랜드어로 적은 것입니다.
11:52
If you don't know Dutch and you only know English
292
712260
3000
여러분이 영어만 알고 홀랜드어를 모른다고 가정할 때
11:55
and I give you some words in Dutch,
293
715260
2000
제가 홀랜드어 단어를 몇개 보여드리면
11:57
you'll tell me that these words contain
294
717260
2000
여러분은 그 단어들에 매우 이상한
11:59
some very unusual patterns.
295
719260
2000
패턴이 있다고 말하시겠지요.
12:01
Some things are not right,
296
721260
2000
여러분은 그 단어가 이상하다며
12:03
and you'll say these words are probably not English words.
297
723260
3000
아마 영어가 아닌것 같다고 하겠죠.
12:06
The same thing happens in the case of the Indus script.
298
726260
2000
인더스 문자의 경우에도 똑 같은 일이 벌어집니다.
12:08
The computer found several texts --
299
728260
2000
컴퓨터는 여기 보이는 두 문자와 같이
12:10
two of them are shown here --
300
730260
2000
매우 이상한 패턴을 가진
12:12
that have very unusual patterns.
301
732260
2000
여러개의 문자를 발견했습니다.
12:14
So for example the first text:
302
734260
2000
예를들면, 첫 문자에는 항아리 비슷하게
12:16
there's a doubling of this jar-shaped sign.
303
736260
3000
보이는 형상이 두번 연달아 나오는데요.
12:19
This sign is the most frequently-occurring sign
304
739260
2000
이 형상은 인더스 문자에서
12:21
in the Indus script,
305
741260
2000
가장 자주 사용되는 형상인데
12:23
and it's only in this text
306
743260
2000
이 텍스트에서만
12:25
that it occurs as a doubling pair.
307
745260
2000
두번 연달아 나옵니다.
12:27
Why is that the case?
308
747260
2000
왜 그럴까요?
12:29
We went back and looked at where these particular texts were found,
309
749260
3000
그래서 그 문자들이 어디서 발견됐는지 조사한 결과
12:32
and it turns out that they were found
310
752260
2000
그것이 인더스 밸리에서 아주 아주
12:34
very, very far away from the Indus Valley.
311
754260
2000
먼 곳에서 나왔다는 것을 알았습니다.
12:36
They were found in present day Iraq and Iran.
312
756260
3000
현재의 이라크와 이란에서 발견된 것이었지요.
12:39
And why were they found there?
313
759260
2000
그런데 왜 거기서 발견되었을까요?
12:41
What I haven't told you is that
314
761260
2000
제가 아직 말씀드리지는 않았지만
12:43
the Indus people were very, very enterprising.
315
763260
2000
인더스 사람들은 상인으로 유명했었지요.
12:45
They used to trade with people pretty far away from where they lived,
316
765260
3000
그들은 먼 낮선곳까지 가서 장사를 하곤 했습니다.
12:48
and so in this case, they were traveling by sea
317
768260
3000
그들은 바다를 건너서 오늘날의
12:51
all the way to Mesopotamia, present-day Iraq.
318
771260
3000
이라크인 메소포타미아까지 갔지요.
12:54
And what seems to have happened here
319
774260
2000
저희들은 인더스 상인들이
12:56
is that the Indus traders, the merchants,
320
776260
3000
인더스 문자를 사용해서
12:59
were using this script to write a foreign language.
321
779260
3000
외국어를 적다고 생각합니다.
13:02
It's just like our English and Dutch example.
322
782260
2000
방금 말씀드린 홀랜드 단어처럼 말입니다.
13:04
And that would explain why we have these strange patterns
323
784260
2000
아마 그래서 이 문자들의 패턴이
13:06
that are very different from the kinds of patterns you see in the text
324
786260
3000
인더스 밸리에서 나오는 문자들의 패턴과
13:09
that are found within the Indus Valley.
325
789260
3000
매우 다른지 모릅니다.
13:12
This suggests that the same script, the Indus script,
326
792260
2000
이것은 인더스 문자로 다른 언어들을
13:14
could be used to write different languages.
327
794260
3000
쓸 수 있다는 것을 암시해 줍니다.
13:17
The results we have so far seem to point to the conclusion
328
797260
3000
지금까지 저희들이 연구한 결과에 의하면
13:20
that the Indus script probably does represent language.
329
800260
3000
인더스 문자가 언어일 가능성이 많습니다.
13:23
If it does represent language,
330
803260
2000
만약에 그것이 언어라면
13:25
then how do we read the symbols?
331
805260
2000
그 형상들을 어떻게 읽어야 할까요?
13:27
That's our next big challenge.
332
807260
2000
그것이 앞으로 우리에게 남은 과제입니다.
13:29
So you'll notice that many of the symbols
333
809260
2000
여러분은 인더스어의 많은 형상들이 사람, 곤충,
13:31
look like pictures of humans, of insects,
334
811260
2000
물고기 또는 새의 그림처럼 보인다고
13:33
of fishes, of birds.
335
813260
3000
생각하실 것입니다.
13:36
Most ancient scripts
336
816260
2000
대부분의 고대 문자는
13:38
use the rebus principle,
337
818260
2000
그림을 사용하여 단어를
13:40
which is, using pictures to represent words.
338
820260
3000
나타내는 '리부스' 방식을 사용하는데요.
13:43
So as an example, here's a word.
339
823260
3000
예를들면, 여기 단어가 하나 있습니다.
13:46
Can you write it using pictures?
340
826260
2000
그림을 사용해서 이 단어를 쓸 수 있을까요?
13:48
I'll give you a couple seconds.
341
828260
2000
잠시 생각하실 시간을 드리죠.
13:50
Got it?
342
830260
2000
됐습니까?
13:52
Okay. Great.
343
832260
2000
좋아요.
13:54
Here's my solution.
344
834260
2000
이건 제 방법입니다.
13:56
You could use the picture of a bee followed by a picture of a leaf --
345
836260
2000
우선 꿀벌(bee) 그림을 그리고 그 옆에 잎(leaf)를 그리면
13:58
and that's "belief," right.
346
838260
2000
"belief" 라는 단어가 되겠지요.
14:00
There could be other solutions.
347
840260
2000
다른 방법도 있을 겁니다.
14:02
In the case of the Indus script,
348
842260
2000
그런데 인더스 문자의 경우
14:04
the problem is the reverse.
349
844260
2000
문제가 정반대입니다.
14:06
You have to figure out the sounds of each of these pictures
350
846260
3000
즉, 이들 그림 하나 하나의 소리를 알아야
14:09
such that the entire sequence makes sense.
351
849260
2000
그 그림들의 의미를 알 수 있으니까요.
14:11
So this is just like a crossword puzzle,
352
851260
3000
이 퍼즐을 풀면 그 댓가가 엄청나기 때문에
14:14
except that this is the mother of all crossword puzzles
353
854260
3000
이것은 마치 전세계에서 가장 거창한
14:17
because the stakes are so high if you solve it.
354
857260
4000
크로스워드 퍼즐을 푸는 것과 마찬가지입니다.
14:21
My colleagues, Iravatham Mahadevan and Asko Parpola,
355
861260
3000
저의 동료인 이라바탐 마하에반과 아스코 파폴라는 특히
14:24
have been making some headway on this particular problem.
356
864260
2000
이 문제를 해결하는데에 상당한 성과를 거두었습니다.
14:26
And I'd like to give you a quick example of Parpola's work.
357
866260
2000
파폴라가 하고 있는 일의 간단한 일례를 말씀드리지요.
14:28
Here's a really short text.
358
868260
2000
여기에 아주 짧은 문장이 있는데요.
14:30
It contains seven vertical strokes followed by this fish-like sign.
359
870260
3000
일곱개의 수직선이 있고 그 옆에 물고기 같은 형상이 있지요.
14:33
And I want to mention that these seals were used
360
873260
2000
그런데 이 인장들은 운송되는 짐꾸리에
14:35
for stamping clay tags
361
875260
2000
부착되었던 진흙 태그에
14:37
that were attached to bundles of goods,
362
877260
2000
인장을 찍는 목적으로 사용되었기 때문에
14:39
so it's quite likely that these tags, at least some of them,
363
879260
3000
상인들의 이름이 최소한 몇개는 새겨져 있을
14:42
contain names of merchants.
364
882260
2000
가능성이 높습니다.
14:44
And it turns out that in India
365
884260
2000
그런데 인도에는 아기들이
14:46
there's a long tradition
366
886260
2000
태어난 시간에 관련된
14:48
of names being based on horoscopes
367
888260
2000
점성술과 별자리에 따라
14:50
and star constellations present at the time of birth.
368
890260
3000
이름을 지어주는 오랜 전통이 있지요.
14:53
In Dravidian languages,
369
893260
2000
드라비디아 언어에서 물고기는
14:55
the word for fish is "meen"
370
895260
2000
"미인" 이라고 발음하는데
14:57
which happens to sound just like the word for star.
371
897260
3000
그것은 별이라는 단어의 발음과 비슷합니다.
15:00
And so seven stars
372
900260
2000
그러니까 7개의 별은 "엘루 미인"이라는
15:02
would stand for "elu meen,"
373
902260
2000
발음을 적은것 이라고 할 수 있겠는데
15:04
which is the Dravidian word
374
904260
2000
"엘루 미인"은 드라비디아 말로
15:06
for the Big Dipper star constellation.
375
906260
2000
북두칠성을 의미하지요.
15:08
Similarly, there's another sequence of six stars,
376
908260
3000
이와 비슷하게, 6개의 별이 차례로 배열된 것은
15:11
and that translates to "aru meen,"
377
911260
2000
"아루 미인"이라는 발음을 적은 것일텐데
15:13
which is the old Dravidian name
378
913260
2000
이것은 옛 드라비디아말로
15:15
for the star constellation Pleiades.
379
915260
2000
묘성(昴星)을 의미하지요.
15:17
And finally, there's other combinations,
380
917260
3000
그리고 마지막으로, 이것처럼 물고기 위에
15:20
such as this fish sign with something that looks like a roof on top of it.
381
920260
3000
지붕같은 것이 있는 다른 배합의 글자들도 있는데요.
15:23
And that could be translated into "mey meen,"
382
923260
3000
이것은 아마 "메이 미인"이라고 읽을 수 있겠는데
15:26
which is the old Dravidian name for the planet Saturn.
383
926260
3000
그것은 옛 드라비디아 언어로 토성을 의미합니다.
15:29
So that was pretty exciting.
384
929260
2000
우리는 우리의 연구가 좋은 결과를 가지는것
15:31
It looks like we're getting somewhere.
385
931260
2000
같아서 매우 기쁘게 생각하고 있습니다.
15:33
But does this prove
386
933260
2000
그런데, 우리의 연구가 인더스 인장에
15:35
that these seals contain Dravidian names
387
935260
2000
드라비디아 언어로 적힌 별자리와 행성의 이름이
15:37
based on planets and star constellations?
388
937260
2000
새겨져 있다는 것을 증명할 수 있을까요?
15:39
Well not yet.
389
939260
2000
아직은 아닙니다.
15:41
So we have no way of validating
390
941260
2000
아직은 이런 식의 해독법을
15:43
these particular readings,
391
943260
2000
입증할 방법은 없지만,
15:45
but if more and more of these readings start making sense,
392
945260
3000
더 많은 텍스트를 읽을 수 있고 또한 더 긴 텍스트도
15:48
and if longer and longer sequences
393
948260
2000
이런식으로 읽을 수 있으면
15:50
appear to be correct,
394
950260
2000
우리의 방식에 대한
15:52
then we know that we are on the right track.
395
952260
2000
신뢰도가 더 높아지겠지요.
15:54
Today,
396
954260
2000
우리는 지금
15:56
we can write a word such as TED
397
956260
3000
TED 같은 단어를 이집트 상형문자 또는
15:59
in Egyptian hieroglyphics and in cuneiform script,
398
959260
3000
설형문자로 쓸 수 있습니다.
16:02
because both of these were deciphered
399
962260
2000
이런 문자들의 해독방법을 19세기에
16:04
in the 19th century.
400
964260
2000
이미 알아냈기 때문이죠.
16:06
The decipherment of these two scripts
401
966260
2000
우리는 이들 문자를 해독함으로써
16:08
enabled these civilizations to speak to us again directly.
402
968260
3000
이 고대 문명들과 직접적으로 대화할 수 있게 되었습니다.
16:11
The Mayans
403
971260
2000
마야 문명은 20세기 부터
16:13
started speaking to us in the 20th century,
404
973260
2000
우리에게 이야기를 하기 시작했지만
16:15
but the Indus civilization remains silent.
405
975260
3000
인더스 문명은 아직도 침묵을 지키고 있습니다.
16:18
Why should we care?
406
978260
2000
그런데 그게 우리와 무슨 상관이 있나요?
16:20
The Indus civilization does not belong
407
980260
2000
인더스 문명은 오로지 남부 인도인이나
16:22
to just the South Indians or the North Indians
408
982260
2000
북부 인도사람이나 또는 파키스탄
16:24
or the Pakistanis;
409
984260
2000
사람들에게만 속하는 것이 아니고
16:26
it belongs to all of us.
410
986260
2000
우리 모두에 속합니다.
16:28
These are our ancestors --
411
988260
2000
이들은 저와 여러분들의
16:30
yours and mine.
412
990260
2000
조상입니다.
16:32
They were silenced
413
992260
2000
인더스 유물들은
16:34
by an unfortunate accident of history.
414
994260
2000
불행한 역사의 사고로 침묵을 지켜야 했습니다.
16:36
If we decipher the script,
415
996260
2000
우리가 인더스 문자를 해독할 수 있으면
16:38
we would enable them to speak to us again.
416
998260
2000
우리는 다시 그들의 목소리를 들을 수 있겠지요.
16:40
What would they tell us?
417
1000260
3000
그들은 우리에게 무슨 말을 할까요?
16:43
What would we find out about them? About us?
418
1003260
3000
우리는 그들과 우리 자신에 대한 무엇을 발견하게 될까요?
16:46
I can't wait to find out.
419
1006260
3000
저는 인더스어를 읽을 수 있는 날이 빨리 오기를 고대합니다.
16:49
Thank you.
420
1009260
2000
감사합니다.
16:51
(Applause)
421
1011260
4000
(박수)
이 웹사이트 정보

이 사이트는 영어 학습에 유용한 YouTube 동영상을 소개합니다. 전 세계 최고의 선생님들이 가르치는 영어 수업을 보게 될 것입니다. 각 동영상 페이지에 표시되는 영어 자막을 더블 클릭하면 그곳에서 동영상이 재생됩니다. 비디오 재생에 맞춰 자막이 스크롤됩니다. 의견이나 요청이 있는 경우 이 문의 양식을 사용하여 문의하십시오.

https://forms.gle/WvT1wiN1qDtmnspy7