Rajesh Rao: Computing a Rosetta Stone for the Indus script

Rajesh Rao: Une Pierre de Rosette pour l'écriture de l'Indus

1,210,240 views

2011-06-28 ・ TED


New videos

Rajesh Rao: Computing a Rosetta Stone for the Indus script

Rajesh Rao: Une Pierre de Rosette pour l'écriture de l'Indus

1,210,240 views ・ 2011-06-28

TED


Veuillez double-cliquer sur les sous-titres anglais ci-dessous pour lire la vidéo.

Traducteur: Tony Sanchez Relecteur: Joel Bomane
00:15
I'd like to begin with a thought experiment.
0
15260
3000
J'aimerais commencer avec une expérience mentale.
00:19
Imagine that it's 4,000 years into the future.
1
19260
3000
Imaginez que nous sommes 4000 ans dans l'avenir.
00:22
Civilization as we know it
2
22260
2000
La civilisation telle que nous la connaissons
00:24
has ceased to exist --
3
24260
2000
a cessée d'être --
00:26
no books,
4
26260
2000
pas de livres,
00:28
no electronic devices,
5
28260
3000
pas d'appareils électroniques,
00:31
no Facebook or Twitter.
6
31260
3000
pas de Facebook ou de Twitter.
00:34
All knowledge of the English language and the English alphabet
7
34260
3000
Toutes connaissances de la langue Anglaise et de son alphabet
00:37
has been lost.
8
37260
2000
sont perdues.
00:39
Now imagine archeologists
9
39260
2000
Imaginez maintenant les archéologues
00:41
digging through the rubble of one of our cities.
10
41260
2000
excavant les ruines de l'une de nos villes.
00:43
What might they find?
11
43260
2000
Que pourraient-ils trouver?
00:45
Well perhaps some rectangular pieces of plastic
12
45260
3000
Et bien peut être quelques morceaux de plastique rectangulaires
00:48
with strange symbols on them.
13
48260
3000
contenant d'étranges symboles.
00:51
Perhaps some circular pieces of metal.
14
51260
3000
Peut-être quelques morceaux de métal de formes circulaires.
00:54
Maybe some cylindrical containers
15
54260
2000
Peut-être quelques récipients de forme cylindrique
00:56
with some symbols on them.
16
56260
2000
arborant certains symboles.
00:58
And perhaps one archeologist becomes an instant celebrity
17
58260
3000
Et peut-être qu'une archéologue devient une célébrité instantanée
01:01
when she discovers --
18
61260
2000
lorsqu'elle découvre --
01:03
buried in the hills somewhere in North America --
19
63260
2000
enfouit dans des collines quelque-part en Amérique du Nord --
01:05
massive versions of these same symbols.
20
65260
3000
des versions massives de ces mêmes symboles.
01:10
Now let's ask ourselves,
21
70260
2000
Alors demandons-nous,
01:12
what could such artifacts say about us
22
72260
3000
que peuvent dirent de tels objets sur nous
01:15
to people 4,000 years into the future?
23
75260
3000
aux personnes qui vivront dans 4000 ans?
01:18
This is no hypothetical question.
24
78260
2000
Ceci n'est pas une question hypothétique.
01:20
In fact, this is exactly the kind of question we're faced with
25
80260
3000
En fait, c'est exactement le type de question auquel nous sommes confrontés
01:23
when we try to understand the Indus Valley civilization,
26
83260
3000
lorsque nous essayons de comprendre la civilisation de la Vallée de l'Indus,
01:26
which existed 4,000 years ago.
27
86260
2000
qui exista il y a 4000 ans.
01:28
The Indus civilization was roughly contemporaneous
28
88260
3000
La civilisation de l'Indus était plus où moins contemporaine
01:31
with the much better known Egyptian and the Mesopotamian civilizations,
29
91260
3000
avec les civilisations bien mieux connues d'Egypte et de Mésopotamie,
01:34
but it was actually much larger than either of these two civilizations.
30
94260
3000
mais était en fait bien plus grande que ces deux civilisations.
01:37
It occupied the area
31
97260
2000
Elle s’étendait sur une aire
01:39
of approximately one million square kilometers,
32
99260
2000
approximative de un million de kilomètres carrés,
01:41
covering what is now Pakistan,
33
101260
2000
recouvrant ce qui est maintenant Pakistan,
01:43
Northwestern India
34
103260
2000
le Nord-Ouest de l'Inde
01:45
and parts of Afghanistan and Iran.
35
105260
2000
et parties de l'Afghanistan et de l'Iran.
01:47
Given that it was such a vast civilization,
36
107260
2000
Compte tenue qu'il s'agissait d'une civilisation si vaste
01:49
you might expect to find really powerful rulers, kings,
37
109260
4000
vous pourriez espérer trouver de très puissants dirigeants, des rois,
01:53
and huge monuments glorifying these powerful kings.
38
113260
3000
et d'énormes monuments glorifiants ces rois tout puissants.
01:56
In fact,
39
116260
2000
En fait,
01:58
what archeologists have found is none of that.
40
118260
2000
les archéologues ne trouvèrent rien de tout cela.
02:00
They've found small objects such as these.
41
120260
3000
Ils trouvèrent de petits objets comme ceux-ci.
02:03
Here's an example of one of these objects.
42
123260
3000
Voici l'exemple d'un de ces objets.
02:06
Well obviously this is a replica.
43
126260
2000
Bien-évidemment ceci est une réplique.
02:08
But who is this person?
44
128260
3000
Mais qui est cette personne?
02:11
A king? A god?
45
131260
2000
Un roi? Un dieu?
02:13
A priest?
46
133260
2000
Un prêtre?
02:15
Or perhaps an ordinary person
47
135260
2000
Ou peut-être une personne ordinaire
02:17
like you or me?
48
137260
2000
comme vous et moi?
02:19
We don't know.
49
139260
2000
Nous l'ignorons.
02:21
But the Indus people also left behind artifacts with writing on them.
50
141260
3000
Mais le peuple indusien a aussi laissé des objets avec de l'écriture dessus.
02:24
Well no, not pieces of plastic,
51
144260
2000
Enfin non, pas des morceaux de plastique,
02:26
but stone seals, copper tablets,
52
146260
3000
mais des cachets en pierre, des tablettes de cuivre,
02:29
pottery and, surprisingly,
53
149260
2000
de la poterie et, étonnamment,
02:31
one large sign board,
54
151260
2000
un grand panneau,
02:33
which was found buried near the gate of a city.
55
153260
2000
Lequel fut trouvé enterré près de la porte d'une ville.
02:35
Now we don't know if it says Hollywood,
56
155260
2000
Nous ignorons s'il dit Hollywood,
02:37
or even Bollywood for that matter.
57
157260
2000
ou même Bollywood dans ce cas là.
02:39
In fact, we don't even know
58
159260
2000
En fait, nous ignorons
02:41
what any of these objects say,
59
161260
2000
la signification de n'importe lequel de ces objets.
02:43
and that's because the Indus script is undeciphered.
60
163260
3000
Et cela parce-que l'écriture Indus reste indéchiffrer.
02:46
We don't know what any of these symbols mean.
61
166260
2000
Nous ignorons ce que tous ces symboles signifient.
02:48
The symbols are most commonly found on seals.
62
168260
3000
Les symboles sont le plus souvent trouvés sur les cachets.
02:51
So you see up there one such object.
63
171260
2000
Vous voyez là un de ces objets.
02:53
It's the square object with the unicorn-like animal on it.
64
173260
3000
C'est l'objet carré avec une sorte de licorne dessus.
02:56
Now that's a magnificent piece of art.
65
176260
2000
Voilà une oeuvre d'art magnifique .
02:58
So how big do you think that is?
66
178260
2000
Alors, quelle taille pensez-vous que ça a?
03:00
Perhaps that big?
67
180260
2000
Grand comme ça?
03:02
Or maybe that big?
68
182260
2000
Ou peut être comme ça?
03:04
Well let me show you.
69
184260
2000
Et bien laissez moi vous montrer.
03:07
Here's a replica of one such seal.
70
187260
3000
Voici la réplique d'un tel cachet.
03:10
It's only about one inch by one inch in size --
71
190260
2000
Ce n'est que de 2,5cm sur 2,5cm de taille
03:12
pretty tiny.
72
192260
2000
assez petit.
03:14
So what were these used for?
73
194260
2000
Alors à quoi servaient ils?
03:16
We know that these were used for stamping clay tags
74
196260
3000
Nous savons que ceux-ci ont été utilisés pour cacheter des étiquettes d'argile
03:19
that were attached to bundles of goods that were sent from one place to the other.
75
199260
3000
attachées aux paquets de biens qui étaient envoyés d'un lieu à l'autre.
03:22
So you know those packing slips you get on your FedEx boxes?
76
202260
3000
Vous savez ces bordereaux sur vos boîtes FedEx?
03:25
These were used to make those kinds of packing slips.
77
205260
3000
Ceux-ci furent utilisés pour faire ce type de bordereaux.
03:28
You might wonder what these objects contain
78
208260
3000
Vous pourriez vous demander ce que ces objets contiennent
03:31
in terms of their text.
79
211260
2000
en termes de texte.
03:33
Perhaps they're the name of the sender
80
213260
2000
Peut être portent-ils le nom de l'expediteur
03:35
or some information about the goods
81
215260
2000
ou des informations sur les biens
03:37
that are being sent from one place to the other -- we don't know.
82
217260
3000
envoyés d'une part à l'autre -- nous l'ignorons.
03:40
We need to decipher the script to answer that question.
83
220260
2000
Nous devons déchiffrer l'écriture pour répondre a cette question.
03:42
Deciphering the script
84
222260
2000
Déchiffrer l'écriture
03:44
is not just an intellectual puzzle;
85
224260
2000
n'est pas qu'un puzzle intellectuel;
03:46
it's actually become a question
86
226260
2000
en fait c'est devenue une question
03:48
that's become deeply intertwined
87
228260
2000
qui devient profondément entrelacée
03:50
with the politics and the cultural history of South Asia.
88
230260
3000
avec la politique et l'histoire culturelle de l'Asie du sud.
03:53
In fact, the script has become a battleground of sorts
89
233260
3000
En fait, l'écriture est devenue une espèce de champ de bataille
03:56
between three different groups of people.
90
236260
2000
entre trois différents groupes de personnes.
03:58
First, there's a group of people
91
238260
2000
Premièrement, il y a un groupe de personnes
04:00
who are very passionate in their belief
92
240260
2000
qui est très passionné par leur conviction
04:02
that the Indus script
93
242260
2000
que l'écriture de l'Indus
04:04
does not represent a language at all.
94
244260
2000
ne représente pas une langue du tout.
04:06
These people believe that the symbols
95
246260
2000
Ces personnes croient que les symboles
04:08
are very similar to the kind of symbols you find on traffic signs
96
248260
3000
sont très similaires aux types de signes que l'on trouve sur les panneaux de circulation
04:11
or the emblems you find on shields.
97
251260
3000
ou les emblèmes que l'on trouve sur les boucliers.
04:14
There's a second group of people
98
254260
2000
Il y a un deuxième groupe de personnes
04:16
who believe that the Indus script represents an Indo-European language.
99
256260
3000
qui croit que l'écriture Indus représente une langue indo-européenne.
04:19
If you look at a map of India today,
100
259260
2000
si vous regardez une carte de l'Inde aujourd'hui,
04:21
you'll see that most of the languages spoken in North India
101
261260
3000
vous verrez que la plupart des langues parlées dans l'Inde du nord
04:24
belong to the Indo-European language family.
102
264260
3000
appartiennent à la famille de langues indo-européennes.
04:27
So some people believe that the Indus script
103
267260
2000
Donc certains croient que l'écriture Indus
04:29
represents an ancient Indo-European language such as Sanskrit.
104
269260
3000
représente une ancienne langue Indo-Européenne tel que le Sanscrit.
04:32
There's a last group of people
105
272260
2000
Il y a un dernier groupe de personnes
04:34
who believe that the Indus people
106
274260
3000
qui croit que le peuple de l'Indus
04:37
were the ancestors of people living in South India today.
107
277260
3000
étaient les ancêtres des gens qui habitent l'Inde du sud aujourd'hui.
04:40
These people believe that the Indus script
108
280260
2000
Ces personnes croient que l'écriture Indus
04:42
represents an ancient form
109
282260
2000
represente une forme ancienne
04:44
of the Dravidian language family,
110
284260
2000
de la famille des langues dravidiennes,
04:46
which is the language family spoken in much of South India today.
111
286260
3000
qui est la famille de langue la plus parlée dans le sud de l'Inde aujourd'hui.
04:49
And the proponents of this theory
112
289260
2000
Et les partisans de cette théorie
04:51
point to that small pocket of Dravidian-speaking people in the North,
113
291260
3000
indiquent cette poignée de personnes parlant Dravidien dans le Nord,
04:54
actually near Afghanistan,
114
294260
2000
près de l'Afghanistan,
04:56
and they say that perhaps, sometime in the past,
115
296260
3000
et ils disent que peut-être, à un moment dans le passé,
04:59
Dravidian languages were spoken all over India
116
299260
3000
les langues Dravidiennes furent parlées dans l'Inde toute entière
05:02
and that this suggests
117
302260
2000
et que cela suggère
05:04
that the Indus civilization is perhaps also Dravidian.
118
304260
3000
que la civilisation Indus est peut-être également Dravidienne.
05:07
Which of these hypotheses can be true?
119
307260
3000
Laquelle de ces hypothèses peut-elle s’avérer vraie?
05:10
We don't know, but perhaps if you deciphered the script,
120
310260
2000
Nous l'ignorons, mais peut être que si vous déchiffrez l'écriture,
05:12
you would be able to answer this question.
121
312260
2000
vous pourriez être capable de répondre à cette question.
05:14
But deciphering the script is a very challenging task.
122
314260
2000
Mais déchiffrer l'écriture est une tâche très difficile.
05:16
First, there's no Rosetta Stone.
123
316260
2000
Premièrement, pas de Pierre de Rosette.
05:18
I don't mean the software;
124
318260
2000
Je ne parle pas du logiciel;
05:20
I mean an ancient artifact
125
320260
2000
Je parle de l’objet ancien
05:22
that contains in the same text
126
322260
2000
qui contient dans le même texte
05:24
both a known text and an unknown text.
127
324260
3000
À la fois un texte connu et un texte inconnu.
05:27
We don't have such an artifact for the Indus script.
128
327260
3000
Nous ne possédons pas de tel un objet pour l'écriture Indus.
05:30
And furthermore, we don't even know what language they spoke.
129
330260
3000
De plus, nous ne savons même pas quelle langue ils parlaient.
05:33
And to make matters even worse,
130
333260
2000
Et pour empirer les choses,
05:35
most of the text that we have are extremely short.
131
335260
2000
la plupart des textes que nous possédons sont extrêmement courts.
05:37
So as I showed you, they're usually found on these seals
132
337260
2000
Donc, comme je vous ai montré, ils se trouvent normalement sur ces cachets
05:39
that are very, very tiny.
133
339260
2000
qui sont très, très petits.
05:41
And so given these formidable obstacles,
134
341260
2000
Et étant donné ces obstacles formidables,
05:43
one might wonder and worry
135
343260
2000
on pourrait se demander et s'inquiéter
05:45
whether one will ever be able to decipher the Indus script.
136
345260
3000
de savoir si un jour on sera capable de déchiffrer l'écriture Indus.
05:48
In the rest of my talk,
137
348260
2000
Dans le reste de ma présentation,
05:50
I'd like to tell you about how I learned to stop worrying
138
350260
2000
J'aimerais vous raconter comment j'ai appris à cesser de me faire du souci
05:52
and love the challenge posed by the Indus script.
139
352260
2000
et à aimer le défi posé par l'écriture de l'Indus.
05:54
I've always been fascinated by the Indus script
140
354260
3000
J'ai toujours été fasciné par l'écriture de l'Indus
05:57
ever since I read about it in a middle school textbook.
141
357260
2000
depuis le jour où j'ai lu sur le sujet dans un manuel de collège.
05:59
And why was I fascinated?
142
359260
2000
Et pourquoi étais-je fasciné?
06:01
Well it's the last major undeciphered script in the ancient world.
143
361260
4000
Et bien, c'est la dernière écriture majeure non déchiffré de l'ancien monde.
06:05
My career path led me to become a computational neuroscientist,
144
365260
3000
Mon choix de carrière m'a mené à devenir un scientifique en neuroscience computationnelle,
06:08
so in my day job,
145
368260
2000
donc dans mon travail de jour,
06:10
I create computer models of the brain
146
370260
2000
Je crée des modèles informatiques du cerveau
06:12
to try to understand how the brain makes predictions,
147
372260
3000
pour essayer de comprendre comment le cerveau fait des prédictions,
06:15
how the brain makes decisions,
148
375260
2000
comment le cerveau prend des décisions,
06:17
how the brain learns and so on.
149
377260
2000
Comment le cerveau apprend et ainsi de suite.
06:19
But in 2007, my path crossed again with the Indus script.
150
379260
3000
Mais en 2007, mon chemin a encore croisé celui de l'écriture de l'Indus.
06:22
That's when I was in India,
151
382260
2000
C'était quand je trouvais en Inde,
06:24
and I had the wonderful opportunity
152
384260
2000
et j'ai eu la merveilleuse occasion
06:26
to meet with some Indian scientists
153
386260
2000
de rencontrer certains scientifiques indiens
06:28
who were using computer models to try to analyze the script.
154
388260
3000
qui utilisaient des modèles informatiques pour essayer d'analyser l'écriture.
06:31
And so it was then that I realized
155
391260
2000
Et c'est alors que je me suis rendu compte
06:33
there was an opportunity for me to collaborate with these scientists,
156
393260
3000
de l'occasion pour moi de collaborer avec ces scientifiques,
06:36
and so I jumped at that opportunity.
157
396260
2000
j'ai donc sauté sur cette occasion.
06:38
And I'd like to describe some of the results that we have found.
158
398260
2000
Et j'aimerais décrire certains des résultats que nous avons trouvé.
06:40
Or better yet, let's all collectively decipher.
159
400260
3000
Ou encore mieux, déchiffrons les tous ensemble.
06:43
Are you ready?
160
403260
2000
Êtes vous prêts?
06:45
The first thing that you need to do when you have an undeciphered script
161
405260
3000
La première chose à faire quand vous avez une écriture non déchiffrée
06:48
is try to figure out the direction of writing.
162
408260
2000
est de trouver la direction d'écriture.
06:50
Here are two texts that contain some symbols on them.
163
410260
3000
Voici deux textes contenants quelques symboles.
06:53
Can you tell me
164
413260
2000
Pouvez-vous me dire
06:55
if the direction of writing is right to left or left to right?
165
415260
3000
si la direction d'écriture est de droite à gauche ou de gauche a droite?
06:58
I'll give you a couple of seconds.
166
418260
3000
je vous donnes quelques secondes.
07:01
Okay. Right to left, how many? Okay.
167
421260
3000
Bien. Droite à gauche, combien? Bien.
07:04
Okay. Left to right?
168
424260
2000
Gauche à droite?
07:06
Oh, it's almost 50/50. Okay.
169
426260
2000
C'est presque 50/50. Bien.
07:08
The answer is:
170
428260
2000
La réponse est:
07:10
if you look at the left-hand side of the two texts,
171
430260
2000
si vous regardez sur la gauche des deux textes,
07:12
you'll notice that there's a cramping of signs,
172
432260
3000
vous remarquerez qu'il y a un resserrement des signes,
07:15
and it seems like 4,000 years ago,
173
435260
2000
et il semble qu' il y a 4.000 ans,
07:17
when the scribe was writing from right to left,
174
437260
2000
quand le scribe écrivait de la droite vers la gauche,
07:19
they ran out of space.
175
439260
2000
Ils ont manqué de place.
07:21
And so they had to cram the sign.
176
441260
2000
Et donc ils ont dû entasser le signe.
07:23
One of the signs is also below the text on the top.
177
443260
2000
L'un des signes est aussi sous le texte du haut.
07:25
This suggests the direction of writing
178
445260
2000
Ceci suggère que la direction d'écriture
07:27
was probably from right to left,
179
447260
2000
était probablement de droite à gauche.
07:29
and so that's one of the first things we know,
180
449260
2000
Et donc c'est l'une des premières choses que nous savons,
07:31
that directionality is a very key aspect of linguistic scripts.
181
451260
3000
que la directionnalité est un aspect clé des écritures linguistiques.
07:34
And the Indus script now has
182
454260
2000
Et l'écriture de l'Indus a maintenant
07:36
this particular property.
183
456260
2000
cette propriété particulière.
07:38
What other properties of language does the script show?
184
458260
2000
Quelles autres propriétés de la langue l'écriture montre-t-elle ?
07:40
Languages contain patterns.
185
460260
2000
Les langues contiennent des motifs.
07:42
If I give you the letter Q
186
462260
2000
Si je vous donnes la lettre Q
07:44
and ask you to predict the next letter, what do you think that would be?
187
464260
3000
et vous demande de prédire la lettre suivante, que pensez-vous qu'elle sera?
07:47
Most of you said U, which is right.
188
467260
2000
La plupart d'entre vous avez dit U, qui est correct.
07:49
Now if I asked you to predict one more letter,
189
469260
2000
Maintenant si je vous demandais de prédire une lettre de plus,
07:51
what do you think that would be?
190
471260
2000
Laquelle pensez-vous que ça serait ?
07:53
Now there's several thoughts. There's E. It could be I. It could be A,
191
473260
3000
Maintenant il y a plusieurs pensées. Il y a E. Ça pourrait être I. Ça pourrait être A,
07:56
but certainly not B, C or D, right?
192
476260
3000
Mais certainement pas B, C ou D, certe?
07:59
The Indus script also exhibits similar kinds of patterns.
193
479260
3000
L'écriture de l'Indus expose aussi des types similaires de motifs.
08:02
There's a lot of text that start with this diamond-shaped symbol.
194
482260
3000
Il y a beaucoup de textes qui commencent avec ce symbole en forme de diamant.
08:05
And this in turn tends to be followed
195
485260
2000
Et ceci en retour a tendance à être suivi
08:07
by this quotation marks-like symbol.
196
487260
2000
par ce symbole en forme de guillemet.
08:09
And this is very similar to a Q and U example.
197
489260
2000
Et ceci est très similaire à un exemple de Q et U.
08:11
This symbol can in turn be followed
198
491260
2000
Ce symbole peut à son tour être suivi
08:13
by these fish-like symbols and some other signs,
199
493260
3000
par ces symboles en forme de poisson et quelques autres signes,
08:16
but never by these other signs at the bottom.
200
496260
2000
mais jamais par ces autres signes en bas.
08:18
And furthermore, there's some signs
201
498260
2000
Et de plus, il y a quelques signes
08:20
that really prefer the end of texts,
202
500260
2000
qui préfèrent vraiment la fin des textes,
08:22
such as this jar-shaped sign,
203
502260
2000
comme ce signe en forme de pot.
08:24
and this sign, in fact, happens to be
204
504260
2000
Et ce signe, en fait, se trouve être
08:26
the most frequently occurring sign in the script.
205
506260
2000
le signe le plus fréquemment rencontré dans l'écriture.
08:28
Given such patterns, here was our idea.
206
508260
3000
Compte tenu de tels modèles, voici notre idée.
08:31
The idea was to use a computer
207
511260
2000
L'idée était d'utiliser un ordinateur
08:33
to learn these patterns,
208
513260
2000
pour apprendre ces modèles,
08:35
and so we gave the computer the existing texts.
209
515260
3000
et donc nous avons donné les textes actuels à l'ordinateur.
08:38
And the computer learned a statistical model
210
518260
2000
Et l'ordinateur a appris un modèle statistique
08:40
of which symbols tend to occur together
211
520260
2000
des symboles ayant tendance à apparaître ensemble
08:42
and which symbols tend to follow each other.
212
522260
2000
et des symboles ayant tendance à se suivre.
08:44
Given the computer model,
213
524260
2000
Compte tenu du modèle informatique,
08:46
we can test the model by essentially quizzing it.
214
526260
3000
Nous pouvons essayer le modèle essentiellement en l'interrogeant .
08:49
So we could deliberately erase some symbols,
215
529260
2000
Donc nous pourrions volontairement effacer quelques symboles,
08:51
and we can ask it to predict the missing symbols.
216
531260
3000
et nous pouvons lui demander de prédire les symboles manquants.
08:54
Here are some examples.
217
534260
3000
Voici quelques exemples.
09:00
You may regard this
218
540260
2000
Vous pouvez considérer ceci
09:02
as perhaps the most ancient game
219
542260
2000
comme peut-être le jeu le plus ancien
09:04
of Wheel of Fortune.
220
544260
3000
de la Roue de la Fortune.
09:08
What we found
221
548260
2000
Ce qu'on a trouvé
09:10
was that the computer was successful in 75 percent of the cases
222
550260
2000
c'était que l'ordinateur réussissait dans 75% des cas
09:12
in predicting the correct symbol.
223
552260
2000
à prédire le symbole correcte.
09:14
In the rest of the cases,
224
554260
2000
Dans le reste des cas,
09:16
typically the second best guess or third best guess was the right answer.
225
556260
3000
en général la seconde meilleure supposition ou la troisième était la bonne réponse.
09:19
There's also practical use
226
559260
2000
Il y a aussi un usage pratique
09:21
for this particular procedure.
227
561260
2000
à cette procédure particulière.
09:23
There's a lot of these texts that are damaged.
228
563260
2000
Beaucoup de ces textes sont endommagés.
09:25
Here's an example of one such text.
229
565260
2000
Voici l'exemple d'un tel texte.
09:27
And we can use the computer model now to try to complete this text
230
567260
3000
Et nous pouvons maintenant utiliser le modèle informatique pour tenter de compléter ce texte
09:30
and make a best guess prediction.
231
570260
2000
et faire la meilleure prédiction possible.
09:32
Here's an example of a symbol that was predicted.
232
572260
3000
Voici un exemple d'un symbole qui a été prédit.
09:35
And this could be really useful as we try to decipher the script
233
575260
2000
Et ceci pourrait être vraiment utile alors que nous essayons de déchiffrer l'écriture.
09:37
by generating more data that we can analyze.
234
577260
3000
en générant plus de données que nous ne pouvons analyser.
09:40
Now here's one other thing you can do with the computer model.
235
580260
3000
Voici une autre chose que vous pouvez faire avec le modèle informatique.
09:43
So imagine a monkey
236
583260
2000
Alors imaginez un singe
09:45
sitting at a keyboard.
237
585260
2000
assis devant un clavier.
09:47
I think you might get a random jumble of letters that looks like this.
238
587260
3000
Je pense que vous pourriez obtenir un mélange de lettres comme ceci du au hasard.
09:50
Such a random jumble of letters
239
590260
2000
Un tel mélange de lettres
09:52
is said to have a very high entropy.
240
592260
2000
est considéré comme ayant une très forte entropie.
09:54
This is a physics and information theory term.
241
594260
2000
Ceci est un terme de physique et d'information théorique.
09:56
But just imagine it's a really random jumble of letters.
242
596260
3000
Mais imaginer que c'est juste un mélange de lettres.
09:59
How many of you have ever spilled coffee on a keyboard?
243
599260
4000
Combien d'entre vous avez déjà renversé du café sur un clavier ?
10:03
You might have encountered the stuck-key problem --
244
603260
2000
Vous avez peut-être rencontré le problème du clavier enfoncé --
10:05
so basically the same symbol being repeated over and over again.
245
605260
3000
donc fondamentalement le même symbole est répété maintes et maintes fois.
10:08
This kind of a sequence is said to have a very low entropy
246
608260
3000
Ce type de séquence est considéré comme une très basse entropie
10:11
because there's no variation at all.
247
611260
2000
parce-qu'il n'y a pas de variation du tout.
10:13
Language, on the other hand, has an intermediate level of entropy;
248
613260
3000
La langue, en revanche, a un niveau intermédiaire d'entropie ;
10:16
it's neither too rigid,
249
616260
2000
ce n'est ni trop rigide,
10:18
nor is it too random.
250
618260
2000
ni trop mélangé.
10:20
What about the Indus script?
251
620260
2000
Qu'en est il de l’écriture Indus?
10:22
Here's a graph that plots the entropies of a whole bunch of sequences.
252
622260
4000
Voici un graphique qui trace les entropies d'un tas de séquences.
10:26
At the very top you find the uniformly random sequence,
253
626260
2000
Tout en haut vous voyez la séquence uniforme faite au hasard,
10:28
which is a random jumble of letters --
254
628260
2000
qui est un mélange de lettres au hasard --
10:30
and interestingly, we also find
255
630260
2000
et de façon intéressante, nous trouvons aussi
10:32
the DNA sequence from the human genome and instrumental music.
256
632260
3000
la séquence d'ADN du génome humain et de la musique instrumentale.
10:35
And both of these are very, very flexible,
257
635260
2000
Et ceux-ci deux sont très, très flexibles,
10:37
which is why you find them in the very high range.
258
637260
2000
c'est pourquoi vous les trouvez dans la gamme très haute.
10:39
At the lower end of the scale,
259
639260
2000
En bas de l'échelle,
10:41
you find a rigid sequence, a sequence of all A's,
260
641260
2000
vous trouvez une séquence rigide, une séquence de tous les A's,
10:43
and you also find a computer program,
261
643260
2000
et vous trouvez aussi un programme informatique,
10:45
in this case in the language Fortran,
262
645260
2000
dans ce cas le langage Fortran,
10:47
which obeys really strict rules.
263
647260
2000
lequel obéit a des règles très strictes.
10:49
Linguistic scripts
264
649260
2000
L'écriture linguistiques
10:51
occupy the middle range.
265
651260
2000
occupe la gamme du milieu.
10:53
Now what about the Indus script?
266
653260
2000
Et l'écriture de l'Indus?
10:55
We found that the Indus script
267
655260
2000
Nous avons trouvé que l'écriture Indus
10:57
actually falls within the range of the linguistic scripts.
268
657260
2000
relève en fait de la gamme des écritures linguistiques.
10:59
When this result was first published,
269
659260
2000
Quand ce résultat fut premièrement publié,
11:01
it was highly controversial.
270
661260
3000
il était extrêmement controversé.
11:04
There were people who raised a hue and cry,
271
664260
3000
Il y avait des gens qui huaient,
11:07
and these people were the ones who believed
272
667260
2000
et ces gens étaient ceux qui croyaient
11:09
that the Indus script does not represent language.
273
669260
3000
que l'écriture de l'Indus ne représente pas une langue.
11:12
I even started to get some hate mail.
274
672260
2000
J'ai même commencé à recevoir quelque courriers haineux.
11:14
My students said
275
674260
2000
Mes élèves disaient
11:16
that I should really seriously consider getting some protection.
276
676260
3000
que je devrais sérieusement penser à me faire protéger.
11:19
Who'd have thought
277
679260
2000
Qui aurait pensé
11:21
that deciphering could be a dangerous profession?
278
681260
2000
Que déchiffrer pourrait être une profession dangereuse ?
11:23
What does this result really show?
279
683260
2000
Que démontre vraiment ce résultat ?
11:25
It shows that the Indus script
280
685260
2000
Cela montre que l'écriture de l'Indus
11:27
shares an important property of language.
281
687260
2000
partage une propriété importante de la langue.
11:29
So, as the old saying goes,
282
689260
2000
Alors, comme dit le vieux dicton,
11:31
if it looks like a linguistic script
283
691260
2000
si ça a l'air d'une écriture linguistique
11:33
and it acts like a linguistic script,
284
693260
2000
et agit comme une criture linguistique,
11:35
then perhaps we may have a linguistic script on our hands.
285
695260
3000
alors peut-être avons nous une écriture linguistique entre nos mains.
11:38
What other evidence is there
286
698260
2000
Quelle autre preuve y a t'il
11:40
that the script could actually encode language?
287
700260
2000
que l'écriture pourrait en fait encoder une langue ?
11:42
Well linguistic scripts can actually encode multiple languages.
288
702260
3000
Les manuscrits linguistiques peuvent en fait encoder de multiples langues.
11:45
So for example, here's the same sentence written in English
289
705260
3000
Donc par exemple, voici la même phrase écrite en Anglais
11:48
and the same sentence written in Dutch
290
708260
2000
et la même phrase écrite dans Hollandais
11:50
using the same letters of the alphabet.
291
710260
2000
utilisant les mêmes lettres de l'alphabet.
11:52
If you don't know Dutch and you only know English
292
712260
3000
Si vous ne savez pas le Hollandais et savez seulement l'Anglais
11:55
and I give you some words in Dutch,
293
715260
2000
et que je vous donne quelques mots en Hollandais,
11:57
you'll tell me that these words contain
294
717260
2000
vous me direz que ces mots contiennent
11:59
some very unusual patterns.
295
719260
2000
de très curieux modèles.
12:01
Some things are not right,
296
721260
2000
Quelque chose ne va pas,
12:03
and you'll say these words are probably not English words.
297
723260
3000
et vous direz que ces mots ne sont probablement pas Anglais.
12:06
The same thing happens in the case of the Indus script.
298
726260
2000
C'est la même chose dans le cas de l'écriture Indus.
12:08
The computer found several texts --
299
728260
2000
L'ordinateur a trouvé plusieurs textes --
12:10
two of them are shown here --
300
730260
2000
deux d'entre eux sont montrés ici --
12:12
that have very unusual patterns.
301
732260
2000
qui ont de très curieux modèles.
12:14
So for example the first text:
302
734260
2000
Donc par exemple le premier texte:
12:16
there's a doubling of this jar-shaped sign.
303
736260
3000
il y a un doublé de ce signe en forme de pot.
12:19
This sign is the most frequently-occurring sign
304
739260
2000
Ce signe est le signe le plus fréquemment trouvé
12:21
in the Indus script,
305
741260
2000
dans l'écriture Indus,
12:23
and it's only in this text
306
743260
2000
et c'est seulement dans ce texte
12:25
that it occurs as a doubling pair.
307
745260
2000
qu'il apparaît en double.
12:27
Why is that the case?
308
747260
2000
Pourquoi est-ce le cas?
12:29
We went back and looked at where these particular texts were found,
309
749260
3000
Nous sommes retournés et avons regardé où ces textes particuliers ont été trouvés,
12:32
and it turns out that they were found
310
752260
2000
et il se trouve qu'ils ont été trouvés
12:34
very, very far away from the Indus Valley.
311
754260
2000
très, très loin de la Vallée de l'Indus.
12:36
They were found in present day Iraq and Iran.
312
756260
3000
Ils ont été trouvés en Irak actuel et en Iran.
12:39
And why were they found there?
313
759260
2000
Et pourquoi ont-ils été trouvés là ?
12:41
What I haven't told you is that
314
761260
2000
Ce que je ne vous ais pas dit est que
12:43
the Indus people were very, very enterprising.
315
763260
2000
le peuple de l'Indus étaient très, très entreprenant.
12:45
They used to trade with people pretty far away from where they lived,
316
765260
3000
Ils ont troqué avec les peuples assez loin d'où ils vécurent.
12:48
and so in this case, they were traveling by sea
317
768260
3000
Et donc dans ce cas là, ils voyageaient par mer
12:51
all the way to Mesopotamia, present-day Iraq.
318
771260
3000
jusqu'en Mésopotamie, l'Irak actuel.
12:54
And what seems to have happened here
319
774260
2000
Et ce qu'il semble être arrivé ici
12:56
is that the Indus traders, the merchants,
320
776260
3000
c'est que les commerçants de l''Indus, les marchands,
12:59
were using this script to write a foreign language.
321
779260
3000
utilisaient cette écriture pour écrire une langue étrangère.
13:02
It's just like our English and Dutch example.
322
782260
2000
C'est comme notre exemple de l'Anglais et du Hollandais.
13:04
And that would explain why we have these strange patterns
323
784260
2000
Et cela expliquerait pourquoi nous avons ces modèles étranges
13:06
that are very different from the kinds of patterns you see in the text
324
786260
3000
qui sont très différent des types de modèles que vous voyez dans les textes
13:09
that are found within the Indus Valley.
325
789260
3000
trouvés dans la vallée de l'Indus.
13:12
This suggests that the same script, the Indus script,
326
792260
2000
Ceci suggère que la même écriture, l'écriture de l'Indus,
13:14
could be used to write different languages.
327
794260
3000
pouvait être utilisée afin d'écrire différentes langues.
13:17
The results we have so far seem to point to the conclusion
328
797260
3000
Les résultats que nous possédons semblent indiquer
13:20
that the Indus script probably does represent language.
329
800260
3000
que l’écriture de l'indus représente probablement une langue.
13:23
If it does represent language,
330
803260
2000
S'il représente bien une langue,
13:25
then how do we read the symbols?
331
805260
2000
alors comment en lisons-nous les symboles ?
13:27
That's our next big challenge.
332
807260
2000
C'est là notre prochain grand défi.
13:29
So you'll notice that many of the symbols
333
809260
2000
Vous remarquerez donc que beaucoup des symboles
13:31
look like pictures of humans, of insects,
334
811260
2000
ressemblent à des images d'humains, d'insectes
13:33
of fishes, of birds.
335
813260
3000
de poissons, d'oiseaux.
13:36
Most ancient scripts
336
816260
2000
La plupart des écritures anciennes
13:38
use the rebus principle,
337
818260
2000
utilisent le principe de rébus,
13:40
which is, using pictures to represent words.
338
820260
3000
qui est, d'utiliser une image pour représenter un mot.
13:43
So as an example, here's a word.
339
823260
3000
Par exemple, voici un mot.
13:46
Can you write it using pictures?
340
826260
2000
Pouvez écrire ceci utilisant des images?
13:48
I'll give you a couple seconds.
341
828260
2000
je vous donnes quelques secondes.
13:50
Got it?
342
830260
2000
Vous l'avez?
13:52
Okay. Great.
343
832260
2000
Tres bien.
13:54
Here's my solution.
344
834260
2000
Voilà ma solution.
13:56
You could use the picture of a bee followed by a picture of a leaf --
345
836260
2000
Vous pouvez utiliser l'image une "bee" suivit par celle d'une "leaf"--
13:58
and that's "belief," right.
346
838260
2000
et ça donne "beliefe", bien.
14:00
There could be other solutions.
347
840260
2000
Il y a d'autres solutions possibles.
14:02
In the case of the Indus script,
348
842260
2000
Dans le cas de l'écriture Indus,
14:04
the problem is the reverse.
349
844260
2000
le problème est l'inverse.
14:06
You have to figure out the sounds of each of these pictures
350
846260
3000
Vous devez trouver le son de chacune de ses images
14:09
such that the entire sequence makes sense.
351
849260
2000
afin que la séquence entière ait un sens.
14:11
So this is just like a crossword puzzle,
352
851260
3000
Donc c'est tout comme un mot-croisés,
14:14
except that this is the mother of all crossword puzzles
353
854260
3000
sauf que ceci est la mère de tous les mots croisés,
14:17
because the stakes are so high if you solve it.
354
857260
4000
parce que les enjeux sont si extraordinaires si vous le résolvez.
14:21
My colleagues, Iravatham Mahadevan and Asko Parpola,
355
861260
3000
Mes collègues, Iravatham Mahadevan et Asko Parpola
14:24
have been making some headway on this particular problem.
356
864260
2000
ont fait quelques progrès sur ce problème particulier.
14:26
And I'd like to give you a quick example of Parpola's work.
357
866260
2000
Et j'aimerais vous donner un bref exemple du travail de Parpola.
14:28
Here's a really short text.
358
868260
2000
C'est un texte très court.
14:30
It contains seven vertical strokes followed by this fish-like sign.
359
870260
3000
Il contient sept bâtons verticaux suivis par ce signe en forme de poisson.
14:33
And I want to mention that these seals were used
360
873260
2000
Et je souhaites mentionner que ces cachets ont été utilisés
14:35
for stamping clay tags
361
875260
2000
pour timbrer des étiquettes d'argile
14:37
that were attached to bundles of goods,
362
877260
2000
qui étaient attachés aux paquets d'articles,
14:39
so it's quite likely that these tags, at least some of them,
363
879260
3000
donc c'est tout à fait probable que ces étiquettes, au moins certaines,
14:42
contain names of merchants.
364
882260
2000
contiennent des noms de marchands.
14:44
And it turns out that in India
365
884260
2000
Et il se trouve qu'en Inde
14:46
there's a long tradition
366
886260
2000
il y a une longue tradition
14:48
of names being based on horoscopes
367
888260
2000
de noms étant fondé sur les horoscopes
14:50
and star constellations present at the time of birth.
368
890260
3000
et les constellations présentent lors de la naissance.
14:53
In Dravidian languages,
369
893260
2000
En langues Dravidiennes,
14:55
the word for fish is "meen"
370
895260
2000
le mot pour le poisson est « meen »
14:57
which happens to sound just like the word for star.
371
897260
3000
qui sonne comme le mot pour l'étoile.
15:00
And so seven stars
372
900260
2000
Et donc sept étoiles
15:02
would stand for "elu meen,"
373
902260
2000
représenterait « elu meen »
15:04
which is the Dravidian word
374
904260
2000
qui est le mot de Dravidien
15:06
for the Big Dipper star constellation.
375
906260
2000
Pour la constellation de la Grande cuillère.
15:08
Similarly, there's another sequence of six stars,
376
908260
3000
De même, il y a une autre séquence de six étoiles,
15:11
and that translates to "aru meen,"
377
911260
2000
et cela se traduit par « aru meen »
15:13
which is the old Dravidian name
378
913260
2000
qui est le vieux nom Dravidien
15:15
for the star constellation Pleiades.
379
915260
2000
pour la constellation d'étoile de Pléiades .
15:17
And finally, there's other combinations,
380
917260
3000
Et enfin, il y a d'autres combinaisons,
15:20
such as this fish sign with something that looks like a roof on top of it.
381
920260
3000
comme ce signe de poisson avec quelque chose au dessus qui a l'air d'un toit.
15:23
And that could be translated into "mey meen,"
382
923260
3000
Et cela pourrait être traduit « mey meen »
15:26
which is the old Dravidian name for the planet Saturn.
383
926260
3000
lequel est le vieux nom Dravidien pour la planète Saturne.
15:29
So that was pretty exciting.
384
929260
2000
C'était donc assez excitant.
15:31
It looks like we're getting somewhere.
385
931260
2000
Il semble que nous avançons.
15:33
But does this prove
386
933260
2000
Mais cela prouve-t-il
15:35
that these seals contain Dravidian names
387
935260
2000
que ces cachets contiennent des noms Dravidiens
15:37
based on planets and star constellations?
388
937260
2000
fondés sur les planètes et les constellations d'étoiles?
15:39
Well not yet.
389
939260
2000
Et bien pas encore.
15:41
So we have no way of validating
390
941260
2000
Nous n'avons donc pas de façon de valider
15:43
these particular readings,
391
943260
2000
ces interprétations particulières,
15:45
but if more and more of these readings start making sense,
392
945260
3000
mais si de plus en plus de ces interprétations commencent à avoir un sens,
15:48
and if longer and longer sequences
393
948260
2000
et si des séquences de plus en plus longues
15:50
appear to be correct,
394
950260
2000
s'avèrent être correctes,
15:52
then we know that we are on the right track.
395
952260
2000
alors nous saurons que nous sommes sur le bon chemin.
15:54
Today,
396
954260
2000
Aujourd'hui,
15:56
we can write a word such as TED
397
956260
3000
nous pouvons écrire un mot tel que TED
15:59
in Egyptian hieroglyphics and in cuneiform script,
398
959260
3000
en hiéroglyphes Égyptiens et en écriture cunéiforme,
16:02
because both of these were deciphered
399
962260
2000
parce que ceux-ci ont été déchiffrés
16:04
in the 19th century.
400
964260
2000
au 19ème siècle.
16:06
The decipherment of these two scripts
401
966260
2000
Le déchiffrage de ces deux écritures
16:08
enabled these civilizations to speak to us again directly.
402
968260
3000
a permit à ces civilisations de nous parler à nouveau directement.
16:11
The Mayans
403
971260
2000
Les Mayas
16:13
started speaking to us in the 20th century,
404
973260
2000
ont commencé à nous parler au 20ème siècle,
16:15
but the Indus civilization remains silent.
405
975260
3000
mais la civilisation de l'Indus demeure silencieuse.
16:18
Why should we care?
406
978260
2000
Pourquoi devrions nous nous sentir concerner?
16:20
The Indus civilization does not belong
407
980260
2000
La civilisation de l'Indus n'appartient pas
16:22
to just the South Indians or the North Indians
408
982260
2000
seulement aux Indiens du sud ou à ceux du nord
16:24
or the Pakistanis;
409
984260
2000
ou aux Pakistanais
16:26
it belongs to all of us.
410
986260
2000
Elle nous appartient à tous .
16:28
These are our ancestors --
411
988260
2000
Ceux-ci sont nos ancêtres --
16:30
yours and mine.
412
990260
2000
à vous et à moi.
16:32
They were silenced
413
992260
2000
Ils se ont été soumis au silence
16:34
by an unfortunate accident of history.
414
994260
2000
par un malheureux accident de l'histoire.
16:36
If we decipher the script,
415
996260
2000
Si nous déchiffrons l'écriture,
16:38
we would enable them to speak to us again.
416
998260
2000
nous leur permettrons de nous parler à nouveau.
16:40
What would they tell us?
417
1000260
3000
Que nous diraient-ils ?
16:43
What would we find out about them? About us?
418
1003260
3000
Que découvririons-nous sur eux ? Sur nous ?
16:46
I can't wait to find out.
419
1006260
3000
je suis impatient de savoir.
16:49
Thank you.
420
1009260
2000
Merci.
16:51
(Applause)
421
1011260
4000
(Applaudissements)
À propos de ce site Web

Ce site vous présentera des vidéos YouTube utiles pour apprendre l'anglais. Vous verrez des leçons d'anglais dispensées par des professeurs de premier ordre du monde entier. Double-cliquez sur les sous-titres anglais affichés sur chaque page de vidéo pour lire la vidéo à partir de là. Les sous-titres défilent en synchronisation avec la lecture de la vidéo. Si vous avez des commentaires ou des demandes, veuillez nous contacter en utilisant ce formulaire de contact.

https://forms.gle/WvT1wiN1qDtmnspy7