How computers translate human language - Ioannis Papachimonas

418,908 views ・ 2015-10-26

TED-Ed


Veuillez double-cliquer sur les sous-titres anglais ci-dessous pour lire la vidéo.

Traducteur: Eléa Weibel Relecteur: Gwladys MONIZ
00:06
How is it that so many intergalactic species in movies and TV
0
6677
4629
Comment se fait-il
que tant de races intergalactiques dans les films et les séries
00:11
just happen to speak perfect English?
1
11306
3177
parlent parfaitement l'anglais ?
00:14
The short answer is that no one wants to watch a starship crew
2
14483
3403
La réponse courte est que personne ne veut voir l'équipage d'un vaisseau
00:17
spend years compiling an alien dictionary.
3
17886
3888
passer des années à compiler un dictionnaire alien.
00:21
But to keep things consistent,
4
21774
1618
Mais pour la cohérence de la chose,
00:23
the creators of Star Trek and other science-fiction worlds
5
23392
3397
les créateurs de Star Trek et d'autres mondes de science-fiction
00:26
have introduced the concept of a universal translator,
6
26789
3725
ont introduit le concept d'un traducteur universel,
00:30
a portable device that can instantly translate between any languages.
7
30514
4498
un appareil portatif qui peut traduire instantanément n'importe quelle langue.
00:35
So is a universal translator possible in real life?
8
35012
3527
Peut-on créer un traducteur universel dans la vraie vie ?
00:38
We already have many programs that claim to do just that,
9
38539
3598
Il existe déjà de nombreux programmes qui prétendent pourvoir faire cela,
00:42
taking a word, sentence, or entire book in one language
10
42137
3817
en prenant un mot, une phrase, ou un livre entier dans une langue
00:45
and translating it into almost any other,
11
45954
3050
et le traduire dans quasiment n'importe quelle autre langue,
00:49
whether it's modern English or Ancient Sanskrit.
12
49004
3333
que ce soit l'anglais moderne ou l'ancien sanskrit.
00:52
And if translation were just a matter of looking up words in a dictionary,
13
52337
3576
Et si pour traduire, il suffisait de chercher des mots dans un dictionnaire,
00:55
these programs would run circles around humans.
14
55913
3912
ces programmes seraient partout.
00:59
The reality, however, is a bit more complicated.
15
59825
3474
La réalité est, cependant, un peu plus compliquée.
01:03
A rule-based translation program uses a lexical database,
16
63299
4050
Un programme de traduction
basé sur des rÚgles utilise une base de données lexicale,
01:07
which includes all the words you'd find in a dictionary
17
67349
2953
qui inclut tous les mots trouvés dans un dictionnaire
01:10
and all grammatical forms they can take,
18
70302
2981
et toutes les formes grammaticales qu'elles peuvent contenir,
01:13
and set of rules to recognize the basic linguistic elements in the input language.
19
73283
5642
et un jeu de rĂšgles permettant de reconnaĂźtre
les bases des éléments linguistiques de la langue source.
01:18
For a seemingly simple sentence like, "The children eat the muffins,"
20
78925
3471
Pour un phrase apparemment simple comme « les enfants mangent les muffins »,
01:22
the program first parses its syntax, or grammatical structure,
21
82396
4654
le programme analyse la syntaxe, ou la structure grammaticale,
01:27
by identifying the children as the subject,
22
87050
2537
en identifiant « les enfants » comme sujet
01:29
and the rest of the sentence as the predicate
23
89587
2730
et le reste de la phrase comme prédicat
01:32
consisting of a verb "eat,"
24
92317
2051
consistant du verbe « mangent »
01:34
and a direct object "the muffins."
25
94368
3054
et du complément d'objet direct « les muffins ».
01:37
It then needs to recognize English morphology,
26
97422
2827
Il doit ensuite reconnaĂźtre la morphologie anglaise,
01:40
or how the language can be broken down into its smallest meaningful units,
27
100249
4432
ou la séparation de la langue dans ses plus petites unités ayant un sens,
01:44
such as the word muffin
28
104681
1443
comme le mot « muffin »
01:46
and the suffix "s," used to indicate plural.
29
106124
3631
et le suffixe « s », utilisé pour indiquer le pluriel.
01:49
Finally, it needs to understand the semantics,
30
109755
2694
De plus, il a besoin de comprendre la sémantique,
01:52
what the different parts of the sentence actually mean.
31
112449
3729
ce que les différentes parties de la phrase veulent dire.
01:56
To translate this sentence properly,
32
116178
1896
Pour traduire cette phrase correctement,
01:58
the program would refer to a different set of vocabulary and rules
33
118074
3908
le programme devra consulter un jeu de rÚgles et de vocabulaires différents
02:01
for each element of the target language.
34
121982
3184
pour chaque élément de la langue cible.
02:05
But this is where it gets tricky.
35
125166
1854
Mais c'est là que ça devient compliqué.
02:07
The syntax of some languages allows words to be arranged in any order,
36
127020
4800
La syntaxe de certaines langues permet aux mots d'ĂȘtre dĂ©sordonnĂ©s,
02:11
while in others, doing so could make the muffin eat the child.
37
131820
5134
alors que dans d'autres,
cela pourrait conduire au « muffin mange l'enfant ».
02:16
Morphology can also pose a problem.
38
136954
2693
La morphologie pose aussi un problĂšme.
02:19
Slovene distinguishes between two children and three or more
39
139647
3596
En slovĂšne, on distingue entre deux ans et plus
02:23
using a dual suffix absent in many other languages,
40
143243
3854
en utilisant d'un double suffixe absent dans la plupart des autres langues,
02:27
while Russian's lack of definite articles might leave you wondering
41
147097
3435
lorsqu'en russe le manque d'articles définis vous fera demander
02:30
whether the children are eating some particular muffins,
42
150532
3043
si les enfants mangeaient un type particulier de muffins,
02:33
or just eat muffins in general.
43
153575
3144
ou juste des muffins en général.
02:36
Finally, even when the semantics are technically correct,
44
156719
2989
Finalement, mĂȘme quand la sĂ©mantique est techniquement correcte,
02:39
the program might miss their finer points,
45
159708
3049
le programme peut manquer les points plus complexes,
02:42
such as whether the children "mangiano" the muffins,
46
162757
3052
comme si les enfants ont « mangé » les muffins,
02:45
or "divorano" them.
47
165809
1985
ou s'ils les ont « dévorés ».
02:47
Another method is statistical machine translation,
48
167794
3764
L'autre méthode est une machine de traduction statistique,
02:51
which analyzes a database of books, articles, and documents
49
171558
4204
qui analyse une base de données de livres, d'articles et de documents
02:55
that have already been translated by humans.
50
175762
3726
qui ont déjà été traduits par des humains.
02:59
By finding matches between source and translated text
51
179488
3471
En trouvant des correspondances entre la source et le texte traduit
03:02
that are unlikely to occur by chance,
52
182959
2434
qui ont peu de chance de se produire par accident,
03:05
the program can identify corresponding phrases and patterns,
53
185393
3952
le programme peut identifier des expressions et des schémas correspondants,
03:09
and use them for future translations.
54
189345
3084
et les utiliser pour des traductions futures.
03:12
However, the quality of this type of translation
55
192429
2540
Cependant, la qualité de ce type de traduction
03:14
depends on the size of the initial database
56
194969
2721
dépend de la taille de la base de données initiale
03:17
and the availability of samples for certain languages
57
197690
3667
et de la disponibilitĂ© d’échantillons pour certaines langues
03:21
or styles of writing.
58
201357
2026
ou styles d'Ă©criture.
03:23
The difficulty that computers have with the exceptions, irregularities
59
203383
3757
La difficulté que les ordinateurs ont avec les exceptions, les irrégularités
03:27
and shades of meaning that seem to come instinctively to humans
60
207140
3854
et les nuances du sens qui semblent ĂȘtre instinctives pour les humains
03:30
has led some researchers to believe that our understanding of language
61
210994
4051
a amené certains chercheurs à penser que notre compréhension du langage
03:35
is a unique product of our biological brain structure.
62
215045
4206
est un produit propre Ă  la structure biologique de notre cerveau.
03:39
In fact, one of the most famous fictional universal translators,
63
219251
3850
En fait, un des traducteurs universels fictifs les plus connus,
03:43
the Babel fish from "The Hitchhiker's Guide to the Galaxy",
64
223101
3338
le poisson Babel du « Guide du voyageur galactique »,
03:46
is not a machine at all but a small creature
65
226439
3287
n'est pas du tout une machine, mais une petite créature
03:49
that translates the brain waves and nerve signals of sentient species
66
229726
4484
qui traduit les ondes cérébrales et les signaux nerveux de races sensibles
03:54
through a form of telepathy.
67
234210
2795
grùce à une forme de télépathie.
03:57
For now, learning a language the old fashioned way
68
237005
2721
Pour l'instant, apprendre une langue Ă  l'ancienne
03:59
will still give you better results than any currently available computer program.
69
239726
5380
vous donnera de meilleurs résultats que n'importe quel logiciel existant.
04:05
But this is no easy task,
70
245106
1643
Mais ce n'est pas facile,
04:06
and the sheer number of languages in the world,
71
246749
2265
et le simple nombre de langues dans le monde,
04:09
as well as the increasing interaction between the people who speak them,
72
249014
3975
en plus des interactions croissantes de personnes qui les parlent,
04:12
will only continue to spur greater advances in automatic translation.
73
252989
5015
vont seulement continuer à stimuler des avancées dans la traduction automatique.
Peut-ĂȘtre que lorsque nous rencontrerons des formes de vie intergalactiques,
04:18
Perhaps by the time we encounter intergalactic life forms,
74
258004
3405
04:21
we'll be able to communicate with them through a tiny gizmo,
75
261409
3251
nous serons capables de communiquer avec eux Ă  travers un petit dispositif,
04:24
or we might have to start compiling that dictionary, after all.
76
264660
4366
ou peut-ĂȘtre que nous devrons quand mĂȘme compiler ce petit dictionnaire aprĂšs tout.
À propos de ce site Web

Ce site vous présentera des vidéos YouTube utiles pour apprendre l'anglais. Vous verrez des leçons d'anglais dispensées par des professeurs de premier ordre du monde entier. Double-cliquez sur les sous-titres anglais affichés sur chaque page de vidéo pour lire la vidéo à partir de là. Les sous-titres défilent en synchronisation avec la lecture de la vidéo. Si vous avez des commentaires ou des demandes, veuillez nous contacter en utilisant ce formulaire de contact.

https://forms.gle/WvT1wiN1qDtmnspy7