How computers translate human language - Ioannis Papachimonas

423,128 views ・ 2015-10-26

TED-Ed


Vă rugăm să faceți dublu clic pe subtitrările în limba engleză de mai jos pentru a reda videoclipul.

Traducător: Floricica Nagy-Matei Corector: Claudia Pravat
00:06
How is it that so many intergalactic species in movies and TV
0
6677
4629
Cum de atâtea specii intergalactice din filme sau de la TV
00:11
just happen to speak perfect English?
1
11306
3177
vorbesc perfect limba engleză?
00:14
The short answer is that no one wants to watch a starship crew
2
14483
3403
Pe scurt, nimeni nu vrea să vadă cum echipajul unei nave spațiale
00:17
spend years compiling an alien dictionary.
3
17886
3888
petrece ani să creeze un dicționar pentru o limbă extraterestră.
00:21
But to keep things consistent,
4
21774
1618
Însă din motive de coerență,
00:23
the creators of Star Trek and other science-fiction worlds
5
23392
3397
creatorii Star Trek și ai altor lumi SF
00:26
have introduced the concept of a universal translator,
6
26789
3725
au introdus conceptul de traducător universal,
00:30
a portable device that can instantly translate between any languages.
7
30514
4498
un dispozitiv portabil ce traduce imediat din orice limbă.
E posibil în realitate astfel de traducător universal?
00:35
So is a universal translator possible in real life?
8
35012
3527
00:38
We already have many programs that claim to do just that,
9
38539
3598
Deja sunt multe programe care susțin că fac asta,
00:42
taking a word, sentence, or entire book in one language
10
42137
3817
iau un cuvânt, o propoziție, o carte întreagă dintr-o limbă
00:45
and translating it into almost any other,
11
45954
3050
și le traduc în aproape oricare alta,
fie că e engleză modernă sau sanscrită veche.
00:49
whether it's modern English or Ancient Sanskrit.
12
49004
3333
00:52
And if translation were just a matter of looking up words in a dictionary,
13
52337
3576
Dacă traducerea ar presupune doar căutarea cuvintelor în dicționar,
00:55
these programs would run circles around humans.
14
55913
3912
aceste programe s-ar descurca mai bine decât oamenii.
00:59
The reality, however, is a bit more complicated.
15
59825
3474
Totuși, realitatea e puțin mai complicată.
01:03
A rule-based translation program uses a lexical database,
16
63299
4050
Un program de traducere bazat pe reguli folosește o bază de date lexicală
01:07
which includes all the words you'd find in a dictionary
17
67349
2953
care include toate cuvintele dintr-un dicționar
01:10
and all grammatical forms they can take,
18
70302
2981
și toate formele gramaticale pe care le pot avea aceste cuvinte,
01:13
and set of rules to recognize the basic linguistic elements in the input language.
19
73283
5642
și un set de reguli pentru a recunoaște elementele lingvistice de bază din limbă.
01:18
For a seemingly simple sentence like, "The children eat the muffins,"
20
78925
3471
Pentru o propoziție simplă cum ar fi „Copiii mănâncă brioșele”,
01:22
the program first parses its syntax, or grammatical structure,
21
82396
4654
programul analizează întâi sintaxa sau structura gramaticală,
01:27
by identifying the children as the subject,
22
87050
2537
identificând copiii ca fiind subiectul,
01:29
and the rest of the sentence as the predicate
23
89587
2730
iar restul propoziției fiind predicatul
01:32
consisting of a verb "eat,"
24
92317
2051
format din verbul „mănâncă”
01:34
and a direct object "the muffins."
25
94368
3054
și complementul direct „brioșele”.
01:37
It then needs to recognize English morphology,
26
97422
2827
Trebuie să recunoască morfologia limbii
01:40
or how the language can be broken down into its smallest meaningful units,
27
100249
4432
sau cum ea poate fi împărțită în cele mai mici unități de sens,
01:44
such as the word muffin
28
104681
1443
cum ar fi cuvântul „brioșă”
01:46
and the suffix "s," used to indicate plural.
29
106124
3631
și sufixul „le”, care indică pluralul.
01:49
Finally, it needs to understand the semantics,
30
109755
2694
Mai mult, trebuie să înțeleagă semantica,
01:52
what the different parts of the sentence actually mean.
31
112449
3729
ce anume înseamnă fiecare parte a propoziției.
01:56
To translate this sentence properly,
32
116178
1896
Pentru a traduce propoziția corect,
01:58
the program would refer to a different set of vocabulary and rules
33
118074
3908
programul va accesa un vocabular și un set de reguli diferite
02:01
for each element of the target language.
34
121982
3184
pentru fiecare element din limba țintă.
02:05
But this is where it gets tricky.
35
125166
1854
Aici devine complicat.
Sintaxa unor limbi permite aranjarea cuvintelor în orice ordine,
02:07
The syntax of some languages allows words to be arranged in any order,
36
127020
4800
02:11
while in others, doing so could make the muffin eat the child.
37
131820
5134
pe când în alte limbi, asta ar însemna că brioșa mănâncă copilul.
02:16
Morphology can also pose a problem.
38
136954
2693
Și morfologia poate pune probleme.
02:19
Slovene distinguishes between two children and three or more
39
139647
3596
Limba slovenă distinge între doi copii și trei sau mai mulți,
02:23
using a dual suffix absent in many other languages,
40
143243
3854
folosind un sufix dual, absent în multe alte limbi,
02:27
while Russian's lack of definite articles might leave you wondering
41
147097
3435
în timp ce lipsa articolului hotărât din rusă te face să te întrebi
02:30
whether the children are eating some particular muffins,
42
150532
3043
dacă copiii mănâncă anumite brioșe
02:33
or just eat muffins in general.
43
153575
3144
sau doar brioșe în general.
02:36
Finally, even when the semantics are technically correct,
44
156719
2989
Chiar dacă semantica e corectă din punct de vedere tehnic,
02:39
the program might miss their finer points,
45
159708
3049
programul poate omite subtilitățile,
02:42
such as whether the children "mangiano" the muffins,
46
162757
3052
cum ar fi dacă copiii mănâncă brioșele
02:45
or "divorano" them.
47
165809
1985
sau le devorează.
02:47
Another method is statistical machine translation,
48
167794
3764
O altă metodă e traducerea automată statistică,
02:51
which analyzes a database of books, articles, and documents
49
171558
4204
care analizează o bază de date cu cărți, articole și documente
02:55
that have already been translated by humans.
50
175762
3726
care au fost deja traduse de oameni.
02:59
By finding matches between source and translated text
51
179488
3471
Prin găsirea de echivalențe între limba sursă și textul tradus,
03:02
that are unlikely to occur by chance,
52
182959
2434
care sunt puțin probabil să apară aleatoriu,
03:05
the program can identify corresponding phrases and patterns,
53
185393
3952
programul poate identifica propoziții și structuri corespondente
03:09
and use them for future translations.
54
189345
3084
și utiliza pentru traduceri viitoare.
03:12
However, the quality of this type of translation
55
192429
2540
Totuși, calitatea acestui tip de traducere
03:14
depends on the size of the initial database
56
194969
2721
depinde de mărimea bazei de date inițiale
03:17
and the availability of samples for certain languages
57
197690
3667
și de disponibilitatea eșantioanelor pentru anumite limbi
03:21
or styles of writing.
58
201357
2026
sau stiluri de scriere.
03:23
The difficulty that computers have with the exceptions, irregularities
59
203383
3757
Dificultatea pe care calculatorul o are cu excepțiile, abaterile
03:27
and shades of meaning that seem to come instinctively to humans
60
207140
3854
sau sensurile ascunse care par să fie instinctive oamenilor
03:30
has led some researchers to believe that our understanding of language
61
210994
4051
i-a făcut pe unii cercetători să creadă că modul în care înțelegem limba
03:35
is a unique product of our biological brain structure.
62
215045
4206
e un produs unic al structurii biologice a creierului.
03:39
In fact, one of the most famous fictional universal translators,
63
219251
3850
De fapt, unul dintre cei mai faimoși traducători universali ficționali,
03:43
the Babel fish from "The Hitchhiker's Guide to the Galaxy",
64
223101
3338
peștele Babel din „Ghidul autostopistului galactic”
03:46
is not a machine at all but a small creature
65
226439
3287
nu e o mașină, ci o creatură mică
03:49
that translates the brain waves and nerve signals of sentient species
66
229726
4484
ce traduce undele creierului și semnalele nervoase ale speciilor inteligente,
03:54
through a form of telepathy.
67
234210
2795
printr-o formă de telepatie.
Momentan, învățarea unei limbi prin metoda veche
03:57
For now, learning a language the old fashioned way
68
237005
2721
03:59
will still give you better results than any currently available computer program.
69
239726
5380
va avea rezultate mai bune decât orice program disponibil.
04:05
But this is no easy task,
70
245106
1643
Dar asta nu e deloc ușor,
04:06
and the sheer number of languages in the world,
71
246749
2265
iar numărul mare de limbi din lume
și interacțiunea crescândă dintre oamenii care le vorbesc
04:09
as well as the increasing interaction between the people who speak them,
72
249014
3975
04:12
will only continue to spur greater advances in automatic translation.
73
252989
5015
va continua să stimuleze dezvoltarea traducerii automate.
Poate atunci când vom întâlni forme de viață intergalactice,
04:18
Perhaps by the time we encounter intergalactic life forms,
74
258004
3405
04:21
we'll be able to communicate with them through a tiny gizmo,
75
261409
3251
vom putea comunica cu ele cu ajutorul unui aparat mic
04:24
or we might have to start compiling that dictionary, after all.
76
264660
4366
sau va trebui totuși să începem să creăm acel dicționar.
Despre acest site

Acest site vă va prezenta videoclipuri de pe YouTube care sunt utile pentru a învăța limba engleză. Veți vedea lecții de engleză predate de profesori de top din întreaga lume. Faceți dublu clic pe subtitrările în limba engleză afișate pe fiecare pagină video pentru a reda videoclipul de acolo. Subtitrările se derulează în sincron cu redarea videoclipului. Dacă aveți comentarii sau solicitări, vă rugăm să ne contactați folosind acest formular de contact.

https://forms.gle/WvT1wiN1qDtmnspy7