How computers translate human language - Ioannis Papachimonas

418,908 views

2015-10-26 ・ TED-Ed


New videos

How computers translate human language - Ioannis Papachimonas

418,908 views ・ 2015-10-26

TED-Ed


Fare doppio clic sui sottotitoli in inglese per riprodurre il video.

Traduttore: Giorgia Valenti Revisore: Alberto Pagani
00:06
How is it that so many intergalactic species in movies and TV
0
6677
4629
Com'è possibile che le specie aliene di film e serie TV
00:11
just happen to speak perfect English?
1
11306
3177
parlino una lingua perfettamente comprensibile?
00:14
The short answer is that no one wants to watch a starship crew
2
14483
3403
Semplice: nessuno vorrebbe guardare l'equipaggio di una nave spaziale
00:17
spend years compiling an alien dictionary.
3
17886
3888
mentre compila il dizionario di una lingua aliena.
00:21
But to keep things consistent,
4
21774
1618
Ma per mantenere una certa coerenza
00:23
the creators of Star Trek and other science-fiction worlds
5
23392
3397
i creatori di Star Trek e di altri mondi della fantascienza
00:26
have introduced the concept of a universal translator,
6
26789
3725
hanno introdotto il concetto di un traduttore universale,
00:30
a portable device that can instantly translate between any languages.
7
30514
4498
uno strumento portatile che traduce immediatamente in tutte le lingue.
00:35
So is a universal translator possible in real life?
8
35012
3527
Può davvero esistere, nella vita reale, un traduttore universale?
00:38
We already have many programs that claim to do just that,
9
38539
3598
Esistono già tanti programmi che affermano di tradurre così,
00:42
taking a word, sentence, or entire book in one language
10
42137
3817
analizzando una parola, una frase o addirittura un libro intero
00:45
and translating it into almost any other,
11
45954
3050
e traducendo automaticamente in quasi tutte le lingue,
00:49
whether it's modern English or Ancient Sanskrit.
12
49004
3333
sia che si tratti di inglese moderno che di sanscrito antico.
00:52
And if translation were just a matter of looking up words in a dictionary,
13
52337
3576
E se la traduzione fosse soltanto questione di cercare parole nei dizionari
00:55
these programs would run circles around humans.
14
55913
3912
questi programmi potrebbero far sfigurare le traduzioni umane.
00:59
The reality, however, is a bit more complicated.
15
59825
3474
Tuttavia la realtà è un po' più complicata.
01:03
A rule-based translation program uses a lexical database,
16
63299
4050
Questi programmi di traduzione usano una banca dati lessicale
01:07
which includes all the words you'd find in a dictionary
17
67349
2953
composta da tutte le parole presenti in un dizionario
01:10
and all grammatical forms they can take,
18
70302
2981
e da tutte le forme grammaticali che le parole possono assumere
01:13
and set of rules to recognize the basic linguistic elements in the input language.
19
73283
5642
e alcune regole per riconoscere gli elementi linguistici
della lingua di partenza.
01:18
For a seemingly simple sentence like, "The children eat the muffins,"
20
78925
3471
Per una frase apparentemente semplice come "I bambini mangiano i dolci"
01:22
the program first parses its syntax, or grammatical structure,
21
82396
4654
il programma prima ne analizza la sintassi o la struttura grammaticale
identificando "i bambini" come il soggetto
01:27
by identifying the children as the subject,
22
87050
2537
01:29
and the rest of the sentence as the predicate
23
89587
2730
e il resto della frase come predicato
01:32
consisting of a verb "eat,"
24
92317
2051
composto dal verbo "mangiano"
01:34
and a direct object "the muffins."
25
94368
3054
e dal complemento oggetto "i dolci".
01:37
It then needs to recognize English morphology,
26
97422
2827
Il programma dunque riconosce la morfologia della lingua
01:40
or how the language can be broken down into its smallest meaningful units,
27
100249
4432
o il modo in cui la lingua si scompone nelle sue unità portatrici di significato
01:44
such as the word muffin
28
104681
1443
come ad esempio la parola "i dolci"
01:46
and the suffix "s," used to indicate plural.
29
106124
3631
e il suffisso finale "-i" usato per indicare il plurale.
01:49
Finally, it needs to understand the semantics,
30
109755
2694
Infine, il programma analizza la semantica
01:52
what the different parts of the sentence actually mean.
31
112449
3729
cioè cosa significano nel concreto le diverse parti della frase.
01:56
To translate this sentence properly,
32
116178
1896
Per tradurre correttamente questa frase
01:58
the program would refer to a different set of vocabulary and rules
33
118074
3908
il programma fa riferimento a un certo lessico e a certe regole
02:01
for each element of the target language.
34
121982
3184
per ogni elemento della lingua d'arrivo.
02:05
But this is where it gets tricky.
35
125166
1854
Ma qui la cosa si fa più complicata.
02:07
The syntax of some languages allows words to be arranged in any order,
36
127020
4800
La sintassi di alcune lingue permette alle parole di comparire in qualunque ordine
02:11
while in others, doing so could make the muffin eat the child.
37
131820
5134
mentre fare ciò in altre lingue farebbe sì che "i dolci mangiano i bambini"
02:16
Morphology can also pose a problem.
38
136954
2693
La morfologia stessa potrebbe porre dei problemi.
02:19
Slovene distinguishes between two children and three or more
39
139647
3596
Lo sloveno distingue tra numerali "due" bambini e "tre o più" bambini
02:23
using a dual suffix absent in many other languages,
40
143243
3854
per mezzo di un suffisso duale assente in tante altre lingue,
02:27
while Russian's lack of definite articles might leave you wondering
41
147097
3435
mentre il russo non prevede gli articoli, il che porterebbe a chiedersi
02:30
whether the children are eating some particular muffins,
42
150532
3043
se i bambini stiano mangiando dei dolci particolari
02:33
or just eat muffins in general.
43
153575
3144
o se generalmente mangino dolci.
02:36
Finally, even when the semantics are technically correct,
44
156719
2989
Infine, anche se la semantica risulta tecnicamente corretta,
02:39
the program might miss their finer points,
45
159708
3049
il programma potrebbe perdersi la sfumatura del verbo
02:42
such as whether the children "mangiano" the muffins,
46
162757
3052
ad esempio: "i bambini mangiano i dolci"
02:45
or "divorano" them.
47
165809
1985
o "i bambini divorano i dolci".
02:47
Another method is statistical machine translation,
48
167794
3764
Un altro metodo usato è la traduzione automatica statistica
02:51
which analyzes a database of books, articles, and documents
49
171558
4204
che analizza una banca dati di libri, articoli e documenti
02:55
that have already been translated by humans.
50
175762
3726
precedentemente tradotti da esseri umani.
02:59
By finding matches between source and translated text
51
179488
3471
Tramite le corrispondenze tra testo d'arrivo e testo di partenza
03:02
that are unlikely to occur by chance,
52
182959
2434
che è improbabile si verifichino per pura casualità,
03:05
the program can identify corresponding phrases and patterns,
53
185393
3952
il programma può identificare le corrispondenze tra le frasi
03:09
and use them for future translations.
54
189345
3084
e utilizzarle per le traduzioni future.
03:12
However, the quality of this type of translation
55
192429
2540
In ogni caso, la qualità di questo tipo di traduzione
03:14
depends on the size of the initial database
56
194969
2721
dipende dalla capienza del database iniziale
03:17
and the availability of samples for certain languages
57
197690
3667
e dalla disponibilità di traduzioni per una data lingua
03:21
or styles of writing.
58
201357
2026
o per uno stile di scrittura.
03:23
The difficulty that computers have with the exceptions, irregularities
59
203383
3757
Le difficoltà che i computer trovano con le eccezioni o le irregolarità
03:27
and shades of meaning that seem to come instinctively to humans
60
207140
3854
e con le sfumature di significato, che per gli uomini non sono un problema,
03:30
has led some researchers to believe that our understanding of language
61
210994
4051
hanno spinto i ricercatori a pensare che la nostra comprensione della lingua
03:35
is a unique product of our biological brain structure.
62
215045
4206
è un prodotto unico della struttura del nostro cervello.
03:39
In fact, one of the most famous fictional universal translators,
63
219251
3850
Infatti, uno dei più famosi traduttori universali mai inventati
03:43
the Babel fish from "The Hitchhiker's Guide to the Galaxy",
64
223101
3338
e cioè il pesce di Babele della "Guida galattica per autostoppisti"
03:46
is not a machine at all but a small creature
65
226439
3287
non è per niente una macchina bensì una piccola creatura
03:49
that translates the brain waves and nerve signals of sentient species
66
229726
4484
che traduce le onde del cervello e i segnali neuronali di specie senzienti
03:54
through a form of telepathy.
67
234210
2795
con l'utilizzo della telepatia.
03:57
For now, learning a language the old fashioned way
68
237005
2721
Per adesso, imparare una lingua alla vecchia maniera
03:59
will still give you better results than any currently available computer program.
69
239726
5380
frutterà sempre risultati migliori di un qualsiasi programma per computer.
04:05
But this is no easy task,
70
245106
1643
Non è un compito facile
04:06
and the sheer number of languages in the world,
71
246749
2265
e il numero immenso di lingue presenti al mondo
04:09
as well as the increasing interaction between the people who speak them,
72
249014
3975
così come l'interazione crescente tra le persone che le parlano
04:12
will only continue to spur greater advances in automatic translation.
73
252989
5015
stimolerà sempre l'innovazione nel campo della traduzione automatica.
04:18
Perhaps by the time we encounter intergalactic life forms,
74
258004
3405
Forse quando incontreremo forme di vita extraterrestri
04:21
we'll be able to communicate with them through a tiny gizmo,
75
261409
3251
saremo in grado di comunicare con loro grazie a un piccolo congegno
04:24
or we might have to start compiling that dictionary, after all.
76
264660
4366
o forse dovremo davvero cominciare a compilare quel dizionario,
nonostante tutto.
A proposito di questo sito web

Questo sito vi presenterà i video di YouTube utili per l'apprendimento dell'inglese. Vedrete lezioni di inglese tenute da insegnanti di alto livello provenienti da tutto il mondo. Fate doppio clic sui sottotitoli in inglese visualizzati su ogni pagina video per riprodurre il video da lì. I sottotitoli scorrono in sincronia con la riproduzione del video. Se avete commenti o richieste, contattateci tramite questo modulo di contatto.

https://forms.gle/WvT1wiN1qDtmnspy7