How computers translate human language - Ioannis Papachimonas

423,721 views ・ 2015-10-26

TED-Ed


Haga doble clic en los subtítulos en inglés para reproducir el vídeo.

Traductor: Sebastian Betti Revisor: Lidia Cámara de la Fuente
00:06
How is it that so many intergalactic species in movies and TV
0
6677
4629
¿Cómo es posible que tantas especies intergalácticas en películas y series
00:11
just happen to speak perfect English?
1
11306
3177
resulten hablar inglés perfecto?
00:14
The short answer is that no one wants to watch a starship crew
2
14483
3403
La respuesta breve es que nadie quiere ver a un equipo de la nave
00:17
spend years compiling an alien dictionary.
3
17886
3888
pasar años compilando un diccionario alienígena.
00:21
But to keep things consistent,
4
21774
1618
Pero para mantener la consistencia,
00:23
the creators of Star Trek and other science-fiction worlds
5
23392
3397
los creadores de Star Trek y otros mundos de ciencia ficción
00:26
have introduced the concept of a universal translator,
6
26789
3725
introdujeron el concepto de traductor universal,
00:30
a portable device that can instantly translate between any languages.
7
30514
4498
un dispositivo portable que traduce al instante entre cualquier idioma.
00:35
So is a universal translator possible in real life?
8
35012
3527
¿Es posible un traductor universal en la vida real?
00:38
We already have many programs that claim to do just that,
9
38539
3598
Ya tenemos muchos programas que dicen hacer exactamente eso,
00:42
taking a word, sentence, or entire book in one language
10
42137
3817
tomar una palabra, una oración, o un libro entero en un idioma
00:45
and translating it into almost any other,
11
45954
3050
y traducirlo a casi cualquier otro,
00:49
whether it's modern English or Ancient Sanskrit.
12
49004
3333
sea inglés moderno o sánscrito antiguo.
00:52
And if translation were just a matter of looking up words in a dictionary,
13
52337
3576
Y si la traducción fuera solo cuestión de buscar palabras en un diccionario,
00:55
these programs would run circles around humans.
14
55913
3912
estos programas superarían a los humanos.
00:59
The reality, however, is a bit more complicated.
15
59825
3474
La realidad, sin embargo, es un poco más complicada.
01:03
A rule-based translation program uses a lexical database,
16
63299
4050
Un programa de traducción basado en reglas, usa una base de datos léxica
01:07
which includes all the words you'd find in a dictionary
17
67349
2953
que tiene todas las palabras que uno encuentra en un diccionario
01:10
and all grammatical forms they can take,
18
70302
2981
y las formas gramaticales que estas pueden adoptar y reglas
01:13
and set of rules to recognize the basic linguistic elements in the input language.
19
73283
5642
para reconocer los elementos lingüísticos básicos en el idioma de entrada.
01:18
For a seemingly simple sentence like, "The children eat the muffins,"
20
78925
3471
Para una oración aparentemente simple como "The children eat the muffins",
01:22
the program first parses its syntax, or grammatical structure,
21
82396
4654
el programa primero analiza su sintaxis, o estructura gramatical,
01:27
by identifying the children as the subject,
22
87050
2537
identificando "children" [niños] como sujeto,
01:29
and the rest of the sentence as the predicate
23
89587
2730
y el resto de la oración como predicado
01:32
consisting of a verb "eat,"
24
92317
2051
que tiene un verbo "eat" [comer],
01:34
and a direct object "the muffins."
25
94368
3054
y un objeto directo "the muffins".
01:37
It then needs to recognize English morphology,
26
97422
2827
Luego tiene que reconocer la morfología del inglés,
01:40
or how the language can be broken down into its smallest meaningful units,
27
100249
4432
o cómo descomponer el idioma en unidades significativas más pequeñas,
01:44
such as the word muffin
28
104681
1443
como la palabra "muffin"
01:46
and the suffix "s," used to indicate plural.
29
106124
3631
y el sufijo "s", usado para indicar el plural.
01:49
Finally, it needs to understand the semantics,
30
109755
2694
Finalmente, tiene que entender la semántica,
01:52
what the different parts of the sentence actually mean.
31
112449
3729
qué significan realmente las partes de la oración.
Para traducir esta oración de manera apropiada,
01:56
To translate this sentence properly,
32
116178
1896
01:58
the program would refer to a different set of vocabulary and rules
33
118074
3908
el programa hará referencia a distintos vocabularios y reglas
02:01
for each element of the target language.
34
121982
3184
para cada elemento del idioma destino.
02:05
But this is where it gets tricky.
35
125166
1854
Pero aquí la cosa se complica.
02:07
The syntax of some languages allows words to be arranged in any order,
36
127020
4800
La sintaxis de algunos idiomas permiten ordenar palabras en cualquier orden,
02:11
while in others, doing so could make the muffin eat the child.
37
131820
5134
mientras que otras, harían que el "muffin" se coma al niño.
02:16
Morphology can also pose a problem.
38
136954
2693
La morfología puede también suponer un problema.
02:19
Slovene distinguishes between two children and three or more
39
139647
3596
El esloveno distingue entre dos niños y tres o más
02:23
using a dual suffix absent in many other languages,
40
143243
3854
mediante un sufijo dual ausente en muchos otros idiomas,
mientras que la falta de artículos definidos del ruso podría dejar la duda
02:27
while Russian's lack of definite articles might leave you wondering
41
147097
3435
02:30
whether the children are eating some particular muffins,
42
150532
3043
de si los niños están comiendo algunos muffins en particular,
02:33
or just eat muffins in general.
43
153575
3144
o solo comen muffins en general.
02:36
Finally, even when the semantics are technically correct,
44
156719
2989
Finalmente, incluso si la semántica es técnicamente correcta,
02:39
the program might miss their finer points,
45
159708
3049
el programa puede errar en sus puntos más finos,
02:42
such as whether the children "mangiano" the muffins,
46
162757
3052
por ejemplo si los niños "comen" los muffins,
02:45
or "divorano" them.
47
165809
1985
o los "devoran".
02:47
Another method is statistical machine translation,
48
167794
3764
Otro método es la traducción automática estadística,
02:51
which analyzes a database of books, articles, and documents
49
171558
4204
que analiza una base de datos de libros, artículos y documentos
02:55
that have already been translated by humans.
50
175762
3726
que ya ha sido traducida por humanos.
02:59
By finding matches between source and translated text
51
179488
3471
Encontrando concordancias entre textos fuente y traducidos,
03:02
that are unlikely to occur by chance,
52
182959
2434
que es poco probable que ocurran por casualidad,
03:05
the program can identify corresponding phrases and patterns,
53
185393
3952
el programa puede identificar frases y patrones que se corresponden,
03:09
and use them for future translations.
54
189345
3084
y usarlos para futuras traducciones.
03:12
However, the quality of this type of translation
55
192429
2540
Sin embargo, la calidad de este tipo de traducción
03:14
depends on the size of the initial database
56
194969
2721
depende del tamaño de la base de datos inicial
03:17
and the availability of samples for certain languages
57
197690
3667
y la disponibilidad de muestras para ciertos idiomas
03:21
or styles of writing.
58
201357
2026
o estilos de escritura.
03:23
The difficulty that computers have with the exceptions, irregularities
59
203383
3757
La dificultad que tienen las máquinas con las excepciones, irregularidades
03:27
and shades of meaning that seem to come instinctively to humans
60
207140
3854
y los matices de significado que parecen instintivos a los humanos
03:30
has led some researchers to believe that our understanding of language
61
210994
4051
llevaron a algunos investigadores a creer que la comprensión de la lengua
03:35
is a unique product of our biological brain structure.
62
215045
4206
es un producto único de la estructura cerebral biológica.
03:39
In fact, one of the most famous fictional universal translators,
63
219251
3850
De hecho, uno de los traductores universales más famosos de la ficción,
03:43
the Babel fish from "The Hitchhiker's Guide to the Galaxy",
64
223101
3338
el pez Babel de "The Hitchhiker's Guide to the Galaxy",
03:46
is not a machine at all but a small creature
65
226439
3287
no es una máquina sino una pequeña criatura
03:49
that translates the brain waves and nerve signals of sentient species
66
229726
4484
que traduce las ondas cerebrales y las señales nerviosas de especies sensibles
03:54
through a form of telepathy.
67
234210
2795
mediante una forma de telepatía.
03:57
For now, learning a language the old fashioned way
68
237005
2721
Por ahora, aprender un idioma a la antigua
03:59
will still give you better results than any currently available computer program.
69
239726
5380
todavía dará mejores resultados que los programas informáticos actuales.
04:05
But this is no easy task,
70
245106
1643
Pero esto no es tarea fácil,
04:06
and the sheer number of languages in the world,
71
246749
2265
y la inmensa cantidad de idiomas del mundo,
04:09
as well as the increasing interaction between the people who speak them,
72
249014
3975
así como la creciente interacción de las personas que los hablan,
04:12
will only continue to spur greater advances in automatic translation.
73
252989
5015
no hará más que estimular un mayor avance en la traducción automática.
04:18
Perhaps by the time we encounter intergalactic life forms,
74
258004
3405
Quizá cuando encontremos formas de vida intergalácticas,
04:21
we'll be able to communicate with them through a tiny gizmo,
75
261409
3251
podremos comunicarnos con ellos a través de un pequeño aparatito,
04:24
or we might have to start compiling that dictionary, after all.
76
264660
4366
o puede que empecemos a compilar ese diccionario, después de todo.
Acerca de este sitio web

Este sitio le presentará vídeos de YouTube útiles para aprender inglés. Verá lecciones de inglés impartidas por profesores de primera categoría de todo el mundo. Haz doble clic en los subtítulos en inglés que aparecen en cada página de vídeo para reproducir el vídeo desde allí. Los subtítulos se desplazan en sincronía con la reproducción del vídeo. Si tiene algún comentario o petición, póngase en contacto con nosotros mediante este formulario de contacto.

https://forms.gle/WvT1wiN1qDtmnspy7