How computers translate human language - Ioannis Papachimonas

418,908 views ・ 2015-10-26

TED-Ed


Dubbelklik op de Engelse ondertitels hieronder om de video af te spelen.

Vertaald door: Dick Stada Nagekeken door: Peter van de Ven
00:06
How is it that so many intergalactic species in movies and TV
0
6677
4629
Hoe komt het dat zoveel buitenaardse wezens in films en op tv
00:11
just happen to speak perfect English?
1
11306
3177
toevallig perfect Engels spreken?
00:14
The short answer is that no one wants to watch a starship crew
2
14483
3403
Het korte antwoord is dat je geen ruimteschipbemanning wilt zien
00:17
spend years compiling an alien dictionary.
3
17886
3888
dat jaren bezig is om een woordenboek Buitenaards-Engels samen te stellen.
00:21
But to keep things consistent,
4
21774
1618
Maar om consequent te blijven,
00:23
the creators of Star Trek and other science-fiction worlds
5
23392
3397
hebben de makers van Star Trek en andere science-fiction
00:26
have introduced the concept of a universal translator,
6
26789
3725
een universele vertaler bedacht.
00:30
a portable device that can instantly translate between any languages.
7
30514
4498
Een draagbaar apparaat dat ogenblikkelijk alle talen kan vertalen.
Is zo'n universele vertaler in het echte leven mogelijk?
00:35
So is a universal translator possible in real life?
8
35012
3527
00:38
We already have many programs that claim to do just that,
9
38539
3598
Er bestaan al veel programma's die beweren dat te doen.
00:42
taking a word, sentence, or entire book in one language
10
42137
3817
Een woord, een zin of een compleet boek in een bepaalde taal
00:45
and translating it into almost any other,
11
45954
3050
vertalen naar bijna elke andere taal,
of het nou modern Engels of Oud-Sanskriet is.
00:49
whether it's modern English or Ancient Sanskrit.
12
49004
3333
00:52
And if translation were just a matter of looking up words in a dictionary,
13
52337
3576
Als vertalen alleen zou bestaan uit woorden opzoeken in een woordenboek,
00:55
these programs would run circles around humans.
14
55913
3912
dan zouden die programma's de mens makkelijk verslaan.
00:59
The reality, however, is a bit more complicated.
15
59825
3474
De realiteit is echter veel ingewikkelder.
01:03
A rule-based translation program uses a lexical database,
16
63299
4050
Een op regels gebaseerd vertaalprogramma gebruikt een lexicale database,
01:07
which includes all the words you'd find in a dictionary
17
67349
2953
die alle woorden bevat die in een woordenboek staan
01:10
and all grammatical forms they can take,
18
70302
2981
met alle grammaticale vormen die ze kunnen hebben,
01:13
and set of rules to recognize the basic linguistic elements in the input language.
19
73283
5642
en een aantal regels om de taalelementen van de brontaal te herkennen.
01:18
For a seemingly simple sentence like, "The children eat the muffins,"
20
78925
3471
Voor een ogenschijnlijk eenvoudige zin als 'De kinderen eten de muffins'
01:22
the program first parses its syntax, or grammatical structure,
21
82396
4654
zoekt het programma eerst uit wat de syntax of grammaticale structuur is
01:27
by identifying the children as the subject,
22
87050
2537
door de kinderen als onderwerp te benoemen
01:29
and the rest of the sentence as the predicate
23
89587
2730
en de rest van de zin als gezegde,
01:32
consisting of a verb "eat,"
24
92317
2051
bestaande uit het werkwoord 'eten'
01:34
and a direct object "the muffins."
25
94368
3054
en het lijdend voorwerp 'de muffins'.
01:37
It then needs to recognize English morphology,
26
97422
2827
Daarna moet het de Engelse woordstructuur herkennen,
01:40
or how the language can be broken down into its smallest meaningful units,
27
100249
4432
oftewel hoe de taal kan worden opgedeeld in de kleinste stukjes met betekenis,
01:44
such as the word muffin
28
104681
1443
zoals het woord 'muffin' en het aanhangsel 's',
01:46
and the suffix "s," used to indicate plural.
29
106124
3631
dat het meervoud aangeeft.
01:49
Finally, it needs to understand the semantics,
30
109755
2694
Tot slot moet het de semantiek begrijpen:
01:52
what the different parts of the sentence actually mean.
31
112449
3729
wat de verschillende zinsdelen betekenen.
01:56
To translate this sentence properly,
32
116178
1896
Om deze zin netjes te vertalen,
01:58
the program would refer to a different set of vocabulary and rules
33
118074
3908
zou het programma moeten verwijzen naar een andere woordenschat en regels
02:01
for each element of the target language.
34
121982
3184
voor elk onderdeel in de doeltaal.
Hier wordt het lastiger.
02:05
But this is where it gets tricky.
35
125166
1854
Soms kan de syntax van een taal toestaan dat de woordvolgorde niet uitmaakt,
02:07
The syntax of some languages allows words to be arranged in any order,
36
127020
4800
02:11
while in others, doing so could make the muffin eat the child.
37
131820
5134
terwijl dat bij andere talen betekent dat de muffin het kind eet.
02:16
Morphology can also pose a problem.
38
136954
2693
Morfologie kan ook nog roet in het eten gooien.
02:19
Slovene distinguishes between two children and three or more
39
139647
3596
Slovenen maken onderscheid tussen twee en drie of meer kinderen
02:23
using a dual suffix absent in many other languages,
40
143243
3854
door twee achtervoegsels te gebruiken die veel andere talen niet hebben,
terwijl je je door het Russische gebrek aan lidwoorden blijft afvragen
02:27
while Russian's lack of definite articles might leave you wondering
41
147097
3435
02:30
whether the children are eating some particular muffins,
42
150532
3043
of de kinderen bepaalde muffins eten,
02:33
or just eat muffins in general.
43
153575
3144
of muffins in het algemeen.
02:36
Finally, even when the semantics are technically correct,
44
156719
2989
Zelfs als de semantiek technisch klopt,
02:39
the program might miss their finer points,
45
159708
3049
kan het programma nog steeds de finesses missen,
02:42
such as whether the children "mangiano" the muffins,
46
162757
3052
bijvoorbeeld of de kinderen de muffins 'mangiano'
02:45
or "divorano" them.
47
165809
1985
of 'divorano'.
02:47
Another method is statistical machine translation,
48
167794
3764
Een andere methode is de statistische machinevertaling,
02:51
which analyzes a database of books, articles, and documents
49
171558
4204
die een database analyseert met boeken, artikelen en documenten
02:55
that have already been translated by humans.
50
175762
3726
die al zijn vertaald door de mens.
02:59
By finding matches between source and translated text
51
179488
3471
Door overeenkomsten te zoeken tussen de bron en de vertaalde tekst
03:02
that are unlikely to occur by chance,
52
182959
2434
die niet toevallig lijken te bestaan,
03:05
the program can identify corresponding phrases and patterns,
53
185393
3952
kan het programma overeenkomstige uitdrukkingen en patronen vinden,
03:09
and use them for future translations.
54
189345
3084
en ze gebruiken voor toekomstige vertalingen.
03:12
However, the quality of this type of translation
55
192429
2540
De kwaliteit van dit soort vertalingen
03:14
depends on the size of the initial database
56
194969
2721
hangt echter af van de grootte van de database
03:17
and the availability of samples for certain languages
57
197690
3667
en de aanwezigheid van voorbeelden voor bepaalde talen of schrijfstijlen.
03:21
or styles of writing.
58
201357
2026
03:23
The difficulty that computers have with the exceptions, irregularities
59
203383
3757
Het probleem dat computers hebben met uitzonderingen, onregelmatigheden
03:27
and shades of meaning that seem to come instinctively to humans
60
207140
3854
en nuances die mensen instinctief aanvoelen,
03:30
has led some researchers to believe that our understanding of language
61
210994
4051
hebben bij onderzoekers geleid tot de gedachte dat taalbegrip
03:35
is a unique product of our biological brain structure.
62
215045
4206
het unieke resultaat is van onze biologische hersenstructuur.
03:39
In fact, one of the most famous fictional universal translators,
63
219251
3850
Een van de beroemdste fictieve universele vertalers,
03:43
the Babel fish from "The Hitchhiker's Guide to the Galaxy",
64
223101
3338
Babelvis uit 'The Hitchhiker's Guide to the Galaxy',
03:46
is not a machine at all but a small creature
65
226439
3287
is immers geen machine, maar een klein wezen
03:49
that translates the brain waves and nerve signals of sentient species
66
229726
4484
dat de hersengolven en zenuwsignalen van levende soorten vertaalt
03:54
through a form of telepathy.
67
234210
2795
via een soort telepathie.
03:57
For now, learning a language the old fashioned way
68
237005
2721
Voorlopig geeft het leren van een taal op de ouderwetse manier
03:59
will still give you better results than any currently available computer program.
69
239726
5380
betere resultaten dan welk computerprogramma ook.
Dat is niet eenvoudig.
04:05
But this is no easy task,
70
245106
1643
04:06
and the sheer number of languages in the world,
71
246749
2265
Het grote aantal talen op de wereld
04:09
as well as the increasing interaction between the people who speak them,
72
249014
3975
en de toenemende interactie tussen de sprekers ervan
04:12
will only continue to spur greater advances in automatic translation.
73
252989
5015
zal het automatisch vertalen alleen maar sneller doen verbeteren.
04:18
Perhaps by the time we encounter intergalactic life forms,
74
258004
3405
Tegen de tijd dat we buitenaardse levensvormen ontdekken,
04:21
we'll be able to communicate with them through a tiny gizmo,
75
261409
3251
kunnen we wellicht praten via een gadget,
04:24
or we might have to start compiling that dictionary, after all.
76
264660
4366
of we moeten alsnog dat woordenboek schrijven.
Over deze website

Deze site laat u kennismaken met YouTube-video's die nuttig zijn om Engels te leren. U ziet Engelse lessen gegeven door topdocenten uit de hele wereld. Dubbelklik op de Engelse ondertitels op elke videopagina om de video af te spelen. De ondertitels scrollen synchroon met het afspelen van de video. Heeft u opmerkingen of verzoeken, neem dan contact met ons op via dit contactformulier.

https://forms.gle/WvT1wiN1qDtmnspy7