How computers translate human language - Ioannis Papachimonas

423,128 views ・ 2015-10-26

TED-Ed


Bitte doppelklicken Sie auf die englischen Untertitel unten, um das Video abzuspielen.

Übersetzung: Anja Pfeiffer Lektorat: Johannes Duschner
00:06
How is it that so many intergalactic species in movies and TV
0
6677
4629
Wie kommt es, dass so viele intergalaktische Arten
in Film und Fernsehen zufällig perfekt Englisch sprechen?
00:11
just happen to speak perfect English?
1
11306
3177
00:14
The short answer is that no one wants to watch a starship crew
2
14483
3403
Kurz gesagt: Niemand will einer Raumschiffcrew dabei zusehen,
00:17
spend years compiling an alien dictionary.
3
17886
3888
wie sie jahrelang ein Alienwörterbuch erstellt.
00:21
But to keep things consistent,
4
21774
1618
Aber um konsistent zu bleiben,
00:23
the creators of Star Trek and other science-fiction worlds
5
23392
3397
haben die Schöpfer von Star Trek und anderen Science-Fiction-Welten
00:26
have introduced the concept of a universal translator,
6
26789
3725
das Konzept eines Universalübersetzers eingeführt,
00:30
a portable device that can instantly translate between any languages.
7
30514
4498
ein tragbares Gerät, das sofort jede Sprache übersetzen kann.
Ist ein Universalübersetzer aber auch im echten Leben möglich?
00:35
So is a universal translator possible in real life?
8
35012
3527
00:38
We already have many programs that claim to do just that,
9
38539
3598
Wir haben schon jetzt viele Programme, die behaupten, genau das zu tun,
00:42
taking a word, sentence, or entire book in one language
10
42137
3817
ein Wort, einen Satz, oder ein gesamtes Buch aus einer Sprache
00:45
and translating it into almost any other,
11
45954
3050
in fast jede andere zu übersetzen,
sei es nun modernes Englisch oder antikes Sanskrit.
00:49
whether it's modern English or Ancient Sanskrit.
12
49004
3333
00:52
And if translation were just a matter of looking up words in a dictionary,
13
52337
3576
Wäre Übersetzung nur eine Frage
des Nachschlagens von Wörtern,
00:55
these programs would run circles around humans.
14
55913
3912
würden diese Programme Menschen locker übertreffen.
00:59
The reality, however, is a bit more complicated.
15
59825
3474
Die Realität ist aber etwas komplizierter.
01:03
A rule-based translation program uses a lexical database,
16
63299
4050
Ein regelbasiertes Übersetzungsprogramm verwendet eine lexikalische Datenbank,
01:07
which includes all the words you'd find in a dictionary
17
67349
2953
die alle Wörter enthält, die in einem Wörterbuch stehen,
01:10
and all grammatical forms they can take,
18
70302
2981
sowie alle grammatikalischen Formen, die sie annehmen können,
01:13
and set of rules to recognize the basic linguistic elements in the input language.
19
73283
5642
und Regeln zum Erkennen sprachlicher Grundelemente der Eingabesprache.
01:18
For a seemingly simple sentence like, "The children eat the muffins,"
20
78925
3471
Für einen scheinbar einfachen Satz wie "Die Kinder essen die Muffins",
01:22
the program first parses its syntax, or grammatical structure,
21
82396
4654
zerlegt das Programm zuerst seine Syntax oder grammatikalische Struktur,
indem es die Kinder als Subjekt identifiziert,
01:27
by identifying the children as the subject,
22
87050
2537
01:29
and the rest of the sentence as the predicate
23
89587
2730
und den Rest des Satzes als Prädikat,
01:32
consisting of a verb "eat,"
24
92317
2051
das aus dem Verb "essen",
01:34
and a direct object "the muffins."
25
94368
3054
und dem direkten Objekt "die Muffins" besteht.
01:37
It then needs to recognize English morphology,
26
97422
2827
Es muss dann die englische Morphologie erkennen,
01:40
or how the language can be broken down into its smallest meaningful units,
27
100249
4432
oder wie Sprache in seine kleinsten bedeutungstragenden Einheiten
zerlegt werden kann,
01:44
such as the word muffin
28
104681
1443
wie z. B. das Wort Muffin
01:46
and the suffix "s," used to indicate plural.
29
106124
3631
und das Suffix "s", das den Plural kennzeichnet.
01:49
Finally, it needs to understand the semantics,
30
109755
2694
Zu guter Letzt muss es die Semantik verstehen:
01:52
what the different parts of the sentence actually mean.
31
112449
3729
was die verschiedenen Teile des Satzes tatsächlich bedeuten.
Um diesen Satz richtig zu übersetzen,
01:56
To translate this sentence properly,
32
116178
1896
würde das Programm für jedes Element in der Zielsprache
01:58
the program would refer to a different set of vocabulary and rules
33
118074
3908
auf einen anderen Wortschatz und ein anderes Regelwerk verweisen.
02:01
for each element of the target language.
34
121982
3184
Aber hier wird es knifflig.
02:05
But this is where it gets tricky.
35
125166
1854
Die Syntax mancher Sprachen lässt es zu,
02:07
The syntax of some languages allows words to be arranged in any order,
36
127020
4800
dass Wörter in beliebiger Reihenfolge angeordnet werden können,
02:11
while in others, doing so could make the muffin eat the child.
37
131820
5134
während das in anderen dazu führen würde, dass der Muffin das Kind isst.
02:16
Morphology can also pose a problem.
38
136954
2693
Auch Morphologie kann ein Problem darstellen.
02:19
Slovene distinguishes between two children and three or more
39
139647
3596
Slowenisch unterscheidet mithilfe eines Dualsuffixes
zwischen zwei, drei oder mehr Kindern, was es in vielen Sprachen nicht gibt.
02:23
using a dual suffix absent in many other languages,
40
143243
3854
Russisch hat keine bestimmten Artikel wodurch man sich vielleicht fragt,
02:27
while Russian's lack of definite articles might leave you wondering
41
147097
3435
02:30
whether the children are eating some particular muffins,
42
150532
3043
ob die Kinder bestimmte Muffins essen
02:33
or just eat muffins in general.
43
153575
3144
oder einfach nur Muffins im Allgemeinen.
02:36
Finally, even when the semantics are technically correct,
44
156719
2989
Sogar bei korrekter Semantik
02:39
the program might miss their finer points,
45
159708
3049
könnte das Programm die Feinheiten übersehen,
02:42
such as whether the children "mangiano" the muffins,
46
162757
3052
also ob die Kinder die Muffins "mangiano" oder "divorano".
02:45
or "divorano" them.
47
165809
1985
02:47
Another method is statistical machine translation,
48
167794
3764
Eine andere Methode ist die statistische maschinelle Übersetzung,
02:51
which analyzes a database of books, articles, and documents
49
171558
4204
die eine Datenbank von Büchern, Artikeln und Dokumenten überprüft,
02:55
that have already been translated by humans.
50
175762
3726
die schon von Menschen übersetzt wurden.
02:59
By finding matches between source and translated text
51
179488
3471
Indem sie Treffer zwischen der Quelle und dem übersetzten Text findet,
03:02
that are unlikely to occur by chance,
52
182959
2434
die vermutlich nicht zufällig auftreten,
03:05
the program can identify corresponding phrases and patterns,
53
185393
3952
kann das Programm übereinstimmende Phrasen und Muster erkennen
03:09
and use them for future translations.
54
189345
3084
und sie für zukünftige Übersetzungen verwenden.
03:12
However, the quality of this type of translation
55
192429
2540
Jedoch hängt die Qualität dieser Art von Übersetzungen
03:14
depends on the size of the initial database
56
194969
2721
von der Größe der ursprünglichen Datenbank
03:17
and the availability of samples for certain languages
57
197690
3667
und der Verfügbarkeit von Beispielen in bestimmten Sprachen
03:21
or styles of writing.
58
201357
2026
oder Schreibstilen ab.
03:23
The difficulty that computers have with the exceptions, irregularities
59
203383
3757
Die Schwierigkeiten, die Computer mit Ausnahmen, Unregelmäßigkeiten
und Bedeutungsnuancen haben, die Menschen intuitiv erfassen,
03:27
and shades of meaning that seem to come instinctively to humans
60
207140
3854
03:30
has led some researchers to believe that our understanding of language
61
210994
4051
lässt einige Forscher glauben, dass unser Sprachverständnis
03:35
is a unique product of our biological brain structure.
62
215045
4206
ein einzigartiges Erzeugnis unserer biologischen Hirnstrukturen ist.
03:39
In fact, one of the most famous fictional universal translators,
63
219251
3850
Eigentlich ist nämlich der berühmteste fiktive Universalübersetzer,
03:43
the Babel fish from "The Hitchhiker's Guide to the Galaxy",
64
223101
3338
der Babelfisch aus "Per Anhalter durch die Galaxis",
03:46
is not a machine at all but a small creature
65
226439
3287
gar keine Maschine, sondern eine kleine Kreatur,
03:49
that translates the brain waves and nerve signals of sentient species
66
229726
4484
die die Hirnströme und Nervensignale von fühlenden Arten
03:54
through a form of telepathy.
67
234210
2795
durch eine Form von Telepathie übersetzt.
Fürs Erste erzielt das Sprachenlernen auf altmodische Art bessere Ergebnisse
03:57
For now, learning a language the old fashioned way
68
237005
2721
03:59
will still give you better results than any currently available computer program.
69
239726
5380
als jedes, momentan verfügbare Computerprogramm.
Aber das ist keine leichte Aufgabe,
04:05
But this is no easy task,
70
245106
1643
04:06
and the sheer number of languages in the world,
71
246749
2265
und die schiere Anzahl an Sprachen in der Welt
04:09
as well as the increasing interaction between the people who speak them,
72
249014
3975
sowie die zunehmende Interaktion zwischen den Menschen, die sie sprechen,
04:12
will only continue to spur greater advances in automatic translation.
73
252989
5015
werden die automatische Übersetzung zu weiteren Fortschritten anspornen.
04:18
Perhaps by the time we encounter intergalactic life forms,
74
258004
3405
Wenn wir einmal auf intergalaktische Lebensformen treffen,
04:21
we'll be able to communicate with them through a tiny gizmo,
75
261409
3251
können wir vielleicht mit ihnen durch ein winziges Ding kommunizieren,
04:24
or we might have to start compiling that dictionary, after all.
76
264660
4366
oder wir müssen am Ende doch noch dieses Wörterbuch erstellen.
Über diese Website

Auf dieser Seite finden Sie YouTube-Videos, die zum Englischlernen nützlich sind. Sie sehen Englischlektionen, die von hochkarätigen Lehrern aus der ganzen Welt unterrichtet werden. Doppelklicken Sie auf die englischen Untertitel, die auf jeder Videoseite angezeigt werden, um das Video von dort aus abzuspielen. Die Untertitel laufen synchron mit der Videowiedergabe. Wenn Sie irgendwelche Kommentare oder Wünsche haben, kontaktieren Sie uns bitte über dieses Kontaktformular.

https://forms.gle/WvT1wiN1qDtmnspy7