How computers translate human language - Ioannis Papachimonas

423,128 views ・ 2015-10-26

TED-Ed


下の英語字幕をダブルクリックすると動画を再生できます。

翻訳: Emi Kamiya 校正: Tomoyuki Suzuki
00:06
How is it that so many intergalactic species in movies and TV
0
6677
4629
映画やテレビに出てくる宇宙人の多くが 苦もなく完璧な英語を話すのは
00:11
just happen to speak perfect English?
1
11306
3177
一体どういうわけなんでしょうか
00:14
The short answer is that no one wants to watch a starship crew
2
14483
3403
端的に言えば 宇宙船の乗組員が何年もかけて
00:17
spend years compiling an alien dictionary.
3
17886
3888
宇宙人語の辞書を編纂している姿なんて 誰も見たくないからです
00:21
But to keep things consistent,
4
21774
1618
しかし辻褄を合わせる意味で
00:23
the creators of Star Trek and other science-fiction worlds
5
23392
3397
スタートレックなどSF業界の製作者たちは
00:26
have introduced the concept of a universal translator,
6
26789
3725
万能翻訳機というコンセプトを 世に送り出しました
00:30
a portable device that can instantly translate between any languages.
7
30514
4498
どんな言語間の翻訳も即座にできる 携帯機器です
00:35
So is a universal translator possible in real life?
8
35012
3527
では現実の世界に万能翻訳機は 存在し得るのでしょうか
00:38
We already have many programs that claim to do just that,
9
38539
3598
それが可能だと言い張る プログラムはたくさんあります
00:42
taking a word, sentence, or entire book in one language
10
42137
3817
単語でも文でも 本を丸ごと1冊でも
00:45
and translating it into almost any other,
11
45954
3050
ある言語から 別の たいていの言語に翻訳でき
00:49
whether it's modern English or Ancient Sanskrit.
12
49004
3333
現代英語も古代サンスクリット語も お手のものです
00:52
And if translation were just a matter of looking up words in a dictionary,
13
52337
3576
もし翻訳というものが ただ単語を辞書で調べるだけのことなら
00:55
these programs would run circles around humans.
14
55913
3912
こうしたプログラムは 人間の力を越えていると言えるでしょう
00:59
The reality, however, is a bit more complicated.
15
59825
3474
しかし実際のところは もっと複雑です
01:03
A rule-based translation program uses a lexical database,
16
63299
4050
規則に基づくタイプの翻訳プログラムは
01:07
which includes all the words you'd find in a dictionary
17
67349
2953
辞書に載っているすべての単語や その単語が取りうる―
01:10
and all grammatical forms they can take,
18
70302
2981
文法的に正しいすべての形を含んだ 語彙のデータベースと
01:13
and set of rules to recognize the basic linguistic elements in the input language.
19
73283
5642
入力言語の基本的な言語的要素を 認識するための一連の規則を用います
01:18
For a seemingly simple sentence like, "The children eat the muffins,"
20
78925
3471
「その子たちはマフィンを食べる」は 一見 単純そうな文ですが
01:22
the program first parses its syntax, or grammatical structure,
21
82396
4654
プログラムは まず構文 つまり文法的な構造を解析します
01:27
by identifying the children as the subject,
22
87050
2537
「その子たち」が主語で
01:29
and the rest of the sentence as the predicate
23
89587
2730
残りの部分は述語であり
01:32
consisting of a verb "eat,"
24
92317
2051
その中には動詞の「食べる」と
01:34
and a direct object "the muffins."
25
94368
3054
直接目的語「マフィン」があることを 割り出します
01:37
It then needs to recognize English morphology,
26
97422
2827
続いて英語の形態論に沿って 識別する必要があります
01:40
or how the language can be broken down into its smallest meaningful units,
27
100249
4432
意味を持つ最小単位にまで 言語を分解するのです
01:44
such as the word muffin
28
104681
1443
たとえば「マフィン」という語と
01:46
and the suffix "s," used to indicate plural.
29
106124
3631
複数を示す接尾辞「s」とは 別々になります
01:49
Finally, it needs to understand the semantics,
30
109755
2694
最後に意味論の理解が必要です
01:52
what the different parts of the sentence actually mean.
31
112449
3729
文の各部分が実際にどういう意味か 判断するのです
01:56
To translate this sentence properly,
32
116178
1896
この文を正しく翻訳するために
01:58
the program would refer to a different set of vocabulary and rules
33
118074
3908
プログラムは 翻訳後の要素1つ1つに対して
02:01
for each element of the target language.
34
121982
3184
その言語の語彙や規則を参照しますが
02:05
But this is where it gets tricky.
35
125166
1854
ここが微妙なところです
02:07
The syntax of some languages allows words to be arranged in any order,
36
127020
4800
構文的に語順を自由に入れ替えてよい 言語もあれば
02:11
while in others, doing so could make the muffin eat the child.
37
131820
5134
入れ替えると「マフィンが子どもを食べる」に なってしまう言語もあります
02:16
Morphology can also pose a problem.
38
136954
2693
形態論が問題になることもあります
02:19
Slovene distinguishes between two children and three or more
39
139647
3596
スロベニア語では「2人の子ども」と 「3人以上の子ども」は区別され
02:23
using a dual suffix absent in many other languages,
40
143243
3854
他の多くの言語にはない双数形を示す 接尾辞を使います
02:27
while Russian's lack of definite articles might leave you wondering
41
147097
3435
ロシア語には定冠詞がないので 子どもたちが食べているのは
02:30
whether the children are eating some particular muffins,
42
150532
3043
ある特定のマフィンなのか 一般的なマフィンなのか
02:33
or just eat muffins in general.
43
153575
3144
戸惑ってしまうかもしれません
02:36
Finally, even when the semantics are technically correct,
44
156719
2989
最後に プログラムは意味論に関して 間違いではなくても
02:39
the program might miss their finer points,
45
159708
3049
細かいところを取りこぼす場合があります
02:42
such as whether the children "mangiano" the muffins,
46
162757
3052
たとえば子どもたちがマフィンを 「普通に食べる」か
02:45
or "divorano" them.
47
165809
1985
「ガツガツむさぼる」か拾いきれません
02:47
Another method is statistical machine translation,
48
167794
3764
また別の方法として 統計的機械翻訳というのがあります
02:51
which analyzes a database of books, articles, and documents
49
171558
4204
すでに人間の手で翻訳されている 本や記事や文書の
02:55
that have already been translated by humans.
50
175762
3726
データベースを分析する方法です
02:59
By finding matches between source and translated text
51
179488
3471
このプログラムでは 偶然には起こりにくいと考えられる―
03:02
that are unlikely to occur by chance,
52
182959
2434
原文と翻訳が一致する箇所を探すことで
03:05
the program can identify corresponding phrases and patterns,
53
185393
3952
対応する表現やパターンを特定しておき
03:09
and use them for future translations.
54
189345
3084
それを後々 翻訳に利用します
03:12
However, the quality of this type of translation
55
192429
2540
しかし このタイプの翻訳の質は
03:14
depends on the size of the initial database
56
194969
2721
初期のデータベースの規模や
03:17
and the availability of samples for certain languages
57
197690
3667
目的の言語のサンプルや 文体のサンプルが
03:21
or styles of writing.
58
201357
2026
どれだけ使えるかに かかっています
03:23
The difficulty that computers have with the exceptions, irregularities
59
203383
3757
コンピュータは例外や変則的な表現 ニュアンスの違いに苦労しますが
03:27
and shades of meaning that seem to come instinctively to humans
60
207140
3854
これは人間なら本能的にわかるものです
03:30
has led some researchers to believe that our understanding of language
61
210994
4051
このため研究者の中には 私たちの言語理解を
03:35
is a unique product of our biological brain structure.
62
215045
4206
人間の脳の生物学的構造が生む 特徴だと考える人もいます
03:39
In fact, one of the most famous fictional universal translators,
63
219251
3850
事実 もっとも有名な架空の万能翻訳機は
03:43
the Babel fish from "The Hitchhiker's Guide to the Galaxy",
64
223101
3338
『銀河ヒッチハイク・ガイド』に登場する バベル魚ですが
03:46
is not a machine at all but a small creature
65
226439
3287
あれは機械などではなく 小さな生き物で
03:49
that translates the brain waves and nerve signals of sentient species
66
229726
4484
知覚を持つ生物の脳波と神経信号を テレパシーという形で
03:54
through a form of telepathy.
67
234210
2795
翻訳するというものでした
03:57
For now, learning a language the old fashioned way
68
237005
2721
今のところは まだ 昔ながらの言語学習の方が
03:59
will still give you better results than any currently available computer program.
69
239726
5380
世の中の どのコンピュータプログラムより 良い結果を出しますが
04:05
But this is no easy task,
70
245106
1643
言語学習は簡単ではありませんし
04:06
and the sheer number of languages in the world,
71
246749
2265
世界中には数多くの言語があり
04:09
as well as the increasing interaction between the people who speak them,
72
249014
3975
それを話す人々の間で 交流が増えていることにも後押しされて
04:12
will only continue to spur greater advances in automatic translation.
73
252989
5015
自動翻訳は今後 進歩していく一方でしょう
04:18
Perhaps by the time we encounter intergalactic life forms,
74
258004
3405
きっと私たちが 宇宙の生命体に出会う頃には
04:21
we'll be able to communicate with them through a tiny gizmo,
75
261409
3251
小型の装置を通じて コミュニケーションが可能になっているでしょう
04:24
or we might have to start compiling that dictionary, after all.
76
264660
4366
あるいは結局 例の辞書の編纂に 着手しているかもしれませんけどね
このウェブサイトについて

このサイトでは英語学習に役立つYouTube動画を紹介します。世界中の一流講師による英語レッスンを見ることができます。各ビデオのページに表示される英語字幕をダブルクリックすると、そこからビデオを再生することができます。字幕はビデオの再生と同期してスクロールします。ご意見・ご要望がございましたら、こちらのお問い合わせフォームよりご連絡ください。

https://forms.gle/WvT1wiN1qDtmnspy7