Massive-scale online collaboration | Luis von Ahn

ルイス・フォン・アーン 「ネットを使った大規模共同作業」

311,575 views

2011-12-06 ・ TED


New videos

Massive-scale online collaboration | Luis von Ahn

ルイス・フォン・アーン 「ネットを使った大規模共同作業」

311,575 views ・ 2011-12-06

TED


下の英語字幕をダブルクリックすると動画を再生できます。

翻訳: Yasushi Aoki 校正: Akinori Oyama
00:15
How many of you had to fill out a web form
0
15260
2000
こんな風にゆがんだ文字を読んで
00:17
where you've been asked to read
1
17284
1512
フォーム入力をしたことある人?
00:18
a distorted sequence of characters like this?
2
18820
2136
すっごく煩わしいと思った人は?
00:20
How many of you found it really annoying?
3
20980
1953
やっぱりみんなそうですよね
00:22
(Laughter)
4
22957
1099
00:24
OK, outstanding. So I invented that.
5
24080
1736
考案したのは私です (笑)
00:25
(Laughter)
6
25840
1836
まあ 考案者の1人ですね
00:27
Or I was one of the people who did it.
7
27700
1856
これはCAPTCHAと呼ばれています
00:29
That thing is called a CAPTCHA.
8
29580
1536
これの目的は 入力しているのが
00:31
And it is there to make sure you, the entity filling out the form,
9
31140
3136
確かに人間で 何百万回もフォームを送信するように作られた
00:34
are a human and not a computer program
10
34300
1856
プログラムではないと確認するためです
00:36
that was written to submit the form millions of times.
11
36180
2576
どうしてこれがうまくいくのかというと
00:38
The reason it works is because humans, at least non-visually-impaired humans,
12
38780
3656
目の見える人であれば こんな
ゆがんだ文字でも問題なく読み取れますが
00:42
have no trouble reading these distorted characters,
13
42460
2416
コンピュータには まだそれができないからです
00:44
whereas programs can't do it as well yet.
14
44900
1976
00:46
In the case of Ticketmaster,
15
46900
1496
例えばチケット販売サイトのチケットマスターが
00:48
the reason you have to type these characters
16
48420
2096
ユーザにゆがんだ文字を読ませるのは
00:50
is to prevent scalpers from writing a program
17
50540
2136
一度に何百万枚もチケットを注文する—
00:52
that can buy millions of tickets, two at a time.
18
52700
2256
プログラムをダフ屋に作らせないためです
00:54
CAPTCHAs are used all over the Internet.
19
54980
1936
CAPTCHAはネットの至る所で使われ
00:56
And since they're used so often,
20
56940
1576
あまりに多く使われているので
00:58
a lot of times the sequence of random characters shown to the user
21
58540
3136
ランダムに選ばれた文字列が
不運な結果になることがあります
01:01
is not so fortunate.
22
61700
1216
01:02
So this is an example from the Yahoo registration page.
23
62940
2656
これはヤフーのユーザ登録ページの例ですが
01:05
The random characters that happened to be shown to the user
24
65620
2816
ランダムな文字列がたまたま
「W A I T」(待て)という 意味ある単語になっています
01:08
were W, A, I, T, which, of course, spell a word.
25
68460
2696
ここで傑作なのは
01:11
But the best part is the message
26
71180
2096
01:13
that the Yahoo help desk got about 20 minutes later.
27
73300
2456
ヤフーのヘルプデスクが20分後に受け取ったメッセージです
01:15
[Help! I've been waiting for over 20 minutes and nothing happens.]
28
75780
3136
「どうなってるんでしょう? 20分以上待っても何も起きないんですが?」
01:18
(Laughter)
29
78940
4856
「どうなってるんでしょう? 20分以上待っても何も起きないんですが?」
01:23
This person thought they needed to wait.
30
83820
1905
この人は待たなきゃいけないと思ったようです
01:25
This, of course, is not as bad as this poor person.
31
85749
2407
しかしそれも この人ほど不運ではないでしょう
01:28
(Laughter)
32
88180
2376
「RESTART」(やり直せ) (笑)
01:30
CAPTCHA Project is something that we did at Carnegie Melllon over 10 years ago,
33
90580
3736
CAPTCHAは 私たちが10年以上前に ここカーネギーメロン大学で開発し
広く使われるようになりました
01:34
and it's been used everywhere.
34
94340
1456
01:35
Let me now tell you about a project that we did a few years later,
35
95820
3136
次に その何年か後に作った
CAPTCHAの進化形の話をしましょう
01:38
which is sort of the next evolution of CAPTCHA.
36
98980
2216
これは reCAPTCHAと呼んでいるもので
01:41
This is a project that we call reCAPTCHA,
37
101220
1976
ここカーネギーメロン大学でやり始めて
01:43
which is something that we started here at Carnegie Mellon,
38
103220
2776
それをベンチャー企業にしました
01:46
then we turned it into a start-up company.
39
106020
2008
そして1年半ほど前に
01:48
And then about a year and a half ago, Google actually acquired this company.
40
108052
3588
グーグルがその会社を買収しました
そのプロジェクトがどう始まったかですが
01:51
Let me tell you what this project started.
41
111664
2007
あるすごいことに気づいたのがきっかけでした
01:53
This project started from the following realization:
42
113695
2531
CAPTCHAは世界中の人によって
01:56
It turns out that approximately 200 million CAPTCHAs
43
116250
2437
毎日2億回も入力されているのが分かったのです
01:58
are typed everyday by people around the world.
44
118711
2151
02:00
When I first heard this, I was quite proud of myself.
45
120886
2484
最初このことを聞いて 自分の研究成果の
影響の大きさに 随分誇らしく思えたのですが
02:03
I thought, look at the impact my research has had.
46
123394
2341
それから申し訳ない気持ちになりました
02:05
But then I started feeling bad.
47
125759
1484
それというのも CAPTCHAの入力には
02:07
Here's the thing: each time you type a CAPTCHA,
48
127267
2206
毎回10秒ほど時間を無駄にすることになりますが
02:09
essentially, you waste 10 seconds of your time.
49
129497
2339
02:11
And if you multiply that by 200 million,
50
131860
1936
これを2億回と掛け合わせると
02:13
you get that humanity is wasting about 500,000 hours every day
51
133820
3016
人類は全体として この煩わしいCAPTCHAへの入力のため
02:16
typing these annoying CAPTCHAs.
52
136860
1536
毎日50万時間も無駄にしているわけです
02:18
(Laughter)
53
138420
1016
申し訳ない気にもなります
02:19
So then I started feeling bad.
54
139460
1429
02:20
(Laughter)
55
140913
1803
(笑)
02:22
And then I started thinking, of course, we can't just get rid of CAPTCHAs,
56
142740
3496
ある意味 ウェブの安全に貢献しているCAPTCHAを
単になくしてしまう訳にはいかないのですが
02:26
because the security of the web depends on them.
57
146260
2256
この労力を何か人類の役に立つことに
02:28
But then I started thinking, can we use this effort
58
148540
2416
02:30
for something that is good for humanity?
59
150980
1936
利用できないかと考えました
02:32
So see, here's the thing.
60
152940
1496
どういうことかと言うと
02:34
While you're typing a CAPTCHA, during those 10 seconds,
61
154460
2616
CAPTCHAに入力する10秒間で
人の脳は実はものすごいことをしています
02:37
your brain is doing something amazing.
62
157100
1856
02:38
Your brain is doing something that computers cannot yet do.
63
158980
2816
コンピュータには未だできないことです
その10秒でユーザに何か有益な作業をさせられないか?
02:41
So can we get you to do useful work for those 10 seconds?
64
161820
2696
言い換えると
02:44
Is there some humongous problem that we cannot yet get computers to solve,
65
164540
3496
現在のコンピュータでは解けない
巨大な問題を10秒分の断片に分割して
02:48
yet we can split into tiny 10-second chunks
66
168060
2776
02:50
such that each time somebody solves a CAPTCHA,
67
170860
2176
CAPTCHA入力の際 人間に
解かせられないかと考えたのです
02:53
they solve a little bit of this problem?
68
173060
1936
答えはイエスで それが私たちの今していることです
02:55
And the answer to that is "yes," and this is what we're doing now.
69
175020
3136
実は CAPTCHAを入力するとき 皆さんは
02:58
Nowadays, while you're typing a CAPTCHA,
70
178180
1936
人間だと証明するだけでなく
03:00
not only are you authenticating yourself as a human,
71
180140
2429
本の電子化にも貢献しているのです
03:02
but in addition you're helping us to digitize books.
72
182593
2443
その仕掛けを説明しましょう
03:05
Let me explain how this works.
73
185060
1456
本の電子化プロジェクトはいろいろあって
03:06
There's a lot of projects trying to digitize books.
74
186540
2416
グーグルもやっていますし インターネット・アーカイブでもやっています
03:08
Google has one. The Internet Archive has one.
75
188980
2136
アマゾンも今やキンドルで本を電子化しています
03:11
Amazon, with the Kindle, is trying to digitize books.
76
191140
2496
それには まず古い本を取り上げて・・・
03:13
Basically, the way this works is you start with an old book.
77
193660
3176
こういう形のあるやつですが・・・
03:16
You've seen those things, right?
78
196860
1576
あの 見たことありますよね?
03:18
Like a book?
79
198460
1216
本っていうんですけど? (笑)
03:19
(Laughter)
80
199700
1256
03:20
So you start with a book and then you scan it.
81
200980
2536
まず本を選んで それをスキャンします
本のスキャンでは
03:23
Now, scanning a book
82
203540
1216
03:24
is like taking a digital photograph of every page.
83
204780
2376
各ページのデジタル写真を撮ります
すべてのページについて
03:27
It gives you an image for every page.
84
207180
1816
文字部分を画像にするわけです
03:29
This is an image with text for every page of the book.
85
209020
2576
次にその画像の中の語を
03:31
The next step in the process is that the computer needs to be able
86
211620
3136
コンピュータで解読する必要があります
03:34
to decipher the words in this image.
87
214780
1736
そのために OCR (光学文字認識)
03:36
That's using a technology called OCR, for optical character recognition,
88
216540
3416
という技術を使います
03:39
which takes a picture of text
89
219980
1416
文字を写真に撮って
03:41
and tries to figure out what text is in there.
90
221420
2176
写真の中の文字を読み取ろうとするわけです
03:43
Now, the problem is that OCR is not perfect.
91
223620
2656
問題はOCRが完璧ではないということで
とくに文字がかすれたり
03:46
Especially for older books
92
226300
1416
03:47
where the ink has faded and the pages have turned yellow,
93
227740
3136
ページが黄色くなっているような古い本では
03:50
OCR cannot recognize a lot of the words.
94
230900
1936
OCRで読めない語がたくさん出てきます
03:52
For things that were written more than 50 years ago,
95
232860
2456
50年以上昔に印刷されたような本では
語の3割はコンピュータで読み取れません
03:55
the computer cannot recognize about 30 percent of the words.
96
235340
2856
それで私たちがやっているのは
03:58
So now we're taking all of the words that the computer cannot recognize
97
238220
3376
コンピュータで認識できなかった語を
04:01
and we're getting people to read them for us
98
241620
2256
CAPTCHAの入力をする人に
04:03
while they're typing a CAPTCHA on the Internet.
99
243900
2216
読んでもらうということです
皆さんがCAPTCHAの入力をするときに表示される文字は
04:06
So the next time you type a CAPTCHA, these words that you're typing
100
246140
3176
電子化中の本で コンピュータが
04:09
are actually words from books that are being digitized
101
249340
2576
04:11
that the computer could not recognize.
102
251940
1856
認識できなかった部分なのです
04:13
The reason we have two words nowadays instead of one
103
253820
2456
この頃では 語が1つでなく2つ
出てくるようになっていますが
04:16
is because one of the words
104
256300
1416
04:17
is a word that the system just got out of a book,
105
257740
2576
1つはシステムが本から取ってきたもので
コンピュータが読めなかったものを出しています
04:20
it didn't know what it was and it's going to present it to you.
106
260340
3016
正解を知らないので ユーザの入力が正しいのか分かりません
04:23
But since it doesn't know the answer, it cannot grade it.
107
263380
2696
それで確認のために もう1つ
04:26
So we give you another word,
108
266100
1376
04:27
for which the system does know the answer.
109
267500
2000
正解の分かっている問題を出します
04:29
We don't tell you which one's which and we say, please type both.
110
269524
3072
どっちがどっちかは言わず 両方入力してもらいます
正解の分かっている方の問題に
04:32
And if you type the correct word
111
272620
1575
正しい答えが入力されたら
04:34
for the one for which the system knows the answer,
112
274219
2377
入力しているのは人間で もう一方の入力も
04:36
it assumes you are human
113
276620
1256
04:37
and it also gets some confidence that you typed the other word correctly.
114
277900
3456
正しいだろうと期待できます
これを違う人で10回ほど繰り返して
04:41
And if we repeat this process to 10 different people
115
281380
2456
入力がすべて一致していたら
04:43
and they agree on what the new word is,
116
283860
1896
本の1語が新たに電子化されるわけです
04:45
then we get one more word digitized accurately.
117
285780
2216
それがこのシステムの仕組みです
04:48
So this is how the system works.
118
288020
1576
このシステムを公開したのは3、4年前ですが
04:49
And since we released it about three or four years ago,
119
289620
2616
すでに多くのウェブサイトが
04:52
a lot of websites have started switching from the old CAPTCHA,
120
292260
2936
時間を無駄にする古いCAPTCHAから
04:55
where people wasted their time,
121
295220
1536
本を電子化する新しいCAPTCHAに切替えています
04:56
to the new CAPTCHA where people are helping to digitize books.
122
296780
2936
だからチケットマスターでチケットを買うときも
04:59
So every time you buy tickets on Ticketmaster,
123
299740
2176
皆さんは本の電子化に貢献しているのです
05:01
you help to digitize a book.
124
301940
1376
フェイスブックで友達の追加や挨拶をするときも
05:03
Facebook: Every time you add a friend or poke somebody,
125
303340
2616
何かの本の電子化に貢献しているのです
05:05
you help to digitize a book.
126
305980
1376
ツイッターをはじめとする35万のサイトがreCAPTCHAを使っています
05:07
Twitter and about 350,000 other sites are all using reCAPTCHA.
127
307380
2936
reCAPTCHAを使っているサイトは非常に多く
05:10
And the number of sites that are using reCAPTCHA is so high
128
310340
2816
1日に電子化される語の数は相当なものになります
05:13
that the number of words we're digitizing per day is really large.
129
313180
3136
1日に1億語
05:16
It's about 100 million a day,
130
316340
1416
1年では本にして250万冊分にもなります それがすべて—
05:17
which is the equivalent of about two and a half million books a year.
131
317780
3496
1度に1語ずつ 人々によるCAPCHA入力だけで行われているのです
05:21
And this is all being done one word at a time
132
321300
2136
1度に1語ずつ 人々によるCAPCHA入力だけで行われているのです
05:23
by just people typing CAPTCHAs on the Internet.
133
323460
2216
(拍手)
05:25
(Applause)
134
325700
6880
05:32
Now, of course,
135
332940
1216
毎日それほど—
05:34
since we're doing so many words per day,
136
334180
3336
多くの語を扱っているので
おかしなことも起こります
05:37
funny things can happen.
137
337540
1256
05:38
This is especially true because now we're giving people
138
338820
2616
今はランダムに選ばれた
2つの単語を繋げて出しているので
05:41
two randomly chosen English words next to each other.
139
341460
2496
余計おかしなことが起きやすくなっています
05:43
So funny things can happen.
140
343980
1336
たとえばある時 「クリスチャン」という語が出ました
05:45
For example, we presented this word.
141
345340
1736
これ自体おかしいことは何もありませんが
05:47
It's the word "Christians"; there's nothing wrong with it.
142
347100
2736
別のランダムに選ばれた語と組み合わせると
05:49
But if you present it along with another randomly chosen word,
143
349860
2936
まずいことになり得ます
05:52
bad things can happen.
144
352820
1336
こんな風に (悪しき クリスチャン)
05:54
So we get this.
145
354180
1216
05:55
[bad Christians]
146
355420
1216
さらに不運なことに この文字が表示されたのは
05:56
But it's even worse, because the website where we showed this
147
356660
2896
たまたま「神の国の大使館」というウェブサイトでした
05:59
actually happened to be called The Embassy of the Kingdom of God.
148
359580
3056
(笑)
06:02
(Laughter)
149
362660
1696
まずっ
06:04
Oops.
150
364380
1216
06:05
(Laughter)
151
365620
3856
(笑)
もう1つまずかった例は
06:09
Here's another really bad one.
152
369500
1696
民主党議員ジョン・エドワーズのサイトです
06:11
JohnEdwards.com
153
371220
1296
06:12
[Damn liberal]
154
372540
1216
(リベラル派のサイトで「くそ リベラル」と表示されている) (笑)
06:13
(Laughter)
155
373780
4496
(リベラル派のサイトで「くそ リベラル」と表示されている) (笑)
誰彼となく侮辱して回っているわけです
06:18
So we keep on insulting people left and right everyday.
156
378300
2816
もちろん侮辱ばかりというわけではありません
06:21
Of course, we're not just insulting people.
157
381140
2016
ランダムに選んだ2つの語を出しているので
06:23
Here's the thing. Since we're presenting two randomly chosen words,
158
383180
3176
何か面白いものになることもあります
06:26
interesting things can happen.
159
386380
1456
06:27
So this actually has given rise to a really big Internet meme
160
387860
4616
実際これはインターネット上で
大きなミームになっていて
06:32
that tens of thousands of people have participated in,
161
392500
2536
何万という人がこの
「CAPTCHAアート」で遊んでいます
06:35
which is called CAPTCHA art.
162
395060
1656
06:36
I'm sure some of you have heard about it.
163
396740
1976
お聞きになったことのある人もいるでしょう
06:38
Here's how it works.
164
398740
1256
どんなことをするかというと
06:40
Imagine you're using the Internet and you see a CAPTCHA
165
400020
2616
インターネットを使っていて
06:42
that you think is somewhat peculiar,
166
402660
1736
CAPTCHAで何か変なものが出たとします
06:44
like this CAPTCHA.
167
404420
1216
たとえば 「見えない トースター」とか
06:45
[invisible toaster]
168
405660
1216
06:46
What you're supposed to do is you take a screenshot of it.
169
406900
2736
とりあえず画面コピーを取って
それからもちろん CAPTCHAの入力をします
06:49
Then of course, you fill out the CAPTCHA because you help us digitize a book.
170
409660
3656
本の電子化にまずは貢献するためです
それからCAPTCHAの画像に
06:53
But first you take a screenshot
171
413340
1496
06:54
and then you draw something that is related to it.
172
414860
2376
関連する絵を描き加えます
“見えない トースター” (笑)
06:57
(Laughter)
173
417260
1696
06:58
That's how it works.
174
418980
1216
これが遊び方です
07:00
(Laughter)
175
420220
1336
07:01
There are tens of thousands of these.
176
421580
2656
こういう作品が何十万とあります
07:04
Some of them are very cute.
177
424260
2072
中には可愛らしいのもあります
07:06
[clenched it]
178
426356
1213
“それを 握りしめた” (笑)
07:07
(Laughter)
179
427593
1843
もっと おかしいのもあります
07:09
Some of them are funnier.
180
429460
1536
“ラリってる 建国者たち” (笑)
07:11
[stoned Founders]
181
431020
1216
07:12
(Laughter)
182
432260
4376
“ラリってる 建国者たち” (笑)
07:16
And some of them, like paleontological shvisle ...
183
436660
3429
この
「古生物学的 シャベル」みたいに
07:20
(Laughter)
184
440113
1923
ラッパーが登場するやつもあります
07:22
they contain Snoop Dogg.
185
442060
1216
07:23
(Laughter)
186
443300
3136
(相棒よう 取ってくれよう そのシャベル) (笑)
07:26
OK, so this is my favorite number of reCAPTCHA.
187
446460
2576
次にこの数字は reCAPTCHAについて
私がとても嬉しく思っている点で
07:29
So this is the favorite thing that I like about this whole project.
188
449060
3176
reCAPTCHAを通して本の電子化に
07:32
This is the number of distinct people
189
452260
1816
多少なりとも貢献している人の数は
07:34
that have helped us digitize at least one word out of a book through reCAPTCHA:
190
454100
3736
7億5千万人に上ります
07:37
750 million, a little over 10 percent of the world's population,
191
457860
3056
世界人口の10%以上が
07:40
has helped us digitize human knowledge.
192
460940
1896
人類の知識のデジタル化に貢献しているのです
07:42
And it is numbers like these that motivate my research agenda.
193
462860
3096
このような大規模な数字こそが 私の研究の原動力になっています
07:45
So the question that motivates my research is the following:
194
465980
3056
こんな疑問を持ったのです
人類が達成した偉業
07:49
If you look at humanity's large-scale achievements,
195
469060
2416
人々の協力によって為された
07:51
these really big things
196
471500
1216
07:52
that humanity has gotten together and done historically --
197
472740
2715
歴史的大事業に目を向けてみると
07:55
like, for example, building the pyramids of Egypt
198
475479
2477
エジプトのピラミッドにしても
07:57
or the Panama Canal
199
477980
1576
パナマ運河にしても
07:59
or putting a man on the Moon --
200
479580
2056
月に人を送ることにしても
08:01
there is a curious fact about them,
201
481660
1696
興味深い共通点があります
08:03
and it is that they were all done with about the same number of people.
202
483380
3336
いずれも携わった人の数が同じで
不思議なことに どれも10万人によって成し遂げられているのです
08:06
It's weird; they were all done with about 100,000 people.
203
486740
2696
その理由は インターネット以前の時代には
08:09
And the reason for that is because, before the Internet,
204
489460
2656
10万より多くの人を協調させるのは
08:12
coordinating more than 100,000 people,
205
492140
1856
資金の有無にかかわらず そもそも不可能だったのです
08:14
let alone paying them, was essentially impossible.
206
494020
3016
しかしインターネットのおかげで
08:17
But now with the Internet, I've just shown you a project
207
497060
2656
人類の知識の電子データ化には
08:19
where we've gotten 750 million people to help us digitize human knowledge.
208
499740
3496
7億5千万もの人が参加しているわけです
私の研究の契機となった疑問は
08:23
So the question that motivates my research is,
209
503260
2176
10万人で月に人を送れるのなら その千倍の
08:25
if we can put a man on the Moon with 100,000,
210
505460
2136
08:27
what can we do with 100 million?
211
507620
2176
1億人では何ができるだろう ということです
08:29
So based on this question,
212
509820
1256
この疑問から出発して
08:31
we've had a lot of different projects that we've been working on.
213
511100
3056
いろんなプロジェクトに取り組みました
中でも特にワクワクしているものについてお話ししましょう
08:34
Let me tell you about one that I'm most excited about.
214
514180
2536
08:36
This is something that we've been semiquietly working on
215
516740
2656
1年半ほど密かに取り組んできて
まだ公開していませんが
08:39
for the last year and a half or so.
216
519420
1696
Duolingoという名前で
08:41
It hasn't yet been launched. It's called Duolingo.
217
521140
2376
公開前なのでどうか内密に
08:43
Since it hasn't been launched, shhh!
218
523540
1736
(笑)
08:45
(Laughter)
219
525300
1656
08:46
Yeah, I can trust you'll do that.
220
526980
2256
みなさん信頼していますから
このプロジェクトが始まったのは
08:49
So this is the project. Here's how it started.
221
529260
2216
院生のセベリン・ハッカーに
08:51
It started with me posing a question to my graduate student, Severin Hacker.
222
531500
3576
ある問いを投げかけたときでした
これがセベリン・ハッカー
08:55
OK, that's Severin Hacker.
223
535100
1280
私のところの院生です
08:57
So I posed the question to my graduate student.
224
537299
2217
ちなみに聞き間違いじゃなく
08:59
By the way, you did hear me correctly; his last name is Hacker.
225
539540
2976
本当に「ハッカー」という名字なんです
09:02
(Laughter)
226
542540
1016
私は彼に聞きました
09:03
So I posed this question to him: How can we get 100 million people
227
543580
3296
「1億人を使って ウェブを無料で
09:06
translating the web into every major language for free?
228
546900
2960
各主要言語に翻訳しようと思ったら どうすればいい?」
この質問にはいろいろ考えるべきことがあります
09:10
There's a lot of things to say about this question.
229
550500
2416
第一にまず ウェブを翻訳するということ
09:12
First of all, translating the web.
230
552940
1656
現在ウェブでは様々な言語が使われていますが
09:14
Right now, the web is partitioned into multiple languages.
231
554620
2796
大きな部分を英語が占めています
09:17
A large fraction of it is in English.
232
557440
1816
英語を知らなければ その情報にアクセスはできません
09:19
If you don't know English, you can't access it.
233
559280
2216
しかし他の言語の部分もたくさんあって
09:21
But there's large fractions in other different languages,
234
561520
2696
その言語を知らなければ それにアクセスすることはできません
09:24
and if you don't know them, you can't access it.
235
564240
2256
だからウェブの全体 少なくともその大部分を
09:26
So I would like to translate all of the web,
236
566520
2096
09:28
or at least most of it, into every major language.
237
568640
2376
主要なすべての言語に翻訳したい
それが私のやりたいことです
09:31
That's what I would like to do.
238
571040
1496
09:32
Now, some of you may say, why can't we use computers to translate?
239
572560
4476
コンピュータで翻訳したらいいと思う人もいるかもしれません
機械翻訳でいいのでは?
09:37
Machine translation is starting to translate
240
577060
2096
今や方々で機械翻訳が使われるようになっています
09:39
some sentences here and there.
241
579180
1456
ウェブ全体をそれで訳してしまったら?
09:40
Why can't we use it to translate the web?
242
580660
1976
問題は 精度が不十分だということです
09:42
The problem with that is it's not yet good enough
243
582660
2336
この先15〜20年は駄目でしょう
09:45
and it probably won't be for the next 15 to 20 years.
244
585020
2496
たくさんの間違いをします
09:47
It makes a lot of mistakes. Even when it doesn't,
245
587540
2336
仮に間違っていなかったとしても
09:49
since it makes so many mistakes, you don't know whether to trust it or not.
246
589900
3576
いつも間違ってばかりいるので 信頼していいのか分かりません
機械で翻訳されたものがどんなものか
09:53
So let me show you an example
247
593500
1416
09:54
of something that was translated with a machine.
248
594940
2256
例をお見せしましょう
これはあるフォーラムの投稿で
09:57
Actually, it was a forum post.
249
597220
1456
09:58
It was somebody who was trying to ask a question about JavaScript.
250
598700
3176
JavaScriptについての質問をしています
10:01
It was translated from Japanese into English.
251
601900
2616
日本語から英語に機械翻訳されています
10:04
So I'll just let you read.
252
604540
1776
読んで頂ければと思いますが
10:06
This person starts apologizing
253
606340
1776
この人は最初に
10:08
for the fact that it's translated with a computer.
254
608140
2456
機械翻訳であることを謝っています
10:10
So the next sentence is going to be the preamble to the question.
255
610620
3776
次の文は質問の前置きで
何かの説明をしています
10:14
So he's just explaining something.
256
614420
1656
JavaScriptの質問だということをお忘れなく
10:16
Remember, it's a question about JavaScript.
257
616100
2056
10:18
[At often, the goat-time install a error is vomit.]
258
618180
2616
(よくヤギ時にインストールするエラーがゲロになります)
10:20
(Laughter)
259
620820
5096
(笑)
10:25
Then comes the first part of the question.
260
625940
3536
それから質問の最初の部分が来ます
10:29
[How many times like the wind, a pole, and the dragon?]
261
629500
2936
(風や竿やドラゴンのようになるのは何回ですか?)
10:32
(Laughter)
262
632460
4656
(笑)
次は私のお気に入りの部分です
10:37
Then comes my favorite part of the question.
263
637140
2056
10:39
[This insult to father's stones?]
264
639220
1936
(これは父の石への侮辱でしょうか?)
10:41
(Laughter)
265
641180
3856
(笑)
そして最後が極めつけです
10:45
And then comes the ending,
266
645060
1296
10:46
which is my favorite part of the whole thing.
267
646380
2136
(あなたの愚かさを謝ってください ありがとうがいっぱいです)
10:48
[Please apologize for your stupidity. There are a many thank you.]
268
648540
3136
10:51
(Laughter)
269
651700
2176
(笑)
10:53
OK, so computer translation, not yet good enough.
270
653900
2936
機械翻訳は まだ不十分だということです
元の話に戻りましょう
10:56
So back to the question.
271
656860
1256
ウェブ全体の翻訳をしてくれる人が必要です
10:58
So we need people to translate the whole web.
272
658140
2976
さて次の疑問は「別にタダでなくても
11:01
So now the next question you may have is,
273
661140
1976
いいのでは?」ということでしょう
11:03
well, why can't we just pay people to do this?
274
663140
2176
ウェブ全体をプロの翻訳家にお金を払って翻訳してもらえばいい
11:05
We could pay professional translators to translate the whole web.
275
665340
3096
そうしてもいいかもしれませんが
11:08
We could do that.
276
668460
1256
11:09
Unfortunately, it would be extremely expensive.
277
669740
2216
あいにくと ものすごくお金がかかります
11:11
For example, translating a tiny fraction of the whole web, Wikipedia,
278
671980
3256
たとえば巨大なウェブ全体からすればほんの小さな部分
ウィキペディアの英語版をスペイン語に訳すとしましょう
11:15
into one other language, Spanish.
279
675260
2496
11:17
OK? Wikipedia exists in Spanish,
280
677780
1976
ウィキペディアにはスペイン語版もありますが
11:19
but it's very small compared to the size of English.
281
679780
2456
英語版にくらべたらずっと小さく
サイズにして20%くらいしかありません
11:22
It's about 20 percent of the size of English.
282
682260
2176
残りの80%をスペイン語に翻訳しようと思ったら
11:24
If we wanted to translate the other 80 percent into Spanish,
283
684460
2856
少なくとも5千万ドルはかかります
11:27
it would cost at least 50 million dollars --
284
687340
2136
甚だしく搾取された国にアウトソースした場合でそうなんです
11:29
and this is even at the most exploited, outsourcing country out there.
285
689500
3656
プロの翻訳というのは高くつくのです
11:33
So it would be very expensive.
286
693180
1456
それで私たちがやろうとしているのは
11:34
So what we want to do is, we want to get 100 million people
287
694660
2762
ウェブの各言語への翻訳を 1億人の人に
11:37
translating the web into every major language for free.
288
697446
2590
タダでやってもらうということです
そうしたときにすぐ直面する
11:40
If this is what you want to do, you quickly realize
289
700060
2416
大きな壁が
11:42
you're going to run into two big hurdles, two big obstacles.
290
702500
2936
2つあります
11:45
The first one is a lack of bilinguals.
291
705460
3296
1つはバイリンガルの不足です
11:48
So I don't even know
292
708780
2176
インターネット利用者に
11:50
if there exists 100 million people out there using the web
293
710980
2736
翻訳ができるほどのバイリンガルが
11:53
who are bilingual enough to help us translate.
294
713740
2296
そもそも1億人もいるのか分かりません
これは大きな問題です
11:56
That's a big problem.
295
716060
1216
11:57
The other problem you're going to run into is a lack of motivation.
296
717300
3176
もう1つの問題は動機付けの欠如です
どうすればウェブをタダで翻訳するよう
12:00
How are we going to motivate people to actually translate the web for free?
297
720500
3536
動機付けられるのか?
通常はお金を出して翻訳してもらいます
12:04
Normally, you have to pay people to do this.
298
724060
2296
12:06
So how are we going to motivate them to do it for free?
299
726380
2616
どうすればタダでやりたくなるのか?
ウェブの翻訳を考え始めてすぐ この2つの問題にぶつかりました
12:09
When we were starting to think about this, we were blocked by these two things.
300
729020
3736
それから 2つの問題を同時に解決できる
12:12
But then we realized, there's a way
301
732780
1696
方法があることに気づきました
12:14
to solve both these problems with the same solution.
302
734500
2456
一石二鳥の方法があるのです
12:16
To kill two birds with one stone.
303
736980
1616
翻訳を 何億という人がやりたがることに変え
12:18
And that is to transform language translation
304
738620
2136
12:20
into something that millions of people want to do
305
740780
2816
それがバイリンガル不足の問題の
12:23
and that also helps with the problem of lack of bilinguals,
306
743620
3136
解決にもなるということ
12:26
and that is language education.
307
746780
2376
それは語学教育です
12:29
So it turns out that today,
308
749180
1976
今日 外国語を学習している人は
12:31
there are over 1.2 billion people learning a foreign language.
309
751180
3400
12億人以上います
みんな本当に外国語を学びたがっているのです
12:35
People really want to learn a foreign language.
310
755300
2216
学校で勉強させられるからというばかりではありません
12:37
And it's not just because they're being forced to do so in school.
311
757540
3136
たとえばアメリカだけでも
12:40
In the US alone, there are over five million people
312
760700
2416
外国語学習ソフトに500ドル以上使う人が
12:43
who have paid over $500 for software to learn a new language.
313
763140
2896
5百万人以上います
みんな本当に外国語を習いたがっているのです
12:46
So people really want to learn a new language.
314
766060
2176
それで私たちがこの1年半取り組んできたのは
12:48
So what we've been working on for the last year and a half
315
768260
2736
Duolingoというウェブサイトで
12:51
is a new website -- it's called Duolingo --
316
771020
2056
その基本的な仕組みは みんなが外国語をタダで学び
12:53
where the basic idea is people learn a new language for free
317
773100
2856
12:55
while simultaneously translating the web.
318
775980
2056
同時にウェブの翻訳もするということです
つまり実践を通して学ぶわけです
12:58
And so basically, they're learning by doing.
319
778060
2536
初心者に対しては
13:00
So the way this works
320
780620
1216
13:01
is whenever you're a just a beginner, we give you very simple sentences.
321
781860
3416
ごく単純な文を提示します
ウェブにはもちろん使える文がふんだんにあります
13:05
There's a lot of very simple sentences on the web.
322
785300
2376
すごく単純な文と
13:07
We give you very simple sentences along with what each word means.
323
787700
3216
それぞれの単語の意味が提示されます
13:10
And as you translate them
324
790940
1336
翻訳しながら 他の人はどう訳しているか見て
13:12
and as you see how other people translate them,
325
792300
2216
外国語を学んでいきます
13:14
you start learning the language.
326
794540
1576
上達するにつれ
13:16
And as you get more advanced,
327
796140
1416
13:17
we give you more complex sentences to translate.
328
797580
2256
より複雑な文が提示されるようになります
13:19
But at all times, you're learning by doing.
329
799860
2016
しかし実践して学ぶという点はいつも変わりません
13:21
Now, the crazy thing about this method is that it actually really works.
330
801900
3696
この方法の何がすごいかというと
実際非常によく機能するということです
13:25
People are really learning a language.
331
805620
1856
何より みんな本当に外国語を学びたがっています
13:27
We're mostly done building it and now we're testing it.
332
807500
2616
システム構築が済んで テスト中ですが
本当に外国語を学ぶことができます
13:30
People really can learn a language with it.
333
810140
2056
優れた外国語学習ソフトを使った場合に劣らず上達し
13:32
And they learn it about as well as the leading language learning software.
334
812220
3496
本当に外国語を身に付けているのです
13:35
So people really do learn a language.
335
815740
1816
しかも同様に上達できるだけではありません
13:37
And not only do they learn it as well, but actually it's more interesting.
336
817580
3496
はるかに楽しく学べるのです
Duolingoでは本物のコンテンツを使って学ぶからです
13:41
Because with Duolingo, people are learning with real content.
337
821100
2896
作り物の文章で学ぶのではなく
13:44
As opposed to learning with made-up sentences,
338
824020
2176
本物のコンテンツで学ぶ方が 本質的に興味深いものですし
13:46
people are learning with real content, which is inherently interesting.
339
826220
3336
本当に外国語を学ぶことができます
13:49
So people really do learn a language.
340
829580
1816
それだけでなく さらに驚くのは
13:51
But perhaps more surprisingly,
341
831420
1616
このサイトから得られる翻訳は
13:53
the translations that we get from people using the site,
342
833060
2736
13:55
even though they're just beginners,
343
835820
1776
彼らが初心者であるにもかかわらず
13:57
the translations that we get
344
837620
1376
プロの翻訳者に劣らず正確だということで
13:59
are as accurate as those of professional language translators,
345
839020
2936
驚くほどです
14:01
which is very surprising.
346
841980
1216
例をお見せしましょう
14:03
So let me show you one example.
347
843220
1536
14:04
This is a sentence that was translated from German into English.
348
844780
3016
これはドイツ語から英語に翻訳された文章です
一番上がドイツ語
14:07
The top is the German. The middle is an English translation
349
847820
2776
真ん中が
14:10
that was done by a professional translator
350
850620
2256
プロの翻訳家による英訳で
14:12
who we paid 20 cents a word for this translation.
351
852900
2376
1語につき20セント払っています
一番下がDuolingoユーザによる英訳で
14:15
And the bottom is a translation by users of Duolingo,
352
855300
2696
彼らは元々
14:18
none of whom knew any German before they started using the site.
353
858020
3736
ドイツ語は全く知りませんでした
14:21
If you can see, it's pretty much perfect.
354
861780
1976
ほとんど完璧なことがお分かりになると思います
14:23
Of course, we play a trick here
355
863780
1536
プロの翻訳家並の翻訳にするため
14:25
to make the translations as good as professional language translators.
356
865340
3336
ちょっとした仕掛けをしてあります
複数の初心者の翻訳から良い所を取って
14:28
We combine the translations of multiple beginners
357
868700
2336
組み合わせているのです
14:31
to get the quality of a single professional translator.
358
871060
2896
14:33
Now, even though we're combining the translations,
359
873980
4536
しかし組み合わせているのにかかわらず
14:38
the site actually can translate pretty fast.
360
878540
2776
このサイトでは翻訳を非常に早く行えます
それでウィキペディアを英語から
14:41
So let me show you,
361
881340
1216
14:42
this is our estimates of how fast we could translate Wikipedia
362
882580
2936
スペイン語に翻訳するのにかかる時間を
見積もってみました
14:45
from English into Spanish.
363
885540
1296
14:46
Remember, this is 50 million dollars' worth of value.
364
886860
2976
これは5千万ドルに値する仕事だということを思い出してください
14:49
So if we wanted to translate Wikipedia into Spanish,
365
889860
2456
ウィキペディアをスペイン語に訳すには
アクティブユーザ10万人なら5週間でできます
14:52
we could do it in five weeks with 100,000 active users.
366
892340
2696
アクティブユーザ百万人なら80時間です
14:55
And we could do it in about 80 hours with a million active users.
367
895060
3056
これまで私のプロジェクトはどれも数百万のユーザを得ていたので
14:58
Since all the projects my group has worked on so far
368
898140
2456
15:00
have gotten millions of users,
369
900620
1456
このプロジェクトでも非常に早い翻訳が
15:02
we're hopeful that we'll be able to translate extremely fast.
370
902100
2896
できるようになると期待しています
Duolingoの最も刺激的な点は
15:05
Now, the thing that I'm most excited about with Duolingo
371
905020
2976
語学教育に公平さをもたらすビジネスモデルだということです
15:08
is I think this provides a fair business model for language education.
372
908020
3736
何が問題だったかというと
15:11
So here's the thing:
373
911780
1216
今までの語学教育のビジネスモデルは
15:13
The current business model for language education
374
913020
2336
学習者にお金を払わせるということです
15:15
is the student pays,
375
915380
1376
15:16
and in particular, the student pays Rosetta Stone 500 dollars.
376
916780
3056
つまり ロゼッタストーンに500ドル払うわけです
(笑)
15:19
(Laughter)
377
919860
1816
それが現在のビジネスモデルです
15:21
That's the current business model.
378
921700
1656
このモデルが問題なのは
15:23
The problem with this business model
379
923380
1736
世界の人口の95%は500ドル払うことができないからです
15:25
is that 95 percent of the world's population doesn't have 500 dollars.
380
925140
3296
貧しい人たちにはとても不公平な
15:28
So it's extremely unfair towards the poor.
381
928460
2776
お金持ち向けに特化したモデルです
15:31
This is totally biased towards the rich.
382
931260
1936
一方Duolingoでは
15:33
Now, see, in Duolingo,
383
933220
1616
15:34
because while you learn, you're actually creating value,
384
934860
3656
学びながら翻訳をして
価値を生み出すので
15:38
you're translating stuff --
385
938540
1336
15:39
which, for example, we could charge somebody for translations,
386
939900
2936
たとえば どこかに翻訳料を払ってもらうこともでき
15:42
so this is how we could monetize this.
387
942860
1856
それが収益を得る方法になります
15:44
Since people are creating value while they're learning,
388
944740
2616
学習者は学習しながら価値を生んでいるので
授業料は必要ありません 時間で支払っているのですから
15:47
they don't have to pay with their money, they pay with their time.
389
947380
3096
そして その時間にしても 語学学習にはどの道必要なもので
15:50
But the magical thing here
390
950500
1923
15:52
is that is time that would have had to have been spent anyways
391
952447
2996
時間を余計無駄にするわけではない
というのが素晴らしいところです
15:55
learning the language.
392
955467
1209
15:56
So the nice thing about Duolingo
393
956700
1576
貧しい人の不利にならないフェアなモデルというのが
15:58
is, I think, it provides a fair business model --
394
958300
2336
Duolingoの優れたところです
16:00
one that doesn't discriminate against poor people.
395
960660
2376
これがDuolingoのアドレスです
16:03
So here's the site. Thank you.
396
963060
1456
(拍手)
16:04
(Applause)
397
964540
7000
このサイトは正式公開前ですが
16:13
We haven't yet launched,
398
973060
2416
ここに来れば
16:15
but if you go there, you can sign up to be part of our private beta,
399
975500
3296
非公開ベータへの参加申し込みができます
16:18
which is probably going to start in three or four weeks.
400
978820
2656
3、4週間以内には開始されるでしょう
Duolingoの開始をお待ちください
16:21
We haven't yet launched it.
401
981500
1336
16:22
By the way, I'm the one talking here,
402
982860
1816
ここでお話ししているのは私ひとりですが
16:24
but Duolingo is the work of a really awesome team,
403
984700
2376
Duolingoの開発は ここに挙げた人をはじめとする優れたチームによって行われています
16:27
some of whom are here. So thank you.
404
987100
1736
どうもありがとうございました
16:28
(Applause)
405
988860
5240
(拍手)
このウェブサイトについて

このサイトでは英語学習に役立つYouTube動画を紹介します。世界中の一流講師による英語レッスンを見ることができます。各ビデオのページに表示される英語字幕をダブルクリックすると、そこからビデオを再生することができます。字幕はビデオの再生と同期してスクロールします。ご意見・ご要望がございましたら、こちらのお問い合わせフォームよりご連絡ください。

https://forms.gle/WvT1wiN1qDtmnspy7