下の英語字幕をダブルクリックすると動画を再生できます。
翻訳: Yasushi Aoki
校正: Tadashi Koyama
00:14
Let me show you something.
0
14366
3738
まずこのビデオを
ご覧ください
00:18
(Video) Girl: Okay, that's a cat
sitting in a bed.
1
18104
4156
(女の子の声) ネコがベッドに座ってる
00:22
The boy is petting the elephant.
2
22260
4040
男の子が象をなでてる
00:26
Those are people
that are going on an airplane.
3
26300
4354
飛行機へ行く人たち
00:30
That's a big airplane.
4
30654
2810
大きな飛行機よ
00:33
Fei-Fei Li: This is
a three-year-old child
5
33464
2206
(講演者) これは3歳児が
00:35
describing what she sees
in a series of photos.
6
35670
3679
見た写真を
説明しているところです
00:39
She might still have a lot
to learn about this world,
7
39349
2845
彼女にはこの世界で学ぶことが
まだまだあるかもしれませんが
00:42
but she's already an expert
at one very important task:
8
42194
4549
ひとつの重要な作業については
すでにエキスパートです
00:46
to make sense of what she sees.
9
46743
2846
見たものを理解する
ということです
00:50
Our society is more
technologically advanced than ever.
10
50229
4226
私たちの社会は技術的に
かつてなく進歩しています
00:54
We send people to the moon,
we make phones that talk to us
11
54455
3629
月へと人を送り込み
人に話しかける電話を作り
00:58
or customize radio stations
that can play only music we like.
12
58084
4946
自分の好きな曲だけがかかるように
ラジオをカスタマイズしています
01:03
Yet, our most advanced
machines and computers
13
63030
4055
しかしながら最先端の
コンピュータでも
01:07
still struggle at this task.
14
67085
2903
まだこの作業には
手こずっているんです
01:09
So I'm here today
to give you a progress report
15
69988
3459
私は今日コンピュータビジョンの
01:13
on the latest advances
in our research in computer vision,
16
73447
4047
最新動向について
お伝えするために来ました
01:17
one of the most frontier
and potentially revolutionary
17
77494
4161
これはコンピュータサイエンスの中でも
先端にあって
01:21
technologies in computer science.
18
81655
3206
画期的なものになる
可能性のある技術です
01:24
Yes, we have prototyped cars
that can drive by themselves,
19
84861
4551
自分で運転する車の
プロトタイプが作られていますが
01:29
but without smart vision,
they cannot really tell the difference
20
89412
3853
知的な視覚処理能力がなかったら
01:33
between a crumpled paper bag
on the road, which can be run over,
21
93265
3970
踏みつぶしても問題のない
道路上の丸めた紙袋と
01:37
and a rock that size,
which should be avoided.
22
97235
3340
避けて通るべき同じ大きさの石とを
見分けることもできません
01:41
We have made fabulous megapixel cameras,
23
101415
3390
すごいメガピクセルの
カメラが作られていますが
01:44
but we have not delivered
sight to the blind.
24
104805
3135
盲目の人に視力を与えることは
できていません
01:48
Drones can fly over massive land,
25
108420
3305
無人機を広大な土地の上に
飛ばすことはできても
01:51
but don't have enough vision technology
26
111725
2134
熱帯雨林の変化を
追跡できるだけの
01:53
to help us to track
the changes of the rainforests.
27
113859
3461
画像技術はまだありません
01:57
Security cameras are everywhere,
28
117320
2950
監視カメラが至る所に
設置されていますが
02:00
but they do not alert us when a child
is drowning in a swimming pool.
29
120270
5067
プールで溺れている子がいても
警告してはくれません
02:06
Photos and videos are becoming
an integral part of global life.
30
126167
5595
写真やビデオは世界において
生活に不可欠な一部をなしています
02:11
They're being generated at a pace
that's far beyond what any human,
31
131762
4087
どんな個人であれ チームであれ
見切れないほどのペースで
02:15
or teams of humans, could hope to view,
32
135849
2783
映像が量産されています
02:18
and you and I are contributing
to that at this TED.
33
138632
3921
そして私たちも ここTEDで
それに貢献しています
02:22
Yet our most advanced software
is still struggling at understanding
34
142553
5232
しかし最も進んだ
ソフトウェアでさえ
この膨大な映像を理解し管理するのに
手こずっています
02:27
and managing this enormous content.
35
147785
3876
02:31
So in other words,
collectively as a society,
36
151661
5272
言ってみれば
私たちの社会は
集合的に盲目であり
02:36
we're very much blind,
37
156933
1746
それは最も知的な機械が
いまだ盲目だからです
02:38
because our smartest
machines are still blind.
38
158679
3387
02:43
"Why is this so hard?" you may ask.
39
163526
2926
なぜそんなに難しいのかと
思うかもしれません
02:46
Cameras can take pictures like this one
40
166452
2693
カメラはこのような写真を撮って
02:49
by converting lights into
a two-dimensional array of numbers
41
169145
3994
光をピクセルと呼ばれる
数字の2次元配列へと
変換しますが
02:53
known as pixels,
42
173139
1650
02:54
but these are just lifeless numbers.
43
174789
2251
これは死んだ数字の列に
過ぎません
02:57
They do not carry meaning in themselves.
44
177040
3111
数字自体に意味はありません
単に音が耳に入ってくるのと
「聴く」のとは違うように
03:00
Just like to hear is not
the same as to listen,
45
180151
4343
03:04
to take pictures is not
the same as to see,
46
184494
4040
「写真を撮る」のと「見る」のとは
同じではありません
03:08
and by seeing,
we really mean understanding.
47
188534
3829
「見る」ということには
理解することが含まれているのです
03:13
In fact, it took Mother Nature
540 million years of hard work
48
193293
6177
実際この仕事を
成し遂げられるようにするために
母なる自然は 5億4千万年という
長い歳月を必要としたのです
03:19
to do this task,
49
199470
1973
03:21
and much of that effort
50
201443
1881
そしてその努力の多くは
03:23
went into developing the visual
processing apparatus of our brains,
51
203324
5271
目そのものではなく
脳の視覚処理能力を発達させるために
費やされました
03:28
not the eyes themselves.
52
208595
2647
03:31
So vision begins with the eyes,
53
211242
2747
視覚というのは
目から始まりますが
03:33
but it truly takes place in the brain.
54
213989
3518
それが本当に起きているのは
脳の中なのです
03:38
So for 15 years now, starting
from my Ph.D. at Caltech
55
218287
5060
これまで15年間
カリフォルニア工科大学の博士課程の頃から
スタンフォード大でコンピュータビジョン研究室を
率いている今に到るまで
03:43
and then leading Stanford's Vision Lab,
56
223347
2926
03:46
I've been working with my mentors,
collaborators and students
57
226273
4396
私は指導教官や共同研究者や
学生達とともに
03:50
to teach computers to see.
58
230669
2889
コンピュータに見ることを
教えようとしてきました
03:54
Our research field is called
computer vision and machine learning.
59
234658
3294
私たちの研究領域は
コンピュータビジョンと機械学習で
03:57
It's part of the general field
of artificial intelligence.
60
237952
3878
これは人工知能の分野の一部です
04:03
So ultimately, we want to teach
the machines to see just like we do:
61
243000
5493
最終的に私たちがしたいのは
機械も人間のようにものを見られるようにすることです
04:08
naming objects, identifying people,
inferring 3D geometry of things,
62
248493
5387
物が何か言い当て 人を識別し
3次元的な配置を推量し
04:13
understanding relations, emotions,
actions and intentions.
63
253880
5688
関係や感情や行動や意図を
理解するということです
04:19
You and I weave together entire stories
of people, places and things
64
259568
6153
私たち人間は一目見ただけで
人 場所 物の織りなす物語全体を
捉えることができます
04:25
the moment we lay our gaze on them.
65
265721
2164
04:28
The first step towards this goal
is to teach a computer to see objects,
66
268955
5583
この目標に向けた第一歩は
コンピュータに視覚世界の構成要素である物を
見られるようにすることです
04:34
the building block of the visual world.
67
274538
3368
04:37
In its simplest terms,
imagine this teaching process
68
277906
4434
簡単に言うと
ネコのような特定の物の
04:42
as showing the computers
some training images
69
282340
2995
訓練用画像を
コンピュータに与えて
04:45
of a particular object, let's say cats,
70
285335
3321
04:48
and designing a model that learns
from these training images.
71
288656
4737
それらの画像から学習する
モデルを設計するんです
04:53
How hard can this be?
72
293393
2044
簡単そうに聞こえますよね?
04:55
After all, a cat is just
a collection of shapes and colors,
73
295437
4052
ネコの画像は色と形の
集まりに過ぎません
04:59
and this is what we did
in the early days of object modeling.
74
299489
4086
これは初期のオブジェクト・モデリングで
私たちがやっていたことでした
05:03
We'd tell the computer algorithm
in a mathematical language
75
303575
3622
数学的な言語を使って
コンピュータアルゴリズムに
05:07
that a cat has a round face,
a chubby body,
76
307197
3343
ネコには 丸い顔と
ぽっちゃりした体と
05:10
two pointy ears, and a long tail,
77
310540
2299
2つのとがった耳と
長いしっぽがあると教え
05:12
and that looked all fine.
78
312839
1410
それでうまくいきそうでした
05:14
But what about this cat?
79
314859
2113
でもこのネコはどうでしょう?
05:16
(Laughter)
80
316972
1091
(笑)
05:18
It's all curled up.
81
318063
1626
体がすっかり反り返っています
05:19
Now you have to add another shape
and viewpoint to the object model.
82
319689
4719
オブジェクトモデルに新しい形と視点を
追加する必要があります
05:24
But what if cats are hidden?
83
324408
1715
でもネコが一部隠れていたら
どうでしょう?
05:27
What about these silly cats?
84
327143
2219
このおかしなネコたちはどうでしょう?
05:31
Now you get my point.
85
331112
2417
言いたいこと分かりますよね?
05:33
Even something as simple
as a household pet
86
333529
3367
身近なペットのネコという
シンプルなものでさえ
05:36
can present an infinite number
of variations to the object model,
87
336896
4504
オブジェクトモデルに
無数のバリエーションを定義する必要があり
05:41
and that's just one object.
88
341400
2233
しかもこれは沢山あるものの
1つに過ぎないんです
05:44
So about eight years ago,
89
344573
2492
8年ほど前
05:47
a very simple and profound observation
changed my thinking.
90
347065
5030
とてもシンプルながら本質的なある観察が
私の考え方を変えました
05:53
No one tells a child how to see,
91
353425
2685
子供は教えられなくても
成長の初期に
ものの見方を身に付けるということです
05:56
especially in the early years.
92
356110
2261
05:58
They learn this through
real-world experiences and examples.
93
358371
5000
子供は現実の世界における
経験と例を通して学ぶのです
06:03
If you consider a child's eyes
94
363371
2740
子供の目が
生きたカメラで
200ミリ秒ごとに1枚
06:06
as a pair of biological cameras,
95
366111
2554
06:08
they take one picture
about every 200 milliseconds,
96
368665
4180
写真を撮っていると
考えてみましょう
06:12
the average time an eye movement is made.
97
372845
3134
これは目が動く
平均時間です
06:15
So by age three, a child would have seen
hundreds of millions of pictures
98
375979
5550
すると子供は3歳になるまでに
何億枚という
現実世界の写真を
見ていることになります
06:21
of the real world.
99
381529
1834
06:23
That's a lot of training examples.
100
383363
2280
膨大な量の訓練例です
06:26
So instead of focusing solely
on better and better algorithms,
101
386383
5989
それで気が付いたのは
アルゴリズムの改良ばかりに集中するのではなく
06:32
my insight was to give the algorithms
the kind of training data
102
392372
5272
子供が経験を通じて
受け取るような
06:37
that a child was given through experiences
103
397644
3319
量と質の訓練データを
06:40
in both quantity and quality.
104
400963
3878
アルゴリズムに与えてはどうか
ということでした
06:44
Once we know this,
105
404841
1858
このことに気付いた時
06:46
we knew we needed to collect a data set
106
406699
2971
私たちが持っているよりも
遙かに多くの画像データを
06:49
that has far more images
than we have ever had before,
107
409670
4459
集めなければならないことが
明らかでした
06:54
perhaps thousands of times more,
108
414129
2577
何千倍も必要です
06:56
and together with Professor
Kai Li at Princeton University,
109
416706
4111
それで私はプリンストン大学の
カイ・リー教授と一緒に
07:00
we launched the ImageNet project in 2007.
110
420817
4752
2007年にImageNetプロジェクトを
立ち上げました
07:05
Luckily, we didn't have to mount
a camera on our head
111
425569
3838
幸い私たちは
頭にカメラを付けて
07:09
and wait for many years.
112
429407
1764
何年も歩き回る必要は
ありませんでした
07:11
We went to the Internet,
113
431171
1463
人類がかつて作った
最大の画像の宝庫
07:12
the biggest treasure trove of pictures
that humans have ever created.
114
432634
4436
インターネットに
向かったのです
07:17
We downloaded nearly a billion images
115
437070
3041
私たちは10億枚近い画像を
ダウンロードし
07:20
and used crowdsourcing technology
like the Amazon Mechanical Turk platform
116
440111
5880
アマゾン・メカニカル・タークのような
クラウドソーシング技術を使って
07:25
to help us to label these images.
117
445991
2339
それらの画像に
ラベル付けをしました
07:28
At its peak, ImageNet was one of
the biggest employers
118
448330
4900
最盛期にはImageNetは
アマゾン・メカニカル・ターク作業者の
07:33
of the Amazon Mechanical Turk workers:
119
453230
2996
最大の雇用者の1つに
なっていました
07:36
together, almost 50,000 workers
120
456226
3854
167カ国の
07:40
from 167 countries around the world
121
460080
4040
5万人近い作業者が
07:44
helped us to clean, sort and label
122
464120
3947
10億枚近い画像を
整理しラベル付けする作業に
07:48
nearly a billion candidate images.
123
468067
3575
携わりました
07:52
That was how much effort it took
124
472612
2653
子供がその成長の初期に
受け取るのに
07:55
to capture even a fraction
of the imagery
125
475265
3900
匹敵する量の画像を
用意するためには
07:59
a child's mind takes in
in the early developmental years.
126
479165
4171
それほどの労力が
必要だったのです
08:04
In hindsight, this idea of using big data
127
484148
3902
コンピュータアルゴリズムの訓練に
ビッグデータを使うというアイデアは
08:08
to train computer algorithms
may seem obvious now,
128
488050
4550
今からすると
自明なものに見えるでしょうが
08:12
but back in 2007, it was not so obvious.
129
492600
4110
2007年当時は
そうではありませんでした
08:16
We were fairly alone on this journey
for quite a while.
130
496710
3878
かなり長い間 こんなことをやっている人は
私たち以外にいませんでした
08:20
Some very friendly colleagues advised me
to do something more useful for my tenure,
131
500588
5003
親切な同僚が将来の職のためにもう少し有用なことを
した方がいいとアドバイスしてくれたくらいです
08:25
and we were constantly struggling
for research funding.
132
505591
4342
研究資金には
いつも困っていました
08:29
Once, I even joked to my graduate students
133
509933
2485
ImageNetの資金調達のために
クリーニング屋をまた開こうかしらと
08:32
that I would just reopen
my dry cleaner's shop to fund ImageNet.
134
512418
4063
学生に冗談で言ったくらいです
08:36
After all, that's how I funded
my college years.
135
516481
4761
私が学生の頃 学費のために
やっていたことです
08:41
So we carried on.
136
521242
1856
私たちは進み続け
08:43
In 2009, the ImageNet project delivered
137
523098
3715
2009年に
ImageNetプロジェクトは
08:46
a database of 15 million images
138
526813
4042
日常的な英語を使って
2万2千のカテゴリに分類した
08:50
across 22,000 classes
of objects and things
139
530855
4805
1500万枚の画像の
データベースを
08:55
organized by everyday English words.
140
535660
3320
完成させました
08:58
In both quantity and quality,
141
538980
2926
これは量という点でも
質という点でも
09:01
this was an unprecedented scale.
142
541906
2972
かつてないスケールのものでした
09:04
As an example, in the case of cats,
143
544878
3461
一例を挙げると
ネコの画像は
6万2千点以上あって
09:08
we have more than 62,000 cats
144
548339
2809
09:11
of all kinds of looks and poses
145
551148
4110
様々な見かけや
ポーズのネコがいて
09:15
and across all species
of domestic and wild cats.
146
555258
5223
飼い猫から山猫まで
あらゆる種類を網羅しています
09:20
We were thrilled
to have put together ImageNet,
147
560481
3344
私たちはImageNetが
できあがったことを喜び
09:23
and we wanted the whole research world
to benefit from it,
148
563825
3738
世界の研究者にも
その恩恵を受けて欲しいと思い
09:27
so in the TED fashion,
we opened up the entire data set
149
567563
4041
TEDの流儀で
データセットをまるごと
09:31
to the worldwide
research community for free.
150
571604
3592
無償で世界の研究者コミュニティに
公開しました
(拍手)
09:36
(Applause)
151
576636
4000
09:41
Now that we have the data
to nourish our computer brain,
152
581416
4538
こうしてコンピュータの脳を
育てるためのデータができ
09:45
we're ready to come back
to the algorithms themselves.
153
585954
3737
アルゴリズムに取り組む
用意が整いました
09:49
As it turned out, the wealth
of information provided by ImageNet
154
589691
5178
それで分かったのは
ImageNetが提供する豊かな情報に適した
09:54
was a perfect match to a particular class
of machine learning algorithms
155
594869
4806
機械学習アルゴリズムがあることです
09:59
called convolutional neural network,
156
599675
2415
畳み込みニューラルネットワークと言って
10:02
pioneered by Kunihiko Fukushima,
Geoff Hinton, and Yann LeCun
157
602090
5248
福島邦彦 ジェフリー・ヒントン
ヤン・ルカンといった人たちが
10:07
back in the 1970s and '80s.
158
607338
3645
1970年代から1980年代にかけて
開拓した領域です
10:10
Just like the brain consists
of billions of highly connected neurons,
159
610983
5619
脳が何十億という高度に結合し合った
ニューロンからできているように
10:16
a basic operating unit in a neural network
160
616602
3854
ニューラルネットワークの
基本要素となっているのは
10:20
is a neuron-like node.
161
620456
2415
ニューロンのようなノードです
10:22
It takes input from other nodes
162
622871
2554
他のノードからの入力を受けて
10:25
and sends output to others.
163
625425
2718
他のノードへ出力を渡します
10:28
Moreover, these hundreds of thousands
or even millions of nodes
164
628143
4713
何十万 何百万という
このようなノードが
10:32
are organized in hierarchical layers,
165
632856
3227
これも脳と同様に
階層的に組織化されています
10:36
also similar to the brain.
166
636083
2554
10:38
In a typical neural network we use
to train our object recognition model,
167
638637
4783
物を認識するモデルを訓練するために
私たちが通常使うニューラルネットワークには
10:43
it has 24 million nodes,
168
643420
3181
2千4百万のノード
10:46
140 million parameters,
169
646601
3297
1億4千万のパラメータ
10:49
and 15 billion connections.
170
649898
2763
150億の結合があります
10:52
That's an enormous model.
171
652661
2415
ものすごく大きなモデルです
10:55
Powered by the massive data from ImageNet
172
655076
3901
ImageNetの膨大なデータと
10:58
and the modern CPUs and GPUs
to train such a humongous model,
173
658977
5433
現代のCPUやGPUの性能を使って
このような巨大なモデルを訓練することで
11:04
the convolutional neural network
174
664410
2369
畳み込みニューラルネットワークは
11:06
blossomed in a way that no one expected.
175
666779
3436
誰も予想しなかったくらいに
大きく花開きました
11:10
It became the winning architecture
176
670215
2508
これは物の認識において
目覚ましい結果を出す
11:12
to generate exciting new results
in object recognition.
177
672723
5340
大当たりのアーキテクチャとなっています
11:18
This is a computer telling us
178
678063
2810
ここではコンピュータが
11:20
this picture contains a cat
179
680873
2300
写真の中にネコがいることと
11:23
and where the cat is.
180
683173
1903
その場所を示しています
11:25
Of course there are more things than cats,
181
685076
2112
もちろんネコ以外のものも
認識できます
11:27
so here's a computer algorithm telling us
182
687188
2438
こちらではコンピュータアルゴリズムが
11:29
the picture contains
a boy and a teddy bear;
183
689626
3274
写真の中に男の子とテディベアが
写っていることを教えています
11:32
a dog, a person, and a small kite
in the background;
184
692900
4366
犬と 人物と 後方に小さな凧が
あることを示しています
11:37
or a picture of very busy things
185
697266
3135
とても沢山のものが
写った写真から
11:40
like a man, a skateboard,
railings, a lampost, and so on.
186
700401
4644
男性 スケートボード 手すり
街灯などを見分けています
11:45
Sometimes, when the computer
is not so confident about what it sees,
187
705045
5293
写っているものが何なのか コンピュータが
そんなに自信を持てない場合もあります [動物]
11:51
we have taught it to be smart enough
188
711498
2276
コンピュータには
当て推量をするよりは
11:53
to give us a safe answer
instead of committing too much,
189
713774
3878
確かなところを答えるよう
教えています
11:57
just like we would do,
190
717652
2811
ちょうど私たち自身がするように
12:00
but other times our computer algorithm
is remarkable at telling us
191
720463
4666
一方で何が写っているかについて
コンピュータアルゴリズムが
12:05
what exactly the objects are,
192
725129
2253
驚くほど正確に
言い当てることもあります
12:07
like the make, model, year of the cars.
193
727382
3436
たとえば自動車の車種や
モデルや年式のような
12:10
We applied this algorithm to millions
of Google Street View images
194
730818
5386
このアルゴリズムを
アメリカの数百都市の
12:16
across hundreds of American cities,
195
736204
3135
何百万という
Googleストリートビュー画像に適用した結果
12:19
and we have learned something
really interesting:
196
739339
2926
面白い発見がありました
12:22
first, it confirmed our common wisdom
197
742265
3320
まず 車の値段は
12:25
that car prices correlate very well
198
745585
3290
家計収入とよく相関しているという
12:28
with household incomes.
199
748875
2345
予想が裏付けられました
12:31
But surprisingly, car prices
also correlate well
200
751220
4527
でも驚いたことに
車の値段は
街の犯罪率とも
よく相関していたんです
12:35
with crime rates in cities,
201
755747
2300
それはまた郵便番号区域ごとの
投票傾向とも相関しています
12:39
or voting patterns by zip codes.
202
759007
3963
12:44
So wait a minute. Is that it?
203
764060
2206
それでは コンピュータは
12:46
Has the computer already matched
or even surpassed human capabilities?
204
766266
5153
既に人間の能力に追いつき
追い越しているのでしょうか?
12:51
Not so fast.
205
771419
2138
結論を急がないで
12:53
So far, we have just taught
the computer to see objects.
206
773557
4923
これまでのところ 私たちは
コンピュータに物の見方を教えただけです
12:58
This is like a small child
learning to utter a few nouns.
207
778480
4644
小さな子供が名詞をいくつか
言えるようになったようなものです
13:03
It's an incredible accomplishment,
208
783124
2670
ものすごい成果ですが
13:05
but it's only the first step.
209
785794
2460
まだ第一歩にすぎず
13:08
Soon, another developmental
milestone will be hit,
210
788254
3762
次の開発目標があります
13:12
and children begin
to communicate in sentences.
211
792016
3461
子供は文章でコミュニケーションを
するようになります
13:15
So instead of saying
this is a cat in the picture,
212
795477
4224
だから写真を見て小さな女の子が
単にネコと言わずに
13:19
you already heard the little girl
telling us this is a cat lying on a bed.
213
799701
5202
ネコがベッドに座っていると
言うのを聞いたわけです
13:24
So to teach a computer
to see a picture and generate sentences,
214
804903
5595
コンピュータが写真を見て
文章を作れるよう教えるために
13:30
the marriage between big data
and machine learning algorithm
215
810498
3948
このビッグデータと
機械学習の結びつきが
13:34
has to take another step.
216
814446
2275
新たなステップを
踏む必要があります
13:36
Now, the computer has to learn
from both pictures
217
816721
4156
コンピュータは
写真だけでなく
13:40
as well as natural language sentences
218
820877
2856
人が発する自然言語の文章も
13:43
generated by humans.
219
823733
3322
学ぶ必要があります
13:47
Just like the brain integrates
vision and language,
220
827055
3853
脳が視覚と言語を
結びつけるように
13:50
we developed a model
that connects parts of visual things
221
830908
5201
画像の断片のような
視覚的なものの一部と
13:56
like visual snippets
222
836109
1904
文章の中の単語やフレーズを
繋ぎ合わせるモデルを
13:58
with words and phrases in sentences.
223
838013
4203
私たちは開発しました
14:02
About four months ago,
224
842216
2763
4ヶ月ほど前
14:04
we finally tied all this together
225
844979
2647
ついに私たちは
すべてをまとめ
14:07
and produced one of the first
computer vision models
226
847626
3784
初めて見た写真について
人が書いたような
記述文を生成できる
14:11
that is capable of generating
a human-like sentence
227
851410
3994
14:15
when it sees a picture for the first time.
228
855404
3506
最初のコンピュータ・ビジョン・
モデルを作り上げました
14:18
Now, I'm ready to show you
what the computer says
229
858910
4644
冒頭で小さな女の子が説明したのと
同じ写真を見て
14:23
when it sees the picture
230
863554
1975
そのコンピュータが何と言ったか
14:25
that the little girl saw
at the beginning of this talk.
231
865529
3830
お見せしましょう
14:31
(Video) Computer: A man is standing
next to an elephant.
232
871519
3344
「ゾウの横に立っている男」
14:36
A large airplane sitting on top
of an airport runway.
233
876393
3634
「空港の滑走路にいる大きな飛行機」
14:41
FFL: Of course, we're still working hard
to improve our algorithms,
234
881057
4212
私たちは今もアルゴリズムを改良しようと
熱心に取り組んでいて
14:45
and it still has a lot to learn.
235
885269
2596
学ぶべきことは
まだまだあります
14:47
(Applause)
236
887865
2291
(拍手)
14:51
And the computer still makes mistakes.
237
891556
3321
コンピュータは
まだ間違いを犯します
14:54
(Video) Computer: A cat lying
on a bed in a blanket.
238
894877
3391
「ベッドの上の毛布の中のネコ」
14:58
FFL: So of course, when it sees
too many cats,
239
898268
2553
ネコを沢山見過ぎたせいで
15:00
it thinks everything
might look like a cat.
240
900821
2926
何でもネコみたいに
見えるのかもしれません
15:05
(Video) Computer: A young boy
is holding a baseball bat.
241
905317
2864
「野球バットを持つ小さな男の子」
15:08
(Laughter)
242
908181
1765
(笑)
15:09
FFL: Or, if it hasn't seen a toothbrush,
it confuses it with a baseball bat.
243
909946
4583
歯ブラシを見たことがないと
野球バットと混同してしまいます
15:15
(Video) Computer: A man riding a horse
down a street next to a building.
244
915309
3434
「建物脇の道を馬に乗って行く男」
15:18
(Laughter)
245
918743
2023
(笑)
15:20
FFL: We haven't taught Art 101
to the computers.
246
920766
3552
美術はまだコンピュータに
教えていませんでした
15:25
(Video) Computer: A zebra standing
in a field of grass.
247
925768
2884
「草原に立つシマウマ」
15:28
FFL: And it hasn't learned to appreciate
the stunning beauty of nature
248
928652
3367
私たちのように
自然の美を慈しむことは
15:32
like you and I do.
249
932019
2438
まだ学んでいません
15:34
So it has been a long journey.
250
934457
2832
長い道のりでした
15:37
To get from age zero to three was hard.
251
937289
4226
0歳から3歳まで行くのは
大変でした
15:41
The real challenge is to go
from three to 13 and far beyond.
252
941515
5596
でも本当の挑戦は3歳から13歳
さらにその先へと行くことです
15:47
Let me remind you with this picture
of the boy and the cake again.
253
947111
4365
あの男の子とケーキの写真を
もう一度見てみましょう
15:51
So far, we have taught
the computer to see objects
254
951476
4064
私たちはコンピュータに
物を識別することを教え
15:55
or even tell us a simple story
when seeing a picture.
255
955540
4458
写真を簡単に説明することさえ
教えました
15:59
(Video) Computer: A person sitting
at a table with a cake.
256
959998
3576
「ケーキのあるテーブルにつく人」
16:03
FFL: But there's so much more
to this picture
257
963574
2630
しかしこの写真には
単に人とケーキというよりも
16:06
than just a person and a cake.
258
966204
2270
遙かに多くのものがあります
16:08
What the computer doesn't see
is that this is a special Italian cake
259
968474
4467
コンピュータが見なかったのは
このケーキが特別なイタリアのケーキで
16:12
that's only served during Easter time.
260
972941
3217
イースターの時に
食べるものだということです
16:16
The boy is wearing his favorite t-shirt
261
976158
3205
男の子が着ているのは
お気に入りのTシャツで
16:19
given to him as a gift by his father
after a trip to Sydney,
262
979363
3970
お父さんがシドニー旅行の
おみやげにくれたものだということ
16:23
and you and I can all tell how happy he is
263
983333
3808
私たちはみんな
この男の子がどんなに喜んでいるか
16:27
and what's exactly on his mind
at that moment.
264
987141
3203
何を思っているかが分かります
16:31
This is my son Leo.
265
991214
3125
これは息子のレオです
16:34
On my quest for visual intelligence,
266
994339
2624
視覚的な知性を
追い求める探求の中で
16:36
I think of Leo constantly
267
996963
2391
私はいつもレオのことや
16:39
and the future world he will live in.
268
999354
2903
レオが住むであろう
未来の世界のことを考えています
16:42
When machines can see,
269
1002257
2021
機械に見ることが
できるようになれば
16:44
doctors and nurses will have
extra pairs of tireless eyes
270
1004278
4712
医師や看護師は疲れを知らない
別の目を手に入れて
16:48
to help them to diagnose
and take care of patients.
271
1008990
4092
患者の診断や世話に
役立てられるでしょう
16:53
Cars will run smarter
and safer on the road.
272
1013082
4383
自動車は道路をより賢明に
安全に走行するようになるでしょう
16:57
Robots, not just humans,
273
1017465
2694
人間だけでなくロボットも
17:00
will help us to brave the disaster zones
to save the trapped and wounded.
274
1020159
4849
災害地域に取り残され負傷した人々を救出する
手助けができるようになるでしょう
17:05
We will discover new species,
better materials,
275
1025798
3796
私たちは機械の助けを借りて
新種の生物やより優れた素材を発見し
17:09
and explore unseen frontiers
with the help of the machines.
276
1029594
4509
未だ見ぬフロンティアを
探検するようになるでしょう
17:15
Little by little, we're giving sight
to the machines.
277
1035113
4167
私たちは少しずつ機械に
視覚を与えています
17:19
First, we teach them to see.
278
1039280
2798
最初に私たちが
機械に見ることを教え
それから機械が より良く見られるよう
私たちを助けてくれることでしょう
17:22
Then, they help us to see better.
279
1042078
2763
17:24
For the first time, human eyes
won't be the only ones
280
1044841
4165
歴史上初めて
人間以外の目が
17:29
pondering and exploring our world.
281
1049006
2934
世界について考察し
探求するようになるのです
17:31
We will not only use the machines
for their intelligence,
282
1051940
3460
私たちは機械の知性を
利用するだけでなく
17:35
we will also collaborate with them
in ways that we cannot even imagine.
283
1055400
6179
想像もできないような方法で
機械と人間が協力し合うようになるでしょう
17:41
This is my quest:
284
1061579
2161
私が追い求めているのは
17:43
to give computers visual intelligence
285
1063740
2712
コンピュータに視覚的な知性を与え
17:46
and to create a better future
for Leo and for the world.
286
1066452
5131
レオや世界のために
より良い未来を作り出すということです
17:51
Thank you.
287
1071583
1811
ありがとうございました
17:53
(Applause)
288
1073394
3785
(拍手)
New videos
このウェブサイトについて
このサイトでは英語学習に役立つYouTube動画を紹介します。世界中の一流講師による英語レッスンを見ることができます。各ビデオのページに表示される英語字幕をダブルクリックすると、そこからビデオを再生することができます。字幕はビデオの再生と同期してスクロールします。ご意見・ご要望がございましたら、こちらのお問い合わせフォームよりご連絡ください。