How we teach computers to understand pictures | Fei Fei Li

Фей-Фей Ли: Как мы учим компьютеры понимать изображения

1,115,638 views

2015-03-23 ・ TED


New videos

How we teach computers to understand pictures | Fei Fei Li

Фей-Фей Ли: Как мы учим компьютеры понимать изображения

1,115,638 views ・ 2015-03-23

TED


Пожалуйста, дважды щелкните на английские субтитры ниже, чтобы воспроизвести видео.

Переводчик: Olga Babeeva Редактор: Katya Roberts
00:14
Let me show you something.
0
14366
3738
Позвольте вам кое-что показать.
00:18
(Video) Girl: Okay, that's a cat sitting in a bed.
1
18104
4156
(Видео) Девочка: Кот сидит на кровати.
00:22
The boy is petting the elephant.
2
22260
4040
Мальчик гладит слона.
00:26
Those are people that are going on an airplane.
3
26300
4354
Люди садятся в самолёт.
00:30
That's a big airplane.
4
30654
2810
Это большой самолёт.
00:33
Fei-Fei Li: This is a three-year-old child
5
33464
2206
Фей-Фей Ли: Трёхлетняя девочка
00:35
describing what she sees in a series of photos.
6
35670
3679
описывает то, что она видит на фотографиях.
00:39
She might still have a lot to learn about this world,
7
39349
2845
Ей предстоит ещё много узнать об этом мире,
00:42
but she's already an expert at one very important task:
8
42194
4549
но она уже довольно искусно справляется с очень важной задачей:
00:46
to make sense of what she sees.
9
46743
2846
она осознаёт то, что видит.
00:50
Our society is more technologically advanced than ever.
10
50229
4226
Наше общество технологически развито больше, чем когда-либо.
00:54
We send people to the moon, we make phones that talk to us
11
54455
3629
Мы отправляем людей на Луну, создаём телефоны, которые говорят с нами,
00:58
or customize radio stations that can play only music we like.
12
58084
4946
и настраиваем радиостанции, чтобы слушать только такую музыку, которая нам нравится.
01:03
Yet, our most advanced machines and computers
13
63030
4055
Но эта задача всё ещё не под силу нашим самым продвинутым
01:07
still struggle at this task.
14
67085
2903
механизмам и компьютерам.
01:09
So I'm here today to give you a progress report
15
69988
3459
Сегодня я выступлю перед вами с докладом
01:13
on the latest advances in our research in computer vision,
16
73447
4047
о наших последних достижениях в области машинного зрения,
01:17
one of the most frontier and potentially revolutionary
17
77494
4161
одной из самых передовых и потенциально революционных
01:21
technologies in computer science.
18
81655
3206
технологий в области компьютерных наук.
01:24
Yes, we have prototyped cars that can drive by themselves,
19
84861
4551
Да, мы создали прототипы беспилотных автомобилей,
01:29
but without smart vision, they cannot really tell the difference
20
89412
3853
но без компьютерного зрения они не смогут отличить
01:33
between a crumpled paper bag on the road, which can be run over,
21
93265
3970
на дороге бумажный пакет, по которому можно проехать,
01:37
and a rock that size, which should be avoided.
22
97235
3340
от камня похожего размера, который стоит объехать.
01:41
We have made fabulous megapixel cameras,
23
101415
3390
Мы создали замечательные мегапиксельные камеры,
01:44
but we have not delivered sight to the blind.
24
104805
3135
но не смогли вернуть зрение слепым.
01:48
Drones can fly over massive land,
25
108420
3305
Беспилотные аппараты могут преодолевать огромные расстояния,
01:51
but don't have enough vision technology
26
111725
2134
но не обладают достаточной технологией зрения,
01:53
to help us to track the changes of the rainforests.
27
113859
3461
чтобы помочь нам отслеживать динамику вырубки тропических лесов.
01:57
Security cameras are everywhere,
28
117320
2950
Повсюду находятся камеры видеонаблюдения,
02:00
but they do not alert us when a child is drowning in a swimming pool.
29
120270
5067
но они не могут предупредить нас о тонущем в бассейне ребёнке.
02:06
Photos and videos are becoming an integral part of global life.
30
126167
5595
Фотографии и видеоролики становятся неотъемлемой частью нашей жизни.
02:11
They're being generated at a pace that's far beyond what any human,
31
131762
4087
Они накапливаются с такой скоростью, что их все невозможно просмотреть
02:15
or teams of humans, could hope to view,
32
135849
2783
ни одному человеку, ни группе людей.
02:18
and you and I are contributing to that at this TED.
33
138632
3921
Мы, участники TED, тоже этому поспособствовали.
02:22
Yet our most advanced software is still struggling at understanding
34
142553
5232
Нашему самому продвинутому программному обеспечению не под силу воспринимать
02:27
and managing this enormous content.
35
147785
3876
этот огромный массив данных и управлять им.
02:31
So in other words, collectively as a society,
36
151661
5272
Иначе говоря, коллективно
02:36
we're very much blind,
37
156933
1746
наше общество слепо,
02:38
because our smartest machines are still blind.
38
158679
3387
потому что наши самые умные машины всё ещё не умеют видеть.
02:43
"Why is this so hard?" you may ask.
39
163526
2926
«Почему же это так сложно?» — спросите вы.
02:46
Cameras can take pictures like this one
40
166452
2693
Фотокамеры могут делать вот такие фотографии,
02:49
by converting lights into a two-dimensional array of numbers
41
169145
3994
преобразовывая свет в двухмерную числовую последовательность,
02:53
known as pixels,
42
173139
1650
известную как «пиксели».
02:54
but these are just lifeless numbers.
43
174789
2251
Но это просто числа.
02:57
They do not carry meaning in themselves.
44
177040
3111
Они не несут в себе никакого смысла.
03:00
Just like to hear is not the same as to listen,
45
180151
4343
Так же, как «слышать» — не то же самое, что «слушать»,
03:04
to take pictures is not the same as to see,
46
184494
4040
«делать» фотографии — не то же самое, что «видеть» их,
03:08
and by seeing, we really mean understanding.
47
188534
3829
а под «видеть», конечно же, имеется в виду «понимать».
03:13
In fact, it took Mother Nature 540 million years of hard work
48
193293
6177
Природе пришлось усердно трудиться в течение 540 миллионов лет,
03:19
to do this task,
49
199470
1973
чтобы решить эту задачу,
03:21
and much of that effort
50
201443
1881
и многие из этих усилий были направлены
03:23
went into developing the visual processing apparatus of our brains,
51
203324
5271
на создание аппарата обработки визуальных данных в нашем мозге,
03:28
not the eyes themselves.
52
208595
2647
а не глаз как таковых.
03:31
So vision begins with the eyes,
53
211242
2747
Зрение начинается с глаз,
03:33
but it truly takes place in the brain.
54
213989
3518
но фактически происходит в мозге.
03:38
So for 15 years now, starting from my Ph.D. at Caltech
55
218287
5060
В течение вот уже 15 лет, начиная с аспирантуры в Калтехе,
03:43
and then leading Stanford's Vision Lab,
56
223347
2926
а затем возглавляя стэнфордскую лабораторию зрения,
03:46
I've been working with my mentors, collaborators and students
57
226273
4396
я работаю вместе с наставниками, коллегами и студентами,
03:50
to teach computers to see.
58
230669
2889
обучая компьютеры видеть.
03:54
Our research field is called computer vision and machine learning.
59
234658
3294
Сфера наших исследований — машинное зрение и обучение машин.
03:57
It's part of the general field of artificial intelligence.
60
237952
3878
Это часть области под названием искусственный интеллект.
04:03
So ultimately, we want to teach the machines to see just like we do:
61
243000
5493
Наша главная задача — научить машины видеть, так как это можем мы:
04:08
naming objects, identifying people, inferring 3D geometry of things,
62
248493
5387
называть объекты, узнавать людей, использовать трёхмерную геометрию вещей,
04:13
understanding relations, emotions, actions and intentions.
63
253880
5688
понимать отношения, эмоции, действия и намерения.
04:19
You and I weave together entire stories of people, places and things
64
259568
6153
Мы можем создавать целые истории о людях, местах, вещах —
04:25
the moment we lay our gaze on them.
65
265721
2164
стоит нам только на них взглянуть.
04:28
The first step towards this goal is to teach a computer to see objects,
66
268955
5583
Первый шаг к этой цели — научить машины видеть объекты,
04:34
the building block of the visual world.
67
274538
3368
стандартные элементы визуального мира.
04:37
In its simplest terms, imagine this teaching process
68
277906
4434
Простыми словами, процесс обучения —
04:42
as showing the computers some training images
69
282340
2995
это демонстрация компьютеру некоторых обучающих изображений
04:45
of a particular object, let's say cats,
70
285335
3321
определённых объектов, например, кошек,
04:48
and designing a model that learns from these training images.
71
288656
4737
и разработка модели, которая обучается на основе данных изображений.
04:53
How hard can this be?
72
293393
2044
Насколько это может быть сложным?
04:55
After all, a cat is just a collection of shapes and colors,
73
295437
4052
Кошка — это просто набор очертаний и цветов,
04:59
and this is what we did in the early days of object modeling.
74
299489
4086
и именно этим мы занимались на заре моделирования объектов.
05:03
We'd tell the computer algorithm in a mathematical language
75
303575
3622
Посредством математического алгоритма мы сообщали компьютеру,
05:07
that a cat has a round face, a chubby body,
76
307197
3343
что у кошки круглая морда, пухленькое тело,
05:10
two pointy ears, and a long tail,
77
310540
2299
два острых уха и длинный хвост,
05:12
and that looked all fine.
78
312839
1410
и этого было достаточно.
05:14
But what about this cat?
79
314859
2113
А как насчёт этого кота?
05:16
(Laughter)
80
316972
1091
(Смех)
05:18
It's all curled up.
81
318063
1626
Он изогнут непонятно как.
05:19
Now you have to add another shape and viewpoint to the object model.
82
319689
4719
Нужно добавить ещё одну форму и точку обзора в модель.
05:24
But what if cats are hidden?
83
324408
1715
А если кот прячется?
05:27
What about these silly cats?
84
327143
2219
Как насчёт этих смешных котов?
05:31
Now you get my point.
85
331112
2417
Теперь вы меня понимаете.
05:33
Even something as simple as a household pet
86
333529
3367
Даже простой домашний питомец
05:36
can present an infinite number of variations to the object model,
87
336896
4504
может представлять бесконечное число вариаций в модели объекта,
05:41
and that's just one object.
88
341400
2233
а это всего лишь один объект.
05:44
So about eight years ago,
89
344573
2492
Где-то восемь лет назад
05:47
a very simple and profound observation changed my thinking.
90
347065
5030
простое, но значительное наблюдение изменило ход моих мыслей.
05:53
No one tells a child how to see,
91
353425
2685
Никто не говорит ребёнку, как надо видеть,
05:56
especially in the early years.
92
356110
2261
особенно в ранние годы жизни.
05:58
They learn this through real-world experiences and examples.
93
358371
5000
Он учится этому на реальных примерах.
06:03
If you consider a child's eyes
94
363371
2740
Если предположить, что глаза ребёнка —
06:06
as a pair of biological cameras,
95
366111
2554
это пара биологических камер,
06:08
they take one picture about every 200 milliseconds,
96
368665
4180
то они делают один снимок каждые 200 миллисекунд, —
06:12
the average time an eye movement is made.
97
372845
3134
среднее время движения глазного яблока.
06:15
So by age three, a child would have seen hundreds of millions of pictures
98
375979
5550
К трём годам ребёнок уже увидит сотни миллионов изображений
06:21
of the real world.
99
381529
1834
окружающего мира.
06:23
That's a lot of training examples.
100
383363
2280
Это очень много обучающих примеров.
06:26
So instead of focusing solely on better and better algorithms,
101
386383
5989
И вместо того, чтобы улучшать алгоритмы,
06:32
my insight was to give the algorithms the kind of training data
102
392372
5272
я предложила предоставить этим алгоритмам такую же обучающую информацию,
06:37
that a child was given through experiences
103
397644
3319
которую через опыт получает ребёнок,
06:40
in both quantity and quality.
104
400963
3878
в таком же количестве и качестве.
06:44
Once we know this,
105
404841
1858
Как только мы это осознали,
06:46
we knew we needed to collect a data set
106
406699
2971
мы поняли, что нам нужно было собрать базу данных,
06:49
that has far more images than we have ever had before,
107
409670
4459
содержащую намного больше изображений, чем когда-либо ранее,
06:54
perhaps thousands of times more,
108
414129
2577
возможно, в тысячи раз больше.
06:56
and together with Professor Kai Li at Princeton University,
109
416706
4111
В 2007 году я и профессор Кай Ли из Принстонского университета
07:00
we launched the ImageNet project in 2007.
110
420817
4752
запустили проект ImageNet.
07:05
Luckily, we didn't have to mount a camera on our head
111
425569
3838
К счастью, нам не пришлось устанавливать камеру себе на голову
07:09
and wait for many years.
112
429407
1764
и ждать много лет.
07:11
We went to the Internet,
113
431171
1463
Мы использовали интернет —
07:12
the biggest treasure trove of pictures that humans have ever created.
114
432634
4436
кладезь изображений, самую большую из созданных человечеством.
07:17
We downloaded nearly a billion images
115
437070
3041
Мы скачали почти миллиард изображений
07:20
and used crowdsourcing technology like the Amazon Mechanical Turk platform
116
440111
5880
и для их описания применили краудсорсинг-платформу
07:25
to help us to label these images.
117
445991
2339
Amazon Mechanical Turk.
07:28
At its peak, ImageNet was one of the biggest employers
118
448330
4900
На пике активности ImageNet была одним из самых популярных работодателей
07:33
of the Amazon Mechanical Turk workers:
119
453230
2996
для сотрудников Amazon Mechanical Turk:
07:36
together, almost 50,000 workers
120
456226
3854
порядка 50 000 работников
07:40
from 167 countries around the world
121
460080
4040
из 167 стран мира
07:44
helped us to clean, sort and label
122
464120
3947
помогли нам привести в порядок, отсортировать и описать
07:48
nearly a billion candidate images.
123
468067
3575
почти миллиард изображений-кандидатов.
07:52
That was how much effort it took
124
472612
2653
Вот сколько потребовалось усилий,
07:55
to capture even a fraction of the imagery
125
475265
3900
чтобы охватить лишь малую часть той базы изображений,
07:59
a child's mind takes in in the early developmental years.
126
479165
4171
которую создаёт мозг ребёнка в ранние годы развития.
08:04
In hindsight, this idea of using big data
127
484148
3902
Оглядываясь назад, идея использования большого архива данных
08:08
to train computer algorithms may seem obvious now,
128
488050
4550
для обучения компьютеров сейчас может показаться очевидной,
08:12
but back in 2007, it was not so obvious.
129
492600
4110
но в 2007 году это было далеко не так.
08:16
We were fairly alone on this journey for quite a while.
130
496710
3878
Долгое время у нас совсем не было единомышленников.
08:20
Some very friendly colleagues advised me to do something more useful for my tenure,
131
500588
5003
Некоторые дружелюбные коллеги советовали мне заняться более полезным делом,
08:25
and we were constantly struggling for research funding.
132
505591
4342
и нам никогда не хватало денег на исследования.
08:29
Once, I even joked to my graduate students
133
509933
2485
Однажды я даже пошутила со своими студентами,
08:32
that I would just reopen my dry cleaner's shop to fund ImageNet.
134
512418
4063
что я снова открою свою химчистку, чтобы профинансировать ImageNet.
08:36
After all, that's how I funded my college years.
135
516481
4761
В конце концов, именно с её помощью я оплатила обучение в университете.
08:41
So we carried on.
136
521242
1856
И мы продолжили работать.
08:43
In 2009, the ImageNet project delivered
137
523098
3715
В 2009 году проект ImageNet собрал
08:46
a database of 15 million images
138
526813
4042
базу из 15 миллионов изображений,
08:50
across 22,000 classes of objects and things
139
530855
4805
22 тысяч классов объектов и предметов,
08:55
organized by everyday English words.
140
535660
3320
упорядоченных при помощи повседневных английских слов.
08:58
In both quantity and quality,
141
538980
2926
Как количественно, так и качественно
09:01
this was an unprecedented scale.
142
541906
2972
это был беспрецедентный по размеру проект.
09:04
As an example, in the case of cats,
143
544878
3461
Например, в случае с котами
09:08
we have more than 62,000 cats
144
548339
2809
в базе содержится более 62 000 котов
09:11
of all kinds of looks and poses
145
551148
4110
разных пород, в разных позах,
09:15
and across all species of domestic and wild cats.
146
555258
5223
всех видов, как домашних, так и диких.
09:20
We were thrilled to have put together ImageNet,
147
560481
3344
Мы были на седьмом небе от счастья, когда база ImageNet была готова.
09:23
and we wanted the whole research world to benefit from it,
148
563825
3738
Мы хотели, чтобы она принесла пользу всему научному сообществу.
09:27
so in the TED fashion, we opened up the entire data set
149
567563
4041
И мы, как и TED, открыли бесплатный неограниченный доступ к базе данных
09:31
to the worldwide research community for free.
150
571604
3592
для всего мирового научного сообщества.
09:36
(Applause)
151
576636
4000
(Аплодисменты)
09:41
Now that we have the data to nourish our computer brain,
152
581416
4538
Сейчас, когда у нас есть база данных, чтобы питать наш компьютерный мозг,
09:45
we're ready to come back to the algorithms themselves.
153
585954
3737
мы готовы вернуться к алгоритмам.
09:49
As it turned out, the wealth of information provided by ImageNet
154
589691
5178
Как оказалось, база данных, предоставленная ImageNet,
09:54
was a perfect match to a particular class of machine learning algorithms
155
594869
4806
точно подходила для определённого класса алгоритмов обучения машин,
09:59
called convolutional neural network,
156
599675
2415
который называется свёрточная нейронная сеть,
10:02
pioneered by Kunihiko Fukushima, Geoff Hinton, and Yann LeCun
157
602090
5248
начало которому положили Кунихико Фукушима, Джефф Хинтон
10:07
back in the 1970s and '80s.
158
607338
3645
и Ян ЛеКун ещё в 1970-е и 80-е годы.
10:10
Just like the brain consists of billions of highly connected neurons,
159
610983
5619
Так же как и в мозге, состоящем из миллиардов взаимосвязанных нейронов,
10:16
a basic operating unit in a neural network
160
616602
3854
простейшей операционной единицей нейронной сети
10:20
is a neuron-like node.
161
620456
2415
является нейроподобный узел.
10:22
It takes input from other nodes
162
622871
2554
Он принимает входные данные от одних узлов
10:25
and sends output to others.
163
625425
2718
и отправляет выходные данные другим.
10:28
Moreover, these hundreds of thousands or even millions of nodes
164
628143
4713
Более того, сотни тысяч или даже миллионы таких узлов
10:32
are organized in hierarchical layers,
165
632856
3227
упорядочены по иерархическим уровням,
10:36
also similar to the brain.
166
636083
2554
также по аналогии с человеческим мозгом.
10:38
In a typical neural network we use to train our object recognition model,
167
638637
4783
В обычной нейронной сети, которую мы используем для обучения
10:43
it has 24 million nodes,
168
643420
3181
нашей модели распознавания, содержится 24 миллиона узлов,
10:46
140 million parameters,
169
646601
3297
140 миллионов параметров
10:49
and 15 billion connections.
170
649898
2763
и 15 миллиардов связей.
10:52
That's an enormous model.
171
652661
2415
Эта модель огромна.
10:55
Powered by the massive data from ImageNet
172
655076
3901
Функционирующая на основе базы ImageNet
10:58
and the modern CPUs and GPUs to train such a humongous model,
173
658977
5433
при помощи современных микропроцессоров для обучения этой огромной модели,
11:04
the convolutional neural network
174
664410
2369
свёрточная нейронная сеть
11:06
blossomed in a way that no one expected.
175
666779
3436
превзошла все ожидания.
11:10
It became the winning architecture
176
670215
2508
Она позволила создать эффективную систему
11:12
to generate exciting new results in object recognition.
177
672723
5340
для получения новых многообещающих результатов в распознавании объектов.
11:18
This is a computer telling us
178
678063
2810
Вот компьютер, который говорит нам,
11:20
this picture contains a cat
179
680873
2300
что на картинке есть кот
11:23
and where the cat is.
180
683173
1903
и где этот кот находится.
11:25
Of course there are more things than cats,
181
685076
2112
Конечно, на картинках не только коты.
11:27
so here's a computer algorithm telling us
182
687188
2438
Вот компьютер, который сообщает нам,
11:29
the picture contains a boy and a teddy bear;
183
689626
3274
что на фото мальчик и плюшевый мишка,
11:32
a dog, a person, and a small kite in the background;
184
692900
4366
собака, человек, и маленький воздушный змей на заднем фоне.
11:37
or a picture of very busy things
185
697266
3135
Или фотография с большим количеством объектов:
11:40
like a man, a skateboard, railings, a lampost, and so on.
186
700401
4644
мужчина, скейтборд, перила, фонарь и т.д.
11:45
Sometimes, when the computer is not so confident about what it sees,
187
705045
5293
Когда компьютер не уверен в том, что он видит,
11:51
we have taught it to be smart enough
188
711498
2276
он обучен действовать по-умному
11:53
to give us a safe answer instead of committing too much,
189
713774
3878
и давать нам наиболее безопасный ответ, без неоправданных рисков,
11:57
just like we would do,
190
717652
2811
что именно и сделал бы человек.
12:00
but other times our computer algorithm is remarkable at telling us
191
720463
4666
Но бывает и так, что наш алгоритм совершенно безошибочно сообщает нам,
12:05
what exactly the objects are,
192
725129
2253
какие объекты он видит.
12:07
like the make, model, year of the cars.
193
727382
3436
Например, марку, модель и год выпуска автомобиля.
12:10
We applied this algorithm to millions of Google Street View images
194
730818
5386
Мы применили этот алгоритм к миллионам фотографий на Google Street View
12:16
across hundreds of American cities,
195
736204
3135
из сотен американских городов
12:19
and we have learned something really interesting:
196
739339
2926
и получили очень интересные результаты.
12:22
first, it confirmed our common wisdom
197
742265
3320
Во-первых, они подтвердили известный факт,
12:25
that car prices correlate very well
198
745585
3290
что стоимость автомобиля зависит
12:28
with household incomes.
199
748875
2345
от дохода семьи.
12:31
But surprisingly, car prices also correlate well
200
751220
4527
Но, к удивлению, цены на автомобили также зависят
12:35
with crime rates in cities,
201
755747
2300
от уровня преступности в городах
12:39
or voting patterns by zip codes.
202
759007
3963
или даже модели голосования в разных штатах.
12:44
So wait a minute. Is that it?
203
764060
2206
Минутку. Это свершилось?
12:46
Has the computer already matched or even surpassed human capabilities?
204
766266
5153
Компьютеры догнали или даже превзошли человеческие возможности?
12:51
Not so fast.
205
771419
2138
Не тут-то было.
12:53
So far, we have just taught the computer to see objects.
206
773557
4923
Пока мы научили компьютеры только видеть объекты.
12:58
This is like a small child learning to utter a few nouns.
207
778480
4644
Это сродни тому, как маленький ребёнок учится произносить несколько слов.
13:03
It's an incredible accomplishment,
208
783124
2670
Это невероятное достижение,
13:05
but it's only the first step.
209
785794
2460
но это всего лишь первый шаг.
13:08
Soon, another developmental milestone will be hit,
210
788254
3762
Вскоре будет пройден новый этап развития,
13:12
and children begin to communicate in sentences.
211
792016
3461
и ребёнок сможет составлять из слов предложения.
13:15
So instead of saying this is a cat in the picture,
212
795477
4224
И вместо того чтобы сказать, что на картинке кошка,
13:19
you already heard the little girl telling us this is a cat lying on a bed.
213
799701
5202
маленькая девочка скажет, что кошка лежит на кровати.
13:24
So to teach a computer to see a picture and generate sentences,
214
804903
5595
Для того чтобы научить компьютер видеть картинку и составлять предложения,
13:30
the marriage between big data and machine learning algorithm
215
810498
3948
связь между большой базой данных и алгоритмом обучения машин
13:34
has to take another step.
216
814446
2275
должна выйти на новый уровень.
13:36
Now, the computer has to learn from both pictures
217
816721
4156
Теперь компьютер должен учиться не только по фотографиям,
13:40
as well as natural language sentences
218
820877
2856
но и на основе предложений естественного языка,
13:43
generated by humans.
219
823733
3322
составляемых человеком.
13:47
Just like the brain integrates vision and language,
220
827055
3853
Отталкиваясь от факта, что мозг объединяет зрение и язык,
13:50
we developed a model that connects parts of visual things
221
830908
5201
мы разработали модель, соединяющую части визуальной картины,
13:56
like visual snippets
222
836109
1904
как маленькие фрагменты,
13:58
with words and phrases in sentences.
223
838013
4203
со словами и фразами в предложениях.
14:02
About four months ago,
224
842216
2763
Около четырёх месяцев назад
14:04
we finally tied all this together
225
844979
2647
мы привели всё это к общему знаменателю
14:07
and produced one of the first computer vision models
226
847626
3784
и создали одну из первых моделей компьютерного зрения,
14:11
that is capable of generating a human-like sentence
227
851410
3994
способную, подобно человеку, создавать предложения
14:15
when it sees a picture for the first time.
228
855404
3506
после просмотра фотографии в первый раз.
14:18
Now, I'm ready to show you what the computer says
229
858910
4644
Сейчас я покажу вам, что говорит компьютер,
14:23
when it sees the picture
230
863554
1975
когда видит фотографию,
14:25
that the little girl saw at the beginning of this talk.
231
865529
3830
которую описывала девочка в начале этого доклада.
14:31
(Video) Computer: A man is standing next to an elephant.
232
871519
3344
(Видео) Компьютер: Рядом со слоном стоит мужчина.
14:36
A large airplane sitting on top of an airport runway.
233
876393
3634
Большой самолёт находится на взлётно-посадочной полосе аэропорта.
14:41
FFL: Of course, we're still working hard to improve our algorithms,
234
881057
4212
ФФЛ: Конечно, мы продолжаем усердно работать над улучшением нашего алгоритма,
14:45
and it still has a lot to learn.
235
885269
2596
и ему предстоит ещё многому научиться.
14:47
(Applause)
236
887865
2291
(Аплодисменты)
14:51
And the computer still makes mistakes.
237
891556
3321
Компьютер всё ещё допускает ошибки.
14:54
(Video) Computer: A cat lying on a bed in a blanket.
238
894877
3391
(Видео) Компьютер: Кот лежит на кровати в одеяле.
14:58
FFL: So of course, when it sees too many cats,
239
898268
2553
ФФЛ: Конечно, когда он видит слишком много котов,
15:00
it thinks everything might look like a cat.
240
900821
2926
он считает, что всё остальное тоже выглядит как кот.
15:05
(Video) Computer: A young boy is holding a baseball bat.
241
905317
2864
(Видео) Компьютер: Мальчик держит бейсбольную биту.
15:08
(Laughter)
242
908181
1765
(Смех)
15:09
FFL: Or, if it hasn't seen a toothbrush, it confuses it with a baseball bat.
243
909946
4583
ФФЛ: Если он не видел зубной щётки, он принимает её за бейсбольную биту.
15:15
(Video) Computer: A man riding a horse down a street next to a building.
244
915309
3434
(Видео) Компьютер: Мужчина едет верхом по улице рядом со зданием.
15:18
(Laughter)
245
918743
2023
(Смех)
15:20
FFL: We haven't taught Art 101 to the computers.
246
920766
3552
ФФЛ: Мы не обучили компьютер основам искусства.
15:25
(Video) Computer: A zebra standing in a field of grass.
247
925768
2884
(Видео) Компьютер: Зебра стоит на поле с травой.
15:28
FFL: And it hasn't learned to appreciate the stunning beauty of nature
248
928652
3367
ФФЛ: Он также ещё не может оценить красоту природы так,
15:32
like you and I do.
249
932019
2438
как это можем мы с вами.
15:34
So it has been a long journey.
250
934457
2832
Это длительный процесс.
15:37
To get from age zero to three was hard.
251
937289
4226
Дорасти до трёх лет было трудно.
15:41
The real challenge is to go from three to 13 and far beyond.
252
941515
5596
Ещё сложнее — от трёх до тринадцати и так далее.
15:47
Let me remind you with this picture of the boy and the cake again.
253
947111
4365
Позвольте вам снова показать фотографию мальчика с тортом.
15:51
So far, we have taught the computer to see objects
254
951476
4064
Компьютер уже умеет видеть предметы
15:55
or even tell us a simple story when seeing a picture.
255
955540
4458
и даже вкратце рассказывать историю о том, что изображено на фотографии.
15:59
(Video) Computer: A person sitting at a table with a cake.
256
959998
3576
(Видео) Компьютер: Человек сидит за столом с тортом.
16:03
FFL: But there's so much more to this picture
257
963574
2630
ФФЛ: На этой фотографии изображено гораздо больше,
16:06
than just a person and a cake.
258
966204
2270
чем просто человек и торт.
16:08
What the computer doesn't see is that this is a special Italian cake
259
968474
4467
Компьютер не видит, что это особый итальянский торт,
16:12
that's only served during Easter time.
260
972941
3217
который пекут только во время Пасхи.
16:16
The boy is wearing his favorite t-shirt
261
976158
3205
На мальчике надета его любимая футболка,
16:19
given to him as a gift by his father after a trip to Sydney,
262
979363
3970
которую ему подарил отец после поездки в Сидней.
16:23
and you and I can all tell how happy he is
263
983333
3808
И невооружённым глазом видно, как счастлив мальчик
16:27
and what's exactly on his mind at that moment.
264
987141
3203
и о чём именно он думает в этот момент.
16:31
This is my son Leo.
265
991214
3125
Это мой сын Лео.
16:34
On my quest for visual intelligence,
266
994339
2624
В моих поисках визуального интеллекта
16:36
I think of Leo constantly
267
996963
2391
я постоянно думаю о Лео
16:39
and the future world he will live in.
268
999354
2903
и о том мире, в котором он будет жить.
16:42
When machines can see,
269
1002257
2021
Когда машины будут способны видеть,
16:44
doctors and nurses will have extra pairs of tireless eyes
270
1004278
4712
доктора и медсёстры обзаведутся дополнительной парой неустающих глаз
16:48
to help them to diagnose and take care of patients.
271
1008990
4092
для диагностики заболеваний и ухода за пациентами.
16:53
Cars will run smarter and safer on the road.
272
1013082
4383
Машины на дорогах станут умнее и безопаснее.
16:57
Robots, not just humans,
273
1017465
2694
Не только люди, но и роботы
17:00
will help us to brave the disaster zones to save the trapped and wounded.
274
1020159
4849
смогут оказывать помощь в зонах бедствий и спасать людей из-под завалов.
17:05
We will discover new species, better materials,
275
1025798
3796
С помощью машин мы откроем новые виды животных и растений,
17:09
and explore unseen frontiers with the help of the machines.
276
1029594
4509
усовершенствуем материалы и расширим границы своей деятельности.
17:15
Little by little, we're giving sight to the machines.
277
1035113
4167
Постепенно машины обретут зрение.
17:19
First, we teach them to see.
278
1039280
2798
Сначала мы научим их видеть.
17:22
Then, they help us to see better.
279
1042078
2763
Затем они помогут видеть лучше нам самим.
17:24
For the first time, human eyes won't be the only ones
280
1044841
4165
Впервые человек будет осваивать и осознавать мир
17:29
pondering and exploring our world.
281
1049006
2934
посредством не только своих, но и компьютерных глаз.
17:31
We will not only use the machines for their intelligence,
282
1051940
3460
Мы будем не только использовать машины благодаря их интеллекту,
17:35
we will also collaborate with them in ways that we cannot even imagine.
283
1055400
6179
но и работать совместно с ними так, как никто и не мог вообразить.
17:41
This is my quest:
284
1061579
2161
Это моя задача:
17:43
to give computers visual intelligence
285
1063740
2712
дать машинам визуальный интеллект
17:46
and to create a better future for Leo and for the world.
286
1066452
5131
и создать лучшее будущее для Лео и всего мира.
17:51
Thank you.
287
1071583
1811
Спасибо.
17:53
(Applause)
288
1073394
3785
(Аплодисменты)
Об этом сайте

Этот сайт познакомит вас с видеороликами YouTube, полезными для изучения английского языка. Вы увидите уроки английского языка, преподаваемые высококлассными учителями со всего мира. Дважды щелкните по английским субтитрам, отображаемым на каждой странице видео, чтобы воспроизвести видео оттуда. Субтитры прокручиваются синхронно с воспроизведением видео. Если у вас есть какие-либо комментарии или пожелания, пожалуйста, свяжитесь с нами, используя эту контактную форму.

https://forms.gle/WvT1wiN1qDtmnspy7