How we teach computers to understand pictures | Fei Fei Li

1,115,638 views ・ 2015-03-23

TED


Dubbelklik op de Engelse ondertitels hieronder om de video af te spelen.

Vertaald door: Dick Stada Nagekeken door: Rik Delaet
00:14
Let me show you something.
0
14366
3738
Ik laat je wat zien.
(Video) Meisje: Oké, dat is een poes die in bed zit.
00:18
(Video) Girl: Okay, that's a cat sitting in a bed.
1
18104
4156
00:22
The boy is petting the elephant.
2
22260
4040
De jongen verzorgt de olifant.
00:26
Those are people that are going on an airplane.
3
26300
4354
Dat zijn mensen die met het vliegtuig gaan.
00:30
That's a big airplane.
4
30654
2810
Dat is een groot vliegtuig.
00:33
Fei-Fei Li: This is a three-year-old child
5
33464
2206
Fei-Fei Li: Dit is een kind van drie
00:35
describing what she sees in a series of photos.
6
35670
3679
dat beschrijft wat het ziet op een serie foto's.
00:39
She might still have a lot to learn about this world,
7
39349
2845
Het moet nog veel leren over de wereld,
00:42
but she's already an expert at one very important task:
8
42194
4549
maar het is nu al een expert in iets heel belangrijks:
00:46
to make sense of what she sees.
9
46743
2846
iets zinnigs maken van wat het ziet.
Onze maatschappij is technologisch verder dan ooit.
00:50
Our society is more technologically advanced than ever.
10
50229
4226
00:54
We send people to the moon, we make phones that talk to us
11
54455
3629
We sturen mensen naar de maan, maken telefoons die tegen ons praten,
of stellen radiozenders samen, die alleen muziek uitzenden die we mooi vinden.
00:58
or customize radio stations that can play only music we like.
12
58084
4946
01:03
Yet, our most advanced machines and computers
13
63030
4055
Toch worstelen onze geavanceerde machines en computers met deze taak.
01:07
still struggle at this task.
14
67085
2903
01:09
So I'm here today to give you a progress report
15
69988
3459
Ik ben hier vandaag om je de voortgang te laten zien
01:13
on the latest advances in our research in computer vision,
16
73447
4047
van de recentste ontwikkelingen in ons onderzoek naar computervisie,
01:17
one of the most frontier and potentially revolutionary
17
77494
4161
een van de meest grensverleggende en mogelijk revolutionaire technologieën
01:21
technologies in computer science.
18
81655
3206
in de computerwetenschap.
01:24
Yes, we have prototyped cars that can drive by themselves,
19
84861
4551
Ja, we hebben prototypes van auto's die zelf kunnen rijden,
01:29
but without smart vision, they cannot really tell the difference
20
89412
3853
maar zonder slim zicht, zien ze het verschil niet
01:33
between a crumpled paper bag on the road, which can be run over,
21
93265
3970
tussen een verfrommelde papieren zak op de weg, waar je overheen kan rijden,
01:37
and a rock that size, which should be avoided.
22
97235
3340
en een evengrote kei, waar je omheen moet rijden.
01:41
We have made fabulous megapixel cameras,
23
101415
3390
We hebben geweldige megapixelcamera's gemaakt,
01:44
but we have not delivered sight to the blind.
24
104805
3135
maar we kunnen blinden nog niet laten zien.
01:48
Drones can fly over massive land,
25
108420
3305
Drones kunnen grote afstanden vliegen,
01:51
but don't have enough vision technology
26
111725
2134
maar hun visie-technologie schiet tekort
01:53
to help us to track the changes of the rainforests.
27
113859
3461
om veranderingen te helpen opsporen in het regenwoud.
01:57
Security cameras are everywhere,
28
117320
2950
Er zijn overal veiligheidscamera's,
02:00
but they do not alert us when a child is drowning in a swimming pool.
29
120270
5067
maar die waarschuwen ons niet als een kind verdrinkt in een zwembad.
02:06
Photos and videos are becoming an integral part of global life.
30
126167
5595
Foto's en filmpjes zijn deel van ons leven geworden.
02:11
They're being generated at a pace that's far beyond what any human,
31
131762
4087
Ze verschijnen sneller dan welk mens,
02:15
or teams of humans, could hope to view,
32
135849
2783
of welk team mensen ooit kan bekijken,
02:18
and you and I are contributing to that at this TED.
33
138632
3921
en jullie en ik dragen daaraan bij op deze TED.
02:22
Yet our most advanced software is still struggling at understanding
34
142553
5232
Onze meest geavanceerde software heeft nog steeds moeite met het begrijpen
02:27
and managing this enormous content.
35
147785
3876
van deze enorme hoeveelheid gegevens.
02:31
So in other words, collectively as a society,
36
151661
5272
Met andere woorden, we zijn met z'n allen heel erg blind,
02:36
we're very much blind,
37
156933
1746
02:38
because our smartest machines are still blind.
38
158679
3387
omdat onze slimste machines ook nog blind zijn.
02:43
"Why is this so hard?" you may ask.
39
163526
2926
Je zal je afvragen waarom het zo moeilijk is.
02:46
Cameras can take pictures like this one
40
166452
2693
Camera's kunnen dit soort foto's nemen
door licht om te zetten naar een 2-dimensionale serie getallen,
02:49
by converting lights into a two-dimensional array of numbers
41
169145
3994
bekend als pixels.
02:53
known as pixels,
42
173139
1650
02:54
but these are just lifeless numbers.
43
174789
2251
Maar dit zijn slechts levenloze getallen.
02:57
They do not carry meaning in themselves.
44
177040
3111
Ze hebben zelf geen betekenis.
03:00
Just like to hear is not the same as to listen,
45
180151
4343
Horen is niet hetzelfde als luisteren.
03:04
to take pictures is not the same as to see,
46
184494
4040
Foto's nemen is niet hetzelfde als zien.
03:08
and by seeing, we really mean understanding.
47
188534
3829
En met zien bedoelen we echt begrijpen.
Het kostte Moeder Natuur 540 miljoen jaar hard werken
03:13
In fact, it took Mother Nature 540 million years of hard work
48
193293
6177
03:19
to do this task,
49
199470
1973
om dit te doen.
03:21
and much of that effort
50
201443
1881
Veel van die inspanning
03:23
went into developing the visual processing apparatus of our brains,
51
203324
5271
ging zitten in het ontwikkelen van het verwerkingsgedeelte in ons brein.
03:28
not the eyes themselves.
52
208595
2647
Niet de ogen zelf.
03:31
So vision begins with the eyes,
53
211242
2747
Gezichtsvermogen begint bij de ogen,
03:33
but it truly takes place in the brain.
54
213989
3518
maar het gebeurt in feite in de hersenen.
03:38
So for 15 years now, starting from my Ph.D. at Caltech
55
218287
5060
Al 15 jaar, vanaf mijn promoveren aan Caltech,
en later, toen ik de leiding had van het Stanford Vision Lab,
03:43
and then leading Stanford's Vision Lab,
56
223347
2926
03:46
I've been working with my mentors, collaborators and students
57
226273
4396
werk ik samen met mijn mentoren, medewerkers en studenten
03:50
to teach computers to see.
58
230669
2889
om computers te leren zien.
03:54
Our research field is called computer vision and machine learning.
59
234658
3294
Ons onderzoeksgebied heet computervisie en machine-leren.
03:57
It's part of the general field of artificial intelligence.
60
237952
3878
Het is onderdeel van het algemene gebied van kunstmatige intelligentie.
Uiteindelijk willen we de machines aanleren wat wijzelf ook doen:
04:03
So ultimately, we want to teach the machines to see just like we do:
61
243000
5493
04:08
naming objects, identifying people, inferring 3D geometry of things,
62
248493
5387
voorwerpen benoemen, mensen herkennen, ruimtelijke vormen afleiden,
04:13
understanding relations, emotions, actions and intentions.
63
253880
5688
het begrijpen van verhoudingen, emoties, acties en bedoelingen.
04:19
You and I weave together entire stories of people, places and things
64
259568
6153
Jullie en ik maken complete verhalen van mensen, plaatsen en dingen,
04:25
the moment we lay our gaze on them.
65
265721
2164
op het moment dat we ernaar kijken.
04:28
The first step towards this goal is to teach a computer to see objects,
66
268955
5583
Eerst moeten we de computer leren voorwerpen te zien,
04:34
the building block of the visual world.
67
274538
3368
de bouwsteen van de visuele wereld.
04:37
In its simplest terms, imagine this teaching process
68
277906
4434
Heel simpel gezegd: stel je dit leerproces voor
04:42
as showing the computers some training images
69
282340
2995
als het aan de computer laten zien van oefenplaatjes
04:45
of a particular object, let's say cats,
70
285335
3321
van bepaalde voorwerpen, bijvoorbeeld katten,
04:48
and designing a model that learns from these training images.
71
288656
4737
en ontwerp een model dat leert van deze oefenplaatjes.
04:53
How hard can this be?
72
293393
2044
Hoe moeilijk is dat?
04:55
After all, a cat is just a collection of shapes and colors,
73
295437
4052
Een kat is tenslotte alleen maar een verzameling vormen en kleuren.
04:59
and this is what we did in the early days of object modeling.
74
299489
4086
En dit deden we in het begintijd van het modelleren van voorwerpen.
05:03
We'd tell the computer algorithm in a mathematical language
75
303575
3622
We moesten de computer algoritmes leren in een wiskundige taal,
05:07
that a cat has a round face, a chubby body,
76
307197
3343
dat een kat een ronde kop heeft, een mollig lijf,
05:10
two pointy ears, and a long tail,
77
310540
2299
twee puntoren en een lange staart.
05:12
and that looked all fine.
78
312839
1410
En dat leek goed te gaan.
05:14
But what about this cat?
79
314859
2113
Maar deze kat dan?
05:16
(Laughter)
80
316972
1091
(Gelach)
Die ligt helemaal opgekruld.
05:18
It's all curled up.
81
318063
1626
05:19
Now you have to add another shape and viewpoint to the object model.
82
319689
4719
Nu moet je nog een vorm en gezichtspunt toevoegen aan je model.
05:24
But what if cats are hidden?
83
324408
1715
Maar als katten zijn verstopt?
05:27
What about these silly cats?
84
327143
2219
Deze grappige katten bijvoorbeeld.
(Gelach)
05:31
Now you get my point.
85
331112
2417
Nu ga je het snappen.
05:33
Even something as simple as a household pet
86
333529
3367
Zelf iets simpels als een huisdier
05:36
can present an infinite number of variations to the object model,
87
336896
4504
kan zorgen voor ontelbaar veel variaties van het model.
05:41
and that's just one object.
88
341400
2233
Dat is nog maar één voorwerp.
05:44
So about eight years ago,
89
344573
2492
Acht jaar geleden
05:47
a very simple and profound observation changed my thinking.
90
347065
5030
veranderde een simpele en grondige observatie mijn denken.
05:53
No one tells a child how to see,
91
353425
2685
Niemand vertelt aan een kind hoe het moet kijken.
Zeker niet in de eerste jaren.
05:56
especially in the early years.
92
356110
2261
05:58
They learn this through real-world experiences and examples.
93
358371
5000
Ze leren het via ervaringen en voorbeelden uit het echte leven.
06:03
If you consider a child's eyes
94
363371
2740
Bekijk de ogen van kinderen eens
als een paar biologische camera's.
06:06
as a pair of biological cameras,
95
366111
2554
06:08
they take one picture about every 200 milliseconds,
96
368665
4180
Ze nemen elke 200 milliseconden een foto,
06:12
the average time an eye movement is made.
97
372845
3134
de gemiddelde tijd van een oogbeweging.
06:15
So by age three, a child would have seen hundreds of millions of pictures
98
375979
5550
Als het drie is, heeft een kind honderden miljoenen beelden gezien
06:21
of the real world.
99
381529
1834
van de echte wereld.
06:23
That's a lot of training examples.
100
383363
2280
Dat zijn heel wat oefenvoorbeelden.
06:26
So instead of focusing solely on better and better algorithms,
101
386383
5989
In plaats van je alleen te richten op steeds betere algoritmes,
06:32
my insight was to give the algorithms the kind of training data
102
392372
5272
zag ik in dat je de algoritmes de oefengegevens moest geven
06:37
that a child was given through experiences
103
397644
3319
dat een kind ook krijgt door ervaring.
06:40
in both quantity and quality.
104
400963
3878
Zowel qua kwantiteit als kwaliteit.
06:44
Once we know this,
105
404841
1858
Toen we dat wisten,
06:46
we knew we needed to collect a data set
106
406699
2971
wisten we dat we een verzameling gegevens moesten maken
06:49
that has far more images than we have ever had before,
107
409670
4459
die veel meer plaatjes bevat dan wij ooit hebben gehad.
Misschien wel duizenden keren meer.
06:54
perhaps thousands of times more,
108
414129
2577
06:56
and together with Professor Kai Li at Princeton University,
109
416706
4111
Samen met professor Kai Li aan de Princeton Universiteit,
07:00
we launched the ImageNet project in 2007.
110
420817
4752
lanceerden we in 2007 het ImageNet-project.
07:05
Luckily, we didn't have to mount a camera on our head
111
425569
3838
Gelukkig hoefden we geen camera op ons hoofd te zetten
07:09
and wait for many years.
112
429407
1764
en jaren te wachten.
We gingen het internet op,
07:11
We went to the Internet,
113
431171
1463
07:12
the biggest treasure trove of pictures that humans have ever created.
114
432634
4436
de grootste schat aan plaatjes die de mens ooit heeft gemaakt.
07:17
We downloaded nearly a billion images
115
437070
3041
We downloadden meer dan een miljard plaatjes
07:20
and used crowdsourcing technology like the Amazon Mechanical Turk platform
116
440111
5880
en gebruikten crowdsourcing, zoals met de Amazon Mechanische Turk
07:25
to help us to label these images.
117
445991
2339
om ons de plaatjes te helpen kenmerken.
07:28
At its peak, ImageNet was one of the biggest employers
118
448330
4900
Op zijn hoogtepunt was ImageNet een van de grootste werkgevers
07:33
of the Amazon Mechanical Turk workers:
119
453230
2996
voor de Amazon Mechanische Turk-werknemers:
07:36
together, almost 50,000 workers
120
456226
3854
In totaal bijna 50.000 mensen
07:40
from 167 countries around the world
121
460080
4040
uit 167 landen van de wereld
07:44
helped us to clean, sort and label
122
464120
3947
hielpen ons met het opschonen, sorteren en markeren
07:48
nearly a billion candidate images.
123
468067
3575
van bijna een miljard mogelijk bruikbare plaatjes.
07:52
That was how much effort it took
124
472612
2653
Zoveel moeite kostte het
07:55
to capture even a fraction of the imagery
125
475265
3900
om slechts een fractie van de beelden te verwerken
dat een kind opneemt in zijn eerste jaren.
07:59
a child's mind takes in in the early developmental years.
126
479165
4171
Achteraf gezien lijkt dit idee om big data te gebruiken
08:04
In hindsight, this idea of using big data
127
484148
3902
08:08
to train computer algorithms may seem obvious now,
128
488050
4550
om computeralgoritmes te trainen, nogal logisch,
08:12
but back in 2007, it was not so obvious.
129
492600
4110
maar in 2007 was dat niet zo.
08:16
We were fairly alone on this journey for quite a while.
130
496710
3878
We stonden best lang alleen op deze weg.
08:20
Some very friendly colleagues advised me to do something more useful for my tenure,
131
500588
5003
Een paar vriendelijke collega's raadden me aan wat nuttigers te gaan doen,
08:25
and we were constantly struggling for research funding.
132
505591
4342
en we hadden veel moeite om onderzoeksgeld bij elkaar te krijgen.
08:29
Once, I even joked to my graduate students
133
509933
2485
Ik grapte een keer naar mijn studenten
08:32
that I would just reopen my dry cleaner's shop to fund ImageNet.
134
512418
4063
dat ik mijn stomerij zou heropenen om ImageNet te sponsoren.
08:36
After all, that's how I funded my college years.
135
516481
4761
Zo bekostigde ik immers ook mijn studie.
We gingen dus door.
08:41
So we carried on.
136
521242
1856
In 2009 leverde het ImageNet-project een database op
08:43
In 2009, the ImageNet project delivered
137
523098
3715
08:46
a database of 15 million images
138
526813
4042
met 15 miljoen plaatjes
08:50
across 22,000 classes of objects and things
139
530855
4805
in 22.000 categorieën van voorwerpen en dingen
08:55
organized by everyday English words.
140
535660
3320
ingedeeld met alledaagse Engelse woorden.
08:58
In both quantity and quality,
141
538980
2926
Zowel qua kwantiteit als kwaliteit,
09:01
this was an unprecedented scale.
142
541906
2972
was dit een ongekende schaal.
09:04
As an example, in the case of cats,
143
544878
3461
We hebben bijvoorbeeld in het geval van de katten,
09:08
we have more than 62,000 cats
144
548339
2809
meer dan 62.000 katten
09:11
of all kinds of looks and poses
145
551148
4110
in allerlei posities en houdingen
09:15
and across all species of domestic and wild cats.
146
555258
5223
en allerlei soorten wilde en huiskatten.
09:20
We were thrilled to have put together ImageNet,
147
560481
3344
We waren enthousiast toen we ImageNet in elkaar hadden gezet
09:23
and we wanted the whole research world to benefit from it,
148
563825
3738
en we wilden dat de hele onderzoekswereld er plezier van had.
09:27
so in the TED fashion, we opened up the entire data set
149
567563
4041
Dus volgens de TED-methode stelden we gratis de hele verzameling beschikbaar
09:31
to the worldwide research community for free.
150
571604
3592
aan de wereldwijde onderzoeksgemeenschap.
09:36
(Applause)
151
576636
4000
(Applaus)
09:41
Now that we have the data to nourish our computer brain,
152
581416
4538
Nu we de gegevens hebben om het computerbrein te voeden,
09:45
we're ready to come back to the algorithms themselves.
153
585954
3737
kunnen we terugkomen op de algoritmes zelf.
09:49
As it turned out, the wealth of information provided by ImageNet
154
589691
5178
Het bleek dat de overdadige informatie die ImageNet gaf,
09:54
was a perfect match to a particular class of machine learning algorithms
155
594869
4806
precies paste bij een speciaal soort algoritme voor machineleren.
09:59
called convolutional neural network,
156
599675
2415
die convolutioneel neuraal netwerk heet,
10:02
pioneered by Kunihiko Fukushima, Geoff Hinton, and Yann LeCun
157
602090
5248
het eerst aangepakt door Kunihiko Fukushima, Geoff Hinton en Yann LeCun,
10:07
back in the 1970s and '80s.
158
607338
3645
in de jaren zeventig en tachtig.
10:10
Just like the brain consists of billions of highly connected neurons,
159
610983
5619
Net als in de hersenen,
die bestaan uit miljarden goedverbonden neuronen,
10:16
a basic operating unit in a neural network
160
616602
3854
is de basiseenheid van een neuraal netwerk
10:20
is a neuron-like node.
161
620456
2415
een neuronenachtig knooppunt.
10:22
It takes input from other nodes
162
622871
2554
Het ontvangt input van andere knooppunten
10:25
and sends output to others.
163
625425
2718
en stuurt output naar andere.
Deze honderdduizenden, of zelfs miljoenen knooppunten
10:28
Moreover, these hundreds of thousands or even millions of nodes
164
628143
4713
10:32
are organized in hierarchical layers,
165
632856
3227
zijn bovendien in hiërarchische lagen georganiseerd.
Ook weer net als in de hersenen.
10:36
also similar to the brain.
166
636083
2554
10:38
In a typical neural network we use to train our object recognition model,
167
638637
4783
In een neuraal netwerk dat we gebruiken om voorwerpherkenning te trainen,
10:43
it has 24 million nodes,
168
643420
3181
zitten 24 miljoen knooppunten,
10:46
140 million parameters,
169
646601
3297
140 miljoen parameters,
10:49
and 15 billion connections.
170
649898
2763
en 15 miljard verbindingen.
10:52
That's an enormous model.
171
652661
2415
Dat is een gigantisch model.
10:55
Powered by the massive data from ImageNet
172
655076
3901
Mogelijk gemaakt door de enorme hoeveelheid gegevens van IMageNet
10:58
and the modern CPUs and GPUs to train such a humongous model,
173
658977
5433
en moderne processoren om zo'n gigantisch model te trainen,
kwam het convolutioneel neuraal netwerk tot bloei,
11:04
the convolutional neural network
174
664410
2369
11:06
blossomed in a way that no one expected.
175
666779
3436
op een manier die niemand had verwacht.
11:10
It became the winning architecture
176
670215
2508
Het werd de architectuur
die de meeste opwindende nieuwe resultaten leverde
11:12
to generate exciting new results in object recognition.
177
672723
5340
op het gebied van voorwerpherkenning.
Dit is een computer die ons vertelt
11:18
This is a computer telling us
178
678063
2810
11:20
this picture contains a cat
179
680873
2300
dat op deze foto een kat staat
11:23
and where the cat is.
180
683173
1903
en waar de kat is.
Er zijn natuurlijk meer dingen dan katten.
11:25
Of course there are more things than cats,
181
685076
2112
11:27
so here's a computer algorithm telling us
182
687188
2438
Hier is een computeralgoritme dat zegt
11:29
the picture contains a boy and a teddy bear;
183
689626
3274
dat op deze foto een jongen met teddybeer staat,
11:32
a dog, a person, and a small kite in the background;
184
692900
4366
een hond, een persoon en een vliegertje op de achtergrond,
11:37
or a picture of very busy things
185
697266
3135
of een foto met veel dingen,
11:40
like a man, a skateboard, railings, a lampost, and so on.
186
700401
4644
zoals een man, een skateboard, een hek, een lantaarnpaal, enzovoort.
11:45
Sometimes, when the computer is not so confident about what it sees,
187
705045
5293
Soms, als de computer het niet helemaal zeker weet,
11:51
we have taught it to be smart enough
188
711498
2276
hebben we hem geleerd slim genoeg te zijn
11:53
to give us a safe answer instead of committing too much,
189
713774
3878
om een veilig antwoord te geven in plaats van te veel prijs te geven,
11:57
just like we would do,
190
717652
2811
wat wij ook zouden doen.
12:00
but other times our computer algorithm is remarkable at telling us
191
720463
4666
Op andere momenten is het opmerkelijk wat het computeralgoritme ons vertelt
12:05
what exactly the objects are,
192
725129
2253
welke voorwerpen het precies zijn,
12:07
like the make, model, year of the cars.
193
727382
3436
zoals merk, model en bouwjaar van de auto.
12:10
We applied this algorithm to millions of Google Street View images
194
730818
5386
We pasten dit algoritme toe op miljoenen Google Street View-beelden
12:16
across hundreds of American cities,
195
736204
3135
dwars door honderden Amerikaanse steden,
12:19
and we have learned something really interesting:
196
739339
2926
en we bemerkten iets interessants:
12:22
first, it confirmed our common wisdom
197
742265
3320
ten eerste bevestigde het ons vermoeden
12:25
that car prices correlate very well
198
745585
3290
dat autoprijzen gelijk op gaan
12:28
with household incomes.
199
748875
2345
met gezinsinkomens.
12:31
But surprisingly, car prices also correlate well
200
751220
4527
Verrassend is echter, dat autoprijzen ook gelijk op gaan
12:35
with crime rates in cities,
201
755747
2300
met de misdaadcijfers in de steden,
of het stemgedrag met de postcode.
12:39
or voting patterns by zip codes.
202
759007
3963
Wacht even, is dat het?
12:44
So wait a minute. Is that it?
203
764060
2206
12:46
Has the computer already matched or even surpassed human capabilities?
204
766266
5153
Is de computer al net zo goed als de mens of zelfs al beter?
12:51
Not so fast.
205
771419
2138
Niet zo snel.
12:53
So far, we have just taught the computer to see objects.
206
773557
4923
Tot nu toe hebben we de computer alleen geleerd voorwerpen te bekijken.
12:58
This is like a small child learning to utter a few nouns.
207
778480
4644
Net als een kind leren een paar zelfstandige naamwoorden te zeggen.
Een ongelooflijke prestatie,
13:03
It's an incredible accomplishment,
208
783124
2670
13:05
but it's only the first step.
209
785794
2460
maar pas de eerste stap.
13:08
Soon, another developmental milestone will be hit,
210
788254
3762
Er zal vlot een volgende mijlpaal gehaald worden:
het kind zal beginnen te communiceren in zinnen.
13:12
and children begin to communicate in sentences.
211
792016
3461
13:15
So instead of saying this is a cat in the picture,
212
795477
4224
In plaats van te zeggen dat het een kat is op het plaatje,
13:19
you already heard the little girl telling us this is a cat lying on a bed.
213
799701
5202
heb je het meisje al horen zeggen dat de kat op een bed ligt.
13:24
So to teach a computer to see a picture and generate sentences,
214
804903
5595
Om een computer dus te leren om een plaatje te zien en zinnen te maken,
13:30
the marriage between big data and machine learning algorithm
215
810498
3948
moet het huwelijk tussen big data en machineleren
13:34
has to take another step.
216
814446
2275
de volgende stap nemen.
13:36
Now, the computer has to learn from both pictures
217
816721
4156
De computer moet zowel leren van plaatjes
13:40
as well as natural language sentences
218
820877
2856
als van zinnen in natuurlijke taal,
13:43
generated by humans.
219
823733
3322
voortgebracht door mensen.
13:47
Just like the brain integrates vision and language,
220
827055
3853
Net zoals de hersenen die beeld en taal integreren,
13:50
we developed a model that connects parts of visual things
221
830908
5201
hebben we een model ontwikkeld dat delen van zichtbare dingen,
13:56
like visual snippets
222
836109
1904
visuele fragmenten,
13:58
with words and phrases in sentences.
223
838013
4203
verbindt met woorden en zinsdelen.
14:02
About four months ago,
224
842216
2763
Ongeveer vier maanden geleden
14:04
we finally tied all this together
225
844979
2647
voegden we dit allemaal samen
14:07
and produced one of the first computer vision models
226
847626
3784
en maakten een van de eerste computervisie-modellen
14:11
that is capable of generating a human-like sentence
227
851410
3994
dat in staat is mensentaalachtige zinnen te maken
14:15
when it sees a picture for the first time.
228
855404
3506
als het voor de eerste keer een plaatje ziet.
14:18
Now, I'm ready to show you what the computer says
229
858910
4644
Ik ben zover dat ik wil laten zien wat de computer zegt
14:23
when it sees the picture
230
863554
1975
als die het plaatje ziet
14:25
that the little girl saw at the beginning of this talk.
231
865529
3830
van het meisje dat je aan het begin van de talk hebt gezien.
14:31
(Video) Computer: A man is standing next to an elephant.
232
871519
3344
(Video) Computer: Een man staat naast de olifant.
14:36
A large airplane sitting on top of an airport runway.
233
876393
3634
Een groot vliegtuig staat op een startbaan.
14:41
FFL: Of course, we're still working hard to improve our algorithms,
234
881057
4212
FFL: Natuurlijk werken we hard aan het verbeteren van de algoritmes
14:45
and it still has a lot to learn.
235
885269
2596
en er moet nog veel geleerd worden.
14:47
(Applause)
236
887865
2291
(Applaus)
14:51
And the computer still makes mistakes.
237
891556
3321
De computer maakt nog steeds fouten.
14:54
(Video) Computer: A cat lying on a bed in a blanket.
238
894877
3391
(Video) Computer: Een kat ligt op een bed in een laken.
14:58
FFL: So of course, when it sees too many cats,
239
898268
2553
FFL: Als hij te veel katten ziet,
15:00
it thinks everything might look like a cat.
240
900821
2926
kan hij gaan denken dat alles een kat is.
15:05
(Video) Computer: A young boy is holding a baseball bat.
241
905317
2864
(Video) Computer: Een jongetje heeft een honkbalknuppel vast.
15:08
(Laughter)
242
908181
1765
(Gelach)
15:09
FFL: Or, if it hasn't seen a toothbrush, it confuses it with a baseball bat.
243
909946
4583
FFL: Als hij nog nooit een tandenborstel heeft gezien, raakt hij in de war.
15:15
(Video) Computer: A man riding a horse down a street next to a building.
244
915309
3434
(Video) Computer: Een man rijdt paard door een straat langs een gebouw.
15:18
(Laughter)
245
918743
2023
(Gelach)
15:20
FFL: We haven't taught Art 101 to the computers.
246
920766
3552
FFL: We hebben Art 101 nog niet aan de computer geleerd.
15:25
(Video) Computer: A zebra standing in a field of grass.
247
925768
2884
(Video) Computer: Een zebra staat in een grasveld.
15:28
FFL: And it hasn't learned to appreciate the stunning beauty of nature
248
928652
3367
FFL: Het heeft nog niet geleerd de prachtige natuur te waarderen,
15:32
like you and I do.
249
932019
2438
zoals jullie en ik doen.
15:34
So it has been a long journey.
250
934457
2832
De weg is dus lang.
15:37
To get from age zero to three was hard.
251
937289
4226
Het viel niet mee om van nul naar drie jaar te komen
15:41
The real challenge is to go from three to 13 and far beyond.
252
941515
5596
Van drie tot 13 jaar of verder, is helemaal een grote uitdaging.
15:47
Let me remind you with this picture of the boy and the cake again.
253
947111
4365
Denk nog even aan dit plaatje van de jongen en de taart.
15:51
So far, we have taught the computer to see objects
254
951476
4064
Tot nu toe hebben we de computer geleerd om voorwerpen te zien
15:55
or even tell us a simple story when seeing a picture.
255
955540
4458
of zelfs een simpel verhaaltje te vertellen bij het zien van een plaatje.
15:59
(Video) Computer: A person sitting at a table with a cake.
256
959998
3576
(Video) Computer: Een persoon zit aan tafel met een taart.
16:03
FFL: But there's so much more to this picture
257
963574
2630
FFL: Maar er zit meer aan vast
dan alleen een persoon en een taart.
16:06
than just a person and a cake.
258
966204
2270
16:08
What the computer doesn't see is that this is a special Italian cake
259
968474
4467
De computer ziet niet dat dit een speciale Italiaanse taart is
16:12
that's only served during Easter time.
260
972941
3217
die alleen met Pasen wordt gegeten.
De jongen draagt zijn lievelingsshirt
16:16
The boy is wearing his favorite t-shirt
261
976158
3205
16:19
given to him as a gift by his father after a trip to Sydney,
262
979363
3970
die hij heeft gekregen van zijn vader na een reis naar Sydney,
16:23
and you and I can all tell how happy he is
263
983333
3808
en iedereen ziet hoe blij hij is
16:27
and what's exactly on his mind at that moment.
264
987141
3203
en waar hij precies aan denkt op dat moment.
Dit is mijn zoon Leo.
16:31
This is my son Leo.
265
991214
3125
16:34
On my quest for visual intelligence,
266
994339
2624
Bij mijn zoektocht naar visuele intelligentie
16:36
I think of Leo constantly
267
996963
2391
denk ik steeds aan Leo
16:39
and the future world he will live in.
268
999354
2903
en aan zijn toekomstige wereld.
16:42
When machines can see,
269
1002257
2021
Als machines kunnen zien,
16:44
doctors and nurses will have extra pairs of tireless eyes
270
1004278
4712
zullen doktoren en verpleegsters een extra paar onvermoeibare ogen hebben
16:48
to help them to diagnose and take care of patients.
271
1008990
4092
om te helpen bij de diagnose en om voor de patiënten te zorgen.
16:53
Cars will run smarter and safer on the road.
272
1013082
4383
Auto's zullen slimmer en veiliger over de weg rijden..
16:57
Robots, not just humans,
273
1017465
2694
Robots, niet alleen mensen,
zullen ons helpen rampplekken te betreden om ingeslotenen en gewonden te redden.
17:00
will help us to brave the disaster zones to save the trapped and wounded.
274
1020159
4849
17:05
We will discover new species, better materials,
275
1025798
3796
We zullen nieuwe soorten ontdekken en betere materialen,
17:09
and explore unseen frontiers with the help of the machines.
276
1029594
4509
en ongeziene gebieden verkennen met behulp van machines.
Beetje bij beetje geven we machines gezichtsvermogen.
17:15
Little by little, we're giving sight to the machines.
277
1035113
4167
17:19
First, we teach them to see.
278
1039280
2798
Eerst leren we ze te kijken.
Daarna helpen ze ons bij het kijken.
17:22
Then, they help us to see better.
279
1042078
2763
17:24
For the first time, human eyes won't be the only ones
280
1044841
4165
Voor het eerst zijn menselijke ogen niet de enige
17:29
pondering and exploring our world.
281
1049006
2934
die over de wereld nadenken en haar verkennen.
17:31
We will not only use the machines for their intelligence,
282
1051940
3460
We gaan de machines niet alleen vanwege hun intelligentie gebruiken,
17:35
we will also collaborate with them in ways that we cannot even imagine.
283
1055400
6179
en gaan met ze samenwerken
op manieren die we ons niet kunnen voorstellen.
Dit is mijn zoektocht:
17:41
This is my quest:
284
1061579
2161
17:43
to give computers visual intelligence
285
1063740
2712
computers visuele intelligentie geven
17:46
and to create a better future for Leo and for the world.
286
1066452
5131
en een betere toekomst geven aan Leo en aan de wereld.
17:51
Thank you.
287
1071583
1811
Dank je wel.
17:53
(Applause)
288
1073394
3785
(Applaus)
Over deze website

Deze site laat u kennismaken met YouTube-video's die nuttig zijn om Engels te leren. U ziet Engelse lessen gegeven door topdocenten uit de hele wereld. Dubbelklik op de Engelse ondertitels op elke videopagina om de video af te spelen. De ondertitels scrollen synchroon met het afspelen van de video. Heeft u opmerkingen of verzoeken, neem dan contact met ons op via dit contactformulier.

https://forms.gle/WvT1wiN1qDtmnspy7