How we teach computers to understand pictures | Fei Fei Li

1,159,394 views ・ 2015-03-23

TED


Dobbeltklik venligst på de engelske undertekster nedenfor for at afspille videoen.

Translator: Aviaja Josenius Reviewer: Anders Finn Jørgensen
00:14
Let me show you something.
0
14366
3738
Lad mig vise jer noget.
00:18
(Video) Girl: Okay, that's a cat sitting in a bed.
1
18104
4156
(Video) Pige: Ok, det er en kat der sidder i en seng.
00:22
The boy is petting the elephant.
2
22260
4040
Drengen klapper elefanten.
00:26
Those are people that are going on an airplane.
3
26300
4354
Det er folk, der går ind i en flymaskine.
00:30
That's a big airplane.
4
30654
2810
Det er en stor flymaskine.
00:33
Fei-Fei Li: This is a three-year-old child
5
33464
2206
Fei-Fei Li: Det her er et treårigt barn
00:35
describing what she sees in a series of photos.
6
35670
3679
der beskriver hvad hun ser i en række billeder.
00:39
She might still have a lot to learn about this world,
7
39349
2845
Hun har endnu masser at lære om verden
00:42
but she's already an expert at one very important task:
8
42194
4549
men hun er allerede ekspert i en meget vigtig ting:
00:46
to make sense of what she sees.
9
46743
2846
at få mening ud af det hun ser.
00:50
Our society is more technologically advanced than ever.
10
50229
4226
Vort samfund er mere teknologisk avanceret end nogensinde.
00:54
We send people to the moon, we make phones that talk to us
11
54455
3629
Vi sender folk til månen, vi laver telefoner der taler til os
00:58
or customize radio stations that can play only music we like.
12
58084
4946
eller tilpasser radio stationer der kan spille musik som kun vi kan lide.
01:03
Yet, our most advanced machines and computers
13
63030
4055
Alligevel har de mest avancerede maskiner og computere
01:07
still struggle at this task.
14
67085
2903
stadig problemer med dette.
01:09
So I'm here today to give you a progress report
15
69988
3459
Jeg er her idag for at give jer en statusrapport
01:13
on the latest advances in our research in computer vision,
16
73447
4047
på de nyeste fremskridt i forskningen af computer vision
01:17
one of the most frontier and potentially revolutionary
17
77494
4161
en af de mest banebrydende og muligvis revolutionære
01:21
technologies in computer science.
18
81655
3206
teknologier i computer videnskab.
01:24
Yes, we have prototyped cars that can drive by themselves,
19
84861
4551
Ja, vi har prototyper af biler, der er selvkørende
01:29
but without smart vision, they cannot really tell the difference
20
89412
3853
men uden intelligent vision kan de ikke se forskel
01:33
between a crumpled paper bag on the road, which can be run over,
21
93265
3970
mellem en krøllet pose på vejen, der kan køres over
01:37
and a rock that size, which should be avoided.
22
97235
3340
og en sten af samme størrelse, der skal undgås.
01:41
We have made fabulous megapixel cameras,
23
101415
3390
Vi har lavet fabelagtige megapixel kameraer
01:44
but we have not delivered sight to the blind.
24
104805
3135
men vi har ikke givet blinde syn.
01:48
Drones can fly over massive land,
25
108420
3305
Droner kan flyve over store landområder
01:51
but don't have enough vision technology
26
111725
2134
men vi har ikke nok vision teknologi
01:53
to help us to track the changes of the rainforests.
27
113859
3461
til at følge forandringerne i regnskoven.
01:57
Security cameras are everywhere,
28
117320
2950
Sikkerhedskameraer er allevegne
02:00
but they do not alert us when a child is drowning in a swimming pool.
29
120270
5067
men de advarer os ikke, når et barn drukner i en svømmepøl.
02:06
Photos and videos are becoming an integral part of global life.
30
126167
5595
Foto og video er blevet en integreret del af det globale liv.
02:11
They're being generated at a pace that's far beyond what any human,
31
131762
4087
De bliver fremstillet hurtigere end noget menneske
02:15
or teams of humans, could hope to view,
32
135849
2783
eller hold af folk kan nå at se
02:18
and you and I are contributing to that at this TED.
33
138632
3921
og du og jeg bidrager til det ved denne TED.
02:22
Yet our most advanced software is still struggling at understanding
34
142553
5232
Vor mest avancerede software kæmper stadig med at forstå
02:27
and managing this enormous content.
35
147785
3876
og administrere dette enorme indhold.
02:31
So in other words, collectively as a society,
36
151661
5272
Med andre ord er vi kollektivt som samfund
02:36
we're very much blind,
37
156933
1746
stadig meget blinde,
02:38
because our smartest machines are still blind.
38
158679
3387
for vor klogeste maskiner er stadig blinde.
02:43
"Why is this so hard?" you may ask.
39
163526
2926
"Hvorfor er det så svært?" spørger du måske.
02:46
Cameras can take pictures like this one
40
166452
2693
Kameraer tager billeder som dette
02:49
by converting lights into a two-dimensional array of numbers
41
169145
3994
ved at konvertere lys til en to-dimensionel række af tal
02:53
known as pixels,
42
173139
1650
kendt som pixler
02:54
but these are just lifeless numbers.
43
174789
2251
men de er kun livløse tal.
02:57
They do not carry meaning in themselves.
44
177040
3111
De har ingen mening i sig selv.
03:00
Just like to hear is not the same as to listen,
45
180151
4343
Ligesom at høre ikke er det samme som at lytte
03:04
to take pictures is not the same as to see,
46
184494
4040
er det at tage billeder ikke det samme som at se
03:08
and by seeing, we really mean understanding.
47
188534
3829
og ved at se mener vi at forstå.
03:13
In fact, it took Mother Nature 540 million years of hard work
48
193293
6177
Faktisk tog det Moder Natur 540 mio. års hårdt arbejde
03:19
to do this task,
49
199470
1973
at løse denne opgave
03:21
and much of that effort
50
201443
1881
og megen af den indsats
03:23
went into developing the visual processing apparatus of our brains,
51
203324
5271
gik til at udvikle det visuelle apparat i vor hjerner
03:28
not the eyes themselves.
52
208595
2647
og ikke selve øjnene.
03:31
So vision begins with the eyes,
53
211242
2747
Vision starter med øjnene
03:33
but it truly takes place in the brain.
54
213989
3518
men foregår virkelig i hjernen.
03:38
So for 15 years now, starting from my Ph.D. at Caltech
55
218287
5060
I 15 år nu, fra min Ph.D. i Caltech
03:43
and then leading Stanford's Vision Lab,
56
223347
2926
og bagefter da jeg førte Stanford´s Vision Lab,
03:46
I've been working with my mentors, collaborators and students
57
226273
4396
har jeg arbejdet med mine mentorer, kolleger og elever
03:50
to teach computers to see.
58
230669
2889
med at lære computere at se.
03:54
Our research field is called computer vision and machine learning.
59
234658
3294
Vort forskningsfelt kaldes computer vision og maskinlærdom.
03:57
It's part of the general field of artificial intelligence.
60
237952
3878
Det er en del af det generelle felt af kunstig intelligens.
04:03
So ultimately, we want to teach the machines to see just like we do:
61
243000
5493
Vi vil lære maskiner at se ligesom os:
04:08
naming objects, identifying people, inferring 3D geometry of things,
62
248493
5387
identificere objekter, mennesker og udlede 3D geometrien af ting
04:13
understanding relations, emotions, actions and intentions.
63
253880
5688
at forstå relationer, følelser handlinger og intentioner.
04:19
You and I weave together entire stories of people, places and things
64
259568
6153
Du og jeg udleder hele historier af folk, steder og ting
04:25
the moment we lay our gaze on them.
65
265721
2164
i det sekund vi kigger på dem.
04:28
The first step towards this goal is to teach a computer to see objects,
66
268955
5583
Første skridt mod dette mål er at lære computere at se objekter,
04:34
the building block of the visual world.
67
274538
3368
byggestenene i den visuelle verden.
04:37
In its simplest terms, imagine this teaching process
68
277906
4434
Enklest sagt, kan du forestille dig denne lærdomsproces
04:42
as showing the computers some training images
69
282340
2995
som at vise computere nogle træningsbilleder
04:45
of a particular object, let's say cats,
70
285335
3321
af et bestemt objekt, f.eks. katte
04:48
and designing a model that learns from these training images.
71
288656
4737
og designe en model der lærer af disse træningsbilleder.
04:53
How hard can this be?
72
293393
2044
Hvor svært kan det være?
04:55
After all, a cat is just a collection of shapes and colors,
73
295437
4052
En kat er jo en samling af former og farver,
04:59
and this is what we did in the early days of object modeling.
74
299489
4086
og dét er hvad vi gjorde i starten af objekt modelleringen.
05:03
We'd tell the computer algorithm in a mathematical language
75
303575
3622
Vi fortalte computer algoritmen i et matematisk sprog
05:07
that a cat has a round face, a chubby body,
76
307197
3343
at en kat har et rundt ansigt, en fyldig krop,
05:10
two pointy ears, and a long tail,
77
310540
2299
to spidse ører og en lang hale
05:12
and that looked all fine.
78
312839
1410
og det virkede fint.
05:14
But what about this cat?
79
314859
2113
Men hvad med denne kat?
05:16
(Laughter)
80
316972
1091
(Latter)
05:18
It's all curled up.
81
318063
1626
Den er helt sammenfoldet.
05:19
Now you have to add another shape and viewpoint to the object model.
82
319689
4719
Nu bliver du nødt til at tilføje en ny form og udsigtspunkt til objektet.
05:24
But what if cats are hidden?
83
324408
1715
Men hvad hvis katten er gemt?
05:27
What about these silly cats?
84
327143
2219
Hvad med disse fjollede katte?
05:31
Now you get my point.
85
331112
2417
Nu ser I problemet.
05:33
Even something as simple as a household pet
86
333529
3367
Selv noget så simpelt som et husdyr
05:36
can present an infinite number of variations to the object model,
87
336896
4504
kan lave uendelige variationer til objekt modelleringen,
05:41
and that's just one object.
88
341400
2233
og det er kun ét objekt.
05:44
So about eight years ago,
89
344573
2492
For omkring otte år siden
05:47
a very simple and profound observation changed my thinking.
90
347065
5030
forandrede en meget simpel og dyb observering min tænkemåde.
05:53
No one tells a child how to see,
91
353425
2685
Ingen fortæller et barn hvordan det ser,
05:56
especially in the early years.
92
356110
2261
særlig i de tidligste år.
05:58
They learn this through real-world experiences and examples.
93
358371
5000
De lærer dette gennem virkelige erfaringer og eksempler.
06:03
If you consider a child's eyes
94
363371
2740
Hvis man ser et barns øjne
06:06
as a pair of biological cameras,
95
366111
2554
som et par biologiske kameraer
06:08
they take one picture about every 200 milliseconds,
96
368665
4180
tager de et billede ca. hver 200 millisekunder,
06:12
the average time an eye movement is made.
97
372845
3134
gennemsnitstiden for hver bevægelse i øjnene.
06:15
So by age three, a child would have seen hundreds of millions of pictures
98
375979
5550
Ved tre-årstiden vil et barn have set hundrede mio. billeder
06:21
of the real world.
99
381529
1834
af den virkelige verden.
06:23
That's a lot of training examples.
100
383363
2280
Det er mange træningseksempler.
06:26
So instead of focusing solely on better and better algorithms,
101
386383
5989
Istedet for kun at fokusere på bedre og bedre algoritmer
06:32
my insight was to give the algorithms the kind of training data
102
392372
5272
var min indsigt at give algoritmerne den slags træningsdata
06:37
that a child was given through experiences
103
397644
3319
som et barn får gennem erfaringer
06:40
in both quantity and quality.
104
400963
3878
både i kvalitet og kvantitet.
06:44
Once we know this,
105
404841
1858
Når vi ved dette,
06:46
we knew we needed to collect a data set
106
406699
2971
kan vi begynde at samle et data sæt
06:49
that has far more images than we have ever had before,
107
409670
4459
som har langt flere billeder end vi før har haft,
06:54
perhaps thousands of times more,
108
414129
2577
måske tusindvis af gange mere,
06:56
and together with Professor Kai Li at Princeton University,
109
416706
4111
og sammen med professor Kai Li i Princeton University
07:00
we launched the ImageNet project in 2007.
110
420817
4752
startede vi ImageNet projektet i 2007.
07:05
Luckily, we didn't have to mount a camera on our head
111
425569
3838
Heldigvis behøvede vi ikke at sætte et kamera på hovedet
07:09
and wait for many years.
112
429407
1764
og vente i mange år.
07:11
We went to the Internet,
113
431171
1463
Vi tog på Internettet,
07:12
the biggest treasure trove of pictures that humans have ever created.
114
432634
4436
den største samling af billeder som mennesket nogensinde har lavet.
07:17
We downloaded nearly a billion images
115
437070
3041
Vi downloadede næsten en milliard billeder
07:20
and used crowdsourcing technology like the Amazon Mechanical Turk platform
116
440111
5880
og brugte crowdsource teknologier såsom Amazon Mechanical Turk platformen
07:25
to help us to label these images.
117
445991
2339
til at hjælpe med at sortere billederne.
07:28
At its peak, ImageNet was one of the biggest employers
118
448330
4900
På sit højeste var ImageNet en af de største arbejdsgivere
07:33
of the Amazon Mechanical Turk workers:
119
453230
2996
af alle Amazon Mechanical Turk ansatte:
07:36
together, almost 50,000 workers
120
456226
3854
tilsammen hjalp næsten 50,000 ansatte
07:40
from 167 countries around the world
121
460080
4040
fra 167 lande rundt omkring i verden
07:44
helped us to clean, sort and label
122
464120
3947
os med at rense, sortere og rubricere
07:48
nearly a billion candidate images.
123
468067
3575
næsten en milliard kandidat-billeder.
07:52
That was how much effort it took
124
472612
2653
Så megen indsats tog det
07:55
to capture even a fraction of the imagery
125
475265
3900
at fange selv en brøkdel af alle de billeder
07:59
a child's mind takes in in the early developmental years.
126
479165
4171
som et barns hjerne bearbejder i de første leveår.
08:04
In hindsight, this idea of using big data
127
484148
3902
Set i bakspejlet er denne idé med at bruge massive data
08:08
to train computer algorithms may seem obvious now,
128
488050
4550
til at træne computer algoritmer måske indlysende,
08:12
but back in 2007, it was not so obvious.
129
492600
4110
men i 2007 var det ikke så enkelt.
08:16
We were fairly alone on this journey for quite a while.
130
496710
3878
Vi var ret alene på denne rejse i et godt stykke tid.
08:20
Some very friendly colleagues advised me to do something more useful for my tenure,
131
500588
5003
Nogle venlige kolleger gav mig det råd at bruge arbejdstiden mere effektivt
08:25
and we were constantly struggling for research funding.
132
505591
4342
og vi arbejdede hårdt for at skaffe forskningsmidler.
08:29
Once, I even joked to my graduate students
133
509933
2485
Jeg jokede også med mine kandidatstuderende
08:32
that I would just reopen my dry cleaner's shop to fund ImageNet.
134
512418
4063
at jeg ville genåbne mit renseri for at skaffe penge til ImageNet.
08:36
After all, that's how I funded my college years.
135
516481
4761
Det er jo hvordan jeg finansierede mine universitetsår.
08:41
So we carried on.
136
521242
1856
Så vi fortsatte.
08:43
In 2009, the ImageNet project delivered
137
523098
3715
I 2009 leverede ImageNet projektet
08:46
a database of 15 million images
138
526813
4042
en database på 15 millioner billeder
08:50
across 22,000 classes of objects and things
139
530855
4805
bestående af 22,000 klasser af objekter og ting
08:55
organized by everyday English words.
140
535660
3320
organiseret af engelske dagligdags-ord.
08:58
In both quantity and quality,
141
538980
2926
I både kvalitet og kvantitet
09:01
this was an unprecedented scale.
142
541906
2972
var dette aldrig set før.
09:04
As an example, in the case of cats,
143
544878
3461
F.eks. i eksemplet med katte
09:08
we have more than 62,000 cats
144
548339
2809
har vi nu mere end 62,000 katte
09:11
of all kinds of looks and poses
145
551148
4110
af alle slags udseender og positioner
09:15
and across all species of domestic and wild cats.
146
555258
5223
og af alle racer af både hus- og vilde katte.
09:20
We were thrilled to have put together ImageNet,
147
560481
3344
Vi var utrolig glade for at have sammensat ImageNet,
09:23
and we wanted the whole research world to benefit from it,
148
563825
3738
og vi ville, at hele forskningsverdenen ville få gavn af dette,
09:27
so in the TED fashion, we opened up the entire data set
149
567563
4041
så på ren TED-manér åbnede vi for hele data-sættet
09:31
to the worldwide research community for free.
150
571604
3592
gratis til hele forsknings-fællesskabet.
09:36
(Applause)
151
576636
4000
(Bifald)
09:41
Now that we have the data to nourish our computer brain,
152
581416
4538
Nu, da vi har data til at nære vor computer-hjerne
09:45
we're ready to come back to the algorithms themselves.
153
585954
3737
er vi klar til at tage fat på selve algoritmerne.
09:49
As it turned out, the wealth of information provided by ImageNet
154
589691
5178
Det viste sig at overfloden af information som ImageNet gav
09:54
was a perfect match to a particular class of machine learning algorithms
155
594869
4806
passede perfekt til en særlig klasse af maskinlærings-algoritmer
09:59
called convolutional neural network,
156
599675
2415
kaldet sammenfoldede neurale netværk,
10:02
pioneered by Kunihiko Fukushima, Geoff Hinton, and Yann LeCun
157
602090
5248
udviklet af Kunihiko Fukushima, Geoff Hinton og Yann LeCun
10:07
back in the 1970s and '80s.
158
607338
3645
i 1970´erne og 80´erne.
10:10
Just like the brain consists of billions of highly connected neurons,
159
610983
5619
Ligesom hjernen består af milliarder af sammenkædede neuroner,
10:16
a basic operating unit in a neural network
160
616602
3854
er et grundlæggende armatur i et neuralt netværk
10:20
is a neuron-like node.
161
620456
2415
som en neuron-lignende node.
10:22
It takes input from other nodes
162
622871
2554
Det tager input fra andre noder
10:25
and sends output to others.
163
625425
2718
og sender output til andre.
10:28
Moreover, these hundreds of thousands or even millions of nodes
164
628143
4713
Disse hundrede tusinder eller endda millioner af noder
10:32
are organized in hierarchical layers,
165
632856
3227
er organiseret i hierarkiske lag,
10:36
also similar to the brain.
166
636083
2554
ligesom i hjernen.
10:38
In a typical neural network we use to train our object recognition model,
167
638637
4783
I et typisk neuralt netværk vi bruger til at træne vor objekt-genkendelsesmodel,
10:43
it has 24 million nodes,
168
643420
3181
er der 24 millioner knuder,
10:46
140 million parameters,
169
646601
3297
140 millioner parametre,
10:49
and 15 billion connections.
170
649898
2763
og 15 milliarder tilslutninger.
10:52
That's an enormous model.
171
652661
2415
Det er en enorm model.
10:55
Powered by the massive data from ImageNet
172
655076
3901
Drevet af de massive data fra ImageNet,
10:58
and the modern CPUs and GPUs to train such a humongous model,
173
658977
5433
og de moderne CPU´er og GPU´er brugt til at træne en så stor model,
11:04
the convolutional neural network
174
664410
2369
begyndte det sammenfoldede neurale netværk
11:06
blossomed in a way that no one expected.
175
666779
3436
at blomstre på en måde ingen forventede.
11:10
It became the winning architecture
176
670215
2508
Det blev den førende arkitektur
11:12
to generate exciting new results in object recognition.
177
672723
5340
til at genere spændende nye resultater i objekt-genkendelse.
11:18
This is a computer telling us
178
678063
2810
Dét her er en computer, der fortæller os
11:20
this picture contains a cat
179
680873
2300
at dette billede indeholder en kat
11:23
and where the cat is.
180
683173
1903
og hvor katten er.
11:25
Of course there are more things than cats,
181
685076
2112
Der er selvfølgelig andre ting end katte
11:27
so here's a computer algorithm telling us
182
687188
2438
så her er en computer algoritme der fortæller
11:29
the picture contains a boy and a teddy bear;
183
689626
3274
at dette billede indeholder en dreng og en bamse;
11:32
a dog, a person, and a small kite in the background;
184
692900
4366
en hund, en person og en lille drage i baggrunden;
11:37
or a picture of very busy things
185
697266
3135
eller et billede af meget travle ting
11:40
like a man, a skateboard, railings, a lampost, and so on.
186
700401
4644
som en mand, et skateboard, rækværk, en lygtepæl, og så videre.
11:45
Sometimes, when the computer is not so confident about what it sees,
187
705045
5293
Sommetider, når computeren ikke er så sikker på hvad den ser,
11:51
we have taught it to be smart enough
188
711498
2276
har den lært at være klog nok
11:53
to give us a safe answer instead of committing too much,
189
713774
3878
til at give os et sikkert svar i stedet for at være for skråsikker sig,
11:57
just like we would do,
190
717652
2811
ligesom vi ville,
12:00
but other times our computer algorithm is remarkable at telling us
191
720463
4666
men som regel er algoritmen utrolig god til at fortælle os
12:05
what exactly the objects are,
192
725129
2253
præcis hvad objekterne er,
12:07
like the make, model, year of the cars.
193
727382
3436
som fremstillingen, modellen og årgangen af bilerne.
12:10
We applied this algorithm to millions of Google Street View images
194
730818
5386
Vi anvendte algoritmerne i mio. af Google Street View billeder
12:16
across hundreds of American cities,
195
736204
3135
i hundreder af amerikanske byer,
12:19
and we have learned something really interesting:
196
739339
2926
og vi har lært noget meget interessant:
12:22
first, it confirmed our common wisdom
197
742265
3320
vi fik bekræftet den gængse viden
12:25
that car prices correlate very well
198
745585
3290
at bilpriser korrelerer meget godt
12:28
with household incomes.
199
748875
2345
med husholdningsindtægter.
12:31
But surprisingly, car prices also correlate well
200
751220
4527
Men overraskende nok korrelerer bilpriser godt
12:35
with crime rates in cities,
201
755747
2300
med kriminalitet i byer,
12:39
or voting patterns by zip codes.
202
759007
3963
eller stemmemønstre ved postnumre.
12:44
So wait a minute. Is that it?
203
764060
2206
Vent lidt. Er dét alt?
12:46
Has the computer already matched or even surpassed human capabilities?
204
766266
5153
Har computeren allerede nået eller endda overhalet menneskelige evner?
12:51
Not so fast.
205
771419
2138
Øjeblik.
12:53
So far, we have just taught the computer to see objects.
206
773557
4923
Indtil videre har vi kun lært computeren at se objekter.
12:58
This is like a small child learning to utter a few nouns.
207
778480
4644
Det er ligesom et barn, der lærer at udtale nogle få navneord.
13:03
It's an incredible accomplishment,
208
783124
2670
Det er en utrolig stor udrettelse,
13:05
but it's only the first step.
209
785794
2460
men det er kun første skridt.
13:08
Soon, another developmental milestone will be hit,
210
788254
3762
Snart vil en ny udviklingsmæssig milepæl blive nået,
13:12
and children begin to communicate in sentences.
211
792016
3461
og barnet begynder at kommunikere i sætninger.
13:15
So instead of saying this is a cat in the picture,
212
795477
4224
Istedet for at sige at dette er en kat på billedet,
13:19
you already heard the little girl telling us this is a cat lying on a bed.
213
799701
5202
har vi allerede hørt pigen sige, at dette er en kat der ligger på en seng.
13:24
So to teach a computer to see a picture and generate sentences,
214
804903
5595
For at lære en computer at se et billede og lave sætninger,
13:30
the marriage between big data and machine learning algorithm
215
810498
3948
må sammenføringen af massive data og maskinlærings-algoritmer
13:34
has to take another step.
216
814446
2275
tages til et nyt niveau.
13:36
Now, the computer has to learn from both pictures
217
816721
4156
Nu må computeren lære fra både billeder
13:40
as well as natural language sentences
218
820877
2856
og naturlige sprog-sætninger
13:43
generated by humans.
219
823733
3322
fra mennesker.
13:47
Just like the brain integrates vision and language,
220
827055
3853
Ligesom hjernen integrerer vision og sprog
13:50
we developed a model that connects parts of visual things
221
830908
5201
har vi udviklet en model, der sammenfører dele af visuelle ting,
13:56
like visual snippets
222
836109
1904
eller visuelle klip,
13:58
with words and phrases in sentences.
223
838013
4203
med ord og fraser i sætninger.
14:02
About four months ago,
224
842216
2763
For fire måneder siden
14:04
we finally tied all this together
225
844979
2647
fik vi endelig sammensat alt dette
14:07
and produced one of the first computer vision models
226
847626
3784
og producerede en af de første computervision modeller
14:11
that is capable of generating a human-like sentence
227
851410
3994
der er i stand til at lave en menneskelignende sætning
14:15
when it sees a picture for the first time.
228
855404
3506
når den ser et billede for første gang.
14:18
Now, I'm ready to show you what the computer says
229
858910
4644
Nu er jeg klar til at vise jer hvad computeren siger,
14:23
when it sees the picture
230
863554
1975
når den ser billedet af
14:25
that the little girl saw at the beginning of this talk.
231
865529
3830
hvad den lille pige så i starten af dette foredrag.
14:31
(Video) Computer: A man is standing next to an elephant.
232
871519
3344
(Video) Computer: En mand står ved siden af en elefant.
14:36
A large airplane sitting on top of an airport runway.
233
876393
3634
Et stort fly står på en landingsbane i en lufthavn.
14:41
FFL: Of course, we're still working hard to improve our algorithms,
234
881057
4212
FFL: Selvfølgelig arbejder vi stadig hårdt med at forbedre vor algoritmer,
14:45
and it still has a lot to learn.
235
885269
2596
og den har stadig meget at lære.
14:47
(Applause)
236
887865
2291
(Bifald)
14:51
And the computer still makes mistakes.
237
891556
3321
Og computeren laver stadig fejl.
14:54
(Video) Computer: A cat lying on a bed in a blanket.
238
894877
3391
(Video) Computer: En kat ligger i et tæppe på en seng.
14:58
FFL: So of course, when it sees too many cats,
239
898268
2553
FFL: Så selvfølgelig, når den ser for mange katte,
15:00
it thinks everything might look like a cat.
240
900821
2926
tror den at alt ligner en kat.
15:05
(Video) Computer: A young boy is holding a baseball bat.
241
905317
2864
(Video) Comp.: En lille dreng holder et baseball bat.
15:08
(Laughter)
242
908181
1765
(Latter)
15:09
FFL: Or, if it hasn't seen a toothbrush, it confuses it with a baseball bat.
243
909946
4583
FFL: Eller hvis den ikke har set en tand- børste før, tror den at det er et bat.
15:15
(Video) Computer: A man riding a horse down a street next to a building.
244
915309
3434
(Video) Comp.: En mand rider en hest på en vej ved siden af en bygning.
15:18
(Laughter)
245
918743
2023
(Latter)
15:20
FFL: We haven't taught Art 101 to the computers.
246
920766
3552
FFL: Vi har ikke lært computere kunst.
15:25
(Video) Computer: A zebra standing in a field of grass.
247
925768
2884
(Video) Comp.: En zebra står på en eng.
15:28
FFL: And it hasn't learned to appreciate the stunning beauty of nature
248
928652
3367
FFL: Og den har ikke lært at værdsætte naturens utrolige skønhed
15:32
like you and I do.
249
932019
2438
som du og jeg.
15:34
So it has been a long journey.
250
934457
2832
Så det har været en lang rejse.
15:37
To get from age zero to three was hard.
251
937289
4226
Det var svært at nå treårsalderen.
15:41
The real challenge is to go from three to 13 and far beyond.
252
941515
5596
Udfordringen ligger i at nå 13-årsstadiet og endnu længere frem.
15:47
Let me remind you with this picture of the boy and the cake again.
253
947111
4365
Lad mig minde jer om billedet af drengen og kagen igen.
15:51
So far, we have taught the computer to see objects
254
951476
4064
Indtil videre har vi lært computere at se objekter
15:55
or even tell us a simple story when seeing a picture.
255
955540
4458
eller endda fortælle en simpel historie når den ser et billede.
15:59
(Video) Computer: A person sitting at a table with a cake.
256
959998
3576
(Video) Computer.: En person sidder ved et bord med en kage.
16:03
FFL: But there's so much more to this picture
257
963574
2630
FFL: Men der er så meget mere ved dette billede
16:06
than just a person and a cake.
258
966204
2270
end kun en person og en kage.
16:08
What the computer doesn't see is that this is a special Italian cake
259
968474
4467
Hvad computeren ikke ser, er at dette er en speciel italiensk kage
16:12
that's only served during Easter time.
260
972941
3217
som kun bliver serveret ved påske.
16:16
The boy is wearing his favorite t-shirt
261
976158
3205
Drengen er i sin yndlings t-shirt
16:19
given to him as a gift by his father after a trip to Sydney,
262
979363
3970
som hans far gav ham efter en tur til Sydney,
16:23
and you and I can all tell how happy he is
263
983333
3808
og vi kan se hvor glad han er
16:27
and what's exactly on his mind at that moment.
264
987141
3203
og præcis hvad han tænker i dette øjeblik.
16:31
This is my son Leo.
265
991214
3125
Dette er min søn Leo.
16:34
On my quest for visual intelligence,
266
994339
2624
På min mission for visuel intelligens
16:36
I think of Leo constantly
267
996963
2391
tænker jeg konstant på Leo
16:39
and the future world he will live in.
268
999354
2903
og fremtidens verden han vil leve i.
16:42
When machines can see,
269
1002257
2021
Når maskiner kan se
16:44
doctors and nurses will have extra pairs of tireless eyes
270
1004278
4712
vil læger og sygeplejersker have ekstra utrættelige øjne
16:48
to help them to diagnose and take care of patients.
271
1008990
4092
til at hjælpe med at diagnosticere og pleje patienter.
16:53
Cars will run smarter and safer on the road.
272
1013082
4383
Biler vil være klogere og sikrere på vejene.
16:57
Robots, not just humans,
273
1017465
2694
Robotter, ikke kun mennesker,
17:00
will help us to brave the disaster zones to save the trapped and wounded.
274
1020159
4849
vil hjælpe med at redde sårede mennesker på ulykkessteder.
17:05
We will discover new species, better materials,
275
1025798
3796
Vi vil opdage nye arter, bedre materialer,
17:09
and explore unseen frontiers with the help of the machines.
276
1029594
4509
og udforske nye territorier ved hjælp af maskiner.
17:15
Little by little, we're giving sight to the machines.
277
1035113
4167
Vi lærer maskiner at se med tiden.
17:19
First, we teach them to see.
278
1039280
2798
Først lærer vi dem at se.
17:22
Then, they help us to see better.
279
1042078
2763
Så lærer de os at se bedre.
17:24
For the first time, human eyes won't be the only ones
280
1044841
4165
For første gang vil menneskelige øjne ikke være de eneste
17:29
pondering and exploring our world.
281
1049006
2934
som iagttager og udforsker vor verden.
17:31
We will not only use the machines for their intelligence,
282
1051940
3460
Vi vil ikke blot bruge maskiner for deres intelligens,
17:35
we will also collaborate with them in ways that we cannot even imagine.
283
1055400
6179
vi vil også samarbejde med dem på måder vi end ikke kan forestille os.
17:41
This is my quest:
284
1061579
2161
Dette er min mission:
17:43
to give computers visual intelligence
285
1063740
2712
at give computere visuel intelligens
17:46
and to create a better future for Leo and for the world.
286
1066452
5131
og at skabe en bedre fremtid for Leo og for verden.
17:51
Thank you.
287
1071583
1811
Tak skal I have.
17:53
(Applause)
288
1073394
3785
(Bifald)
Om denne hjemmeside

På dette websted kan du se YouTube-videoer, der er nyttige til at lære engelsk. Du vil se engelskundervisning, der er udført af førsteklasses lærere fra hele verden. Dobbeltklik på de engelske undertekster, der vises på hver videoside, for at afspille videoen derfra. Underteksterne ruller i takt med videoafspilningen. Hvis du har kommentarer eller ønsker, bedes du kontakte os ved hjælp af denne kontaktformular.

https://forms.gle/WvT1wiN1qDtmnspy7