How we teach computers to understand pictures | Fei Fei Li

1,159,394 views ・ 2015-03-23

TED


Bitte doppelklicken Sie auf die englischen Untertitel unten, um das Video abzuspielen.

Lektorat: Andreas Herzog
00:14
Let me show you something.
0
14366
3738
Ich möchte Ihnen etwas zeigen.
(Video) Mädchen: Okay. Das ist eine Katze, die auf einem Bett sitzt.
00:18
(Video) Girl: Okay, that's a cat sitting in a bed.
1
18104
4156
00:22
The boy is petting the elephant.
2
22260
4040
Der Junge streichelt den Elefanten.
00:26
Those are people that are going on an airplane.
3
26300
4354
Das sind Menschen, die ein Flugzeug besteigen.
00:30
That's a big airplane.
4
30654
2810
Das ist ein großes Flugzeug.
00:33
Fei-Fei Li: This is a three-year-old child
5
33464
2206
Fei-Fei Li: Das ist ein dreijähiges Kind,
00:35
describing what she sees in a series of photos.
6
35670
3679
das beschreibt, was es auf einigen Fotos sieht.
00:39
She might still have a lot to learn about this world,
7
39349
2845
Sie muss wahrscheinlich noch viel über diese Welt lernen,
00:42
but she's already an expert at one very important task:
8
42194
4549
aber sie ist bereits Expertin hinsichtlich einer sehr wichtigen Aufgabe:
00:46
to make sense of what she sees.
9
46743
2846
Sie versteht, was sie sieht.
00:50
Our society is more technologically advanced than ever.
10
50229
4226
Unsere Gesellschaft ist technologisch fortgeschrittener als je zuvor.
00:54
We send people to the moon, we make phones that talk to us
11
54455
3629
Wir schicken Menschen zum Mond, stellen Telefone her, die mit uns reden
00:58
or customize radio stations that can play only music we like.
12
58084
4946
oder stellen Radiosender auf unseren individuellen Musikgeschmack ein.
01:03
Yet, our most advanced machines and computers
13
63030
4055
Dennoch haben selbst unsere fortschrittlichsten Maschinen und Computer
01:07
still struggle at this task.
14
67085
2903
immer noch Probleme mit dieser Aufgabe.
01:09
So I'm here today to give you a progress report
15
69988
3459
Ich werde Ihnen heute von den Fortschritten erzählen,
01:13
on the latest advances in our research in computer vision,
16
73447
4047
die wir in unserem Forschungsgebiet der Computer Vision gemacht haben,
01:17
one of the most frontier and potentially revolutionary
17
77494
4161
einer der bahnbrechendsten und vielleicht revolutionärsten Technologien
01:21
technologies in computer science.
18
81655
3206
in der Informatik.
01:24
Yes, we have prototyped cars that can drive by themselves,
19
84861
4551
Wir haben Autos entwickelt, die eigenständig fahren können,
01:29
but without smart vision, they cannot really tell the difference
20
89412
3853
aber ohne intelligentes Sehvermögen können sie nicht unterscheiden,
01:33
between a crumpled paper bag on the road, which can be run over,
21
93265
3970
ob auf der Straße eine zerknitterte Papiertüte liegt, die man überfahren kann,
01:37
and a rock that size, which should be avoided.
22
97235
3340
oder ein Stein von gleicher Größe, dem man ausgeweichen muss.
01:41
We have made fabulous megapixel cameras,
23
101415
3390
Wir haben sagenhaft hochauflösende Kameras entwickelt,
01:44
but we have not delivered sight to the blind.
24
104805
3135
aber wir können Blinde nicht wieder sehen lassen.
01:48
Drones can fly over massive land,
25
108420
3305
Drohnen können über riesige Distanzen fliegen,
01:51
but don't have enough vision technology
26
111725
2134
besitzen aber nicht die nötige Sichttechnologie,
01:53
to help us to track the changes of the rainforests.
27
113859
3461
um die Veränderungen der Regenwälder nachzuverfolgen.
01:57
Security cameras are everywhere,
28
117320
2950
Überwachungskameras sind überall,
02:00
but they do not alert us when a child is drowning in a swimming pool.
29
120270
5067
aber warnen uns nicht, wenn ein Kind im Schwimmbad ertrinkt.
02:06
Photos and videos are becoming an integral part of global life.
30
126167
5595
Bilder und Videos werden immer mehr zu einem festen Bestandteil des Lebens.
02:11
They're being generated at a pace that's far beyond what any human,
31
131762
4087
Sie werden in einer Geschwindigkeit erzeugt, die weit jenseits dessen liegt,
02:15
or teams of humans, could hope to view,
32
135849
2783
was Menschen sich auch nur erhoffen könnten zu sichten.
02:18
and you and I are contributing to that at this TED.
33
138632
3921
Sie und ich tragen mit diesem TED Talk gerade dazu bei.
02:22
Yet our most advanced software is still struggling at understanding
34
142553
5232
Unsere fortschrittlichste Software hat noch immer Probleme
02:27
and managing this enormous content.
35
147785
3876
beim Verstehen und Verwalten dieser enormen Masse an Inhalten.
02:31
So in other words, collectively as a society,
36
151661
5272
Man kann soweit gehen und sagen, dass wir als Gesellschaft
02:36
we're very much blind,
37
156933
1746
nahezu blind sind,
02:38
because our smartest machines are still blind.
38
158679
3387
weil unsere klügsten Maschinen immer noch blind sind.
02:43
"Why is this so hard?" you may ask.
39
163526
2926
"Warum ist das so schwierig?", fragen Sie sich vielleicht.
02:46
Cameras can take pictures like this one
40
166452
2693
Kameras können solche Bilder schießen,
02:49
by converting lights into a two-dimensional array of numbers
41
169145
3994
indem sie Licht in eine zweidimensionale Matrix aus Zahlen umwandeln,
02:53
known as pixels,
42
173139
1650
besser bekannt als Pixel.
02:54
but these are just lifeless numbers.
43
174789
2251
Aber das sind nur leblose Zahlen.
02:57
They do not carry meaning in themselves.
44
177040
3111
Sie sind an sich bedeutungslos.
03:00
Just like to hear is not the same as to listen,
45
180151
4343
Hören ist nicht dasselbe wie Verstehen.
03:04
to take pictures is not the same as to see,
46
184494
4040
Ebenso ist Fotografieren nicht dasselbe wie Sehen.
03:08
and by seeing, we really mean understanding.
47
188534
3829
Mit Sehen meinen wir genauer gesagt Verstehen.
03:13
In fact, it took Mother Nature 540 million years of hard work
48
193293
6177
Tatsächlich hat Mutter Natur 540 Millionen Jahre gebraucht,
um diese Aufgabe zu lösen.
03:19
to do this task,
49
199470
1973
03:21
and much of that effort
50
201443
1881
Ein Großteil des Aufwands
03:23
went into developing the visual processing apparatus of our brains,
51
203324
5271
war die Entwicklung der visuellen Verarbeitungskapazität unseres Gehirns,
03:28
not the eyes themselves.
52
208595
2647
gar nicht der Augen an sich.
03:31
So vision begins with the eyes,
53
211242
2747
Das Sehen beginnt mit den Augen,
03:33
but it truly takes place in the brain.
54
213989
3518
geschieht aber eigentlich im Gehirn.
03:38
So for 15 years now, starting from my Ph.D. at Caltech
55
218287
5060
Vor 15 Jahren begann ich meine Doktorarbeit am Caltech,
03:43
and then leading Stanford's Vision Lab,
56
223347
2926
danach leitete ich das Vision Lab in Stanford.
03:46
I've been working with my mentors, collaborators and students
57
226273
4396
Die ganze Zeit arbeitete ich mit Mentoren, Mitarbeitern und Studenten daran,
03:50
to teach computers to see.
58
230669
2889
Computern das Sehen beizubringen.
03:54
Our research field is called computer vision and machine learning.
59
234658
3294
Unser Forschungsgebiet nennt sich Computer Vision und Maschinelles Lernen.
03:57
It's part of the general field of artificial intelligence.
60
237952
3878
Es gehört zum allgemeinen Gebiet der Künstlichen Intelligenz.
04:03
So ultimately, we want to teach the machines to see just like we do:
61
243000
5493
Schlussendlich wollen wir Geräten beibringen, so wie wir zu sehen:
04:08
naming objects, identifying people, inferring 3D geometry of things,
62
248493
5387
Objekte benennen, Menschen erkennen, Dreidimensionalität von Objekten erfassen,
04:13
understanding relations, emotions, actions and intentions.
63
253880
5688
Beziehungen, Emotionen, Handlungen und Absichten verstehen.
04:19
You and I weave together entire stories of people, places and things
64
259568
6153
Sie und ich begreifen ganze Geschichten zwischen Menschen, Orten und Dingen
04:25
the moment we lay our gaze on them.
65
265721
2164
in Sekundenschnelle, wenn wir einen Blick darauf werfen.
04:28
The first step towards this goal is to teach a computer to see objects,
66
268955
5583
Der erste Schritt ist es, Computern die Objekterkennung beizubringen,
04:34
the building block of the visual world.
67
274538
3368
einzelne Bausteine der visuellen Welt.
04:37
In its simplest terms, imagine this teaching process
68
277906
4434
Grundsätzlich können Sie sich diesen Lehrprozess so vorstellen,
04:42
as showing the computers some training images
69
282340
2995
dass wir den Computern einige Trainingsbilder
04:45
of a particular object, let's say cats,
70
285335
3321
von bestimmten Objekten zeigen, zum Beispiel von Katzen,
04:48
and designing a model that learns from these training images.
71
288656
4737
und ein Modell entwerfen, das von diesen Trainingsbildern lernt.
04:53
How hard can this be?
72
293393
2044
Wie schwer kann das schon sein?
04:55
After all, a cat is just a collection of shapes and colors,
73
295437
4052
Im Grunde besteht eine Katze aus einer Reihe verschiedener Formen und Farben.
04:59
and this is what we did in the early days of object modeling.
74
299489
4086
Genau das waren unsere ersten Schritte in der Objektmodellierung.
05:03
We'd tell the computer algorithm in a mathematical language
75
303575
3622
Wir sagten dem Computeralgorithmus in einer mathematischen Sprache,
05:07
that a cat has a round face, a chubby body,
76
307197
3343
dass eine Katze ein rundes Gesicht, einen pummeligen Körper,
05:10
two pointy ears, and a long tail,
77
310540
2299
zwei spitze Ohren und einen langen Schwanz hat.
05:12
and that looked all fine.
78
312839
1410
Das sah ganz gut aus.
05:14
But what about this cat?
79
314859
2113
Aber wie ist es mit dieser Katze?
05:16
(Laughter)
80
316972
1091
(Lachen)
05:18
It's all curled up.
81
318063
1626
Sie ist ganz zusammengekuschelt.
05:19
Now you have to add another shape and viewpoint to the object model.
82
319689
4719
Jetzt muss man eine andere Form und eine Perspektive zum Objektmodell hinzufügen.
05:24
But what if cats are hidden?
83
324408
1715
Wie sieht es mit versteckten Katzen aus?
05:27
What about these silly cats?
84
327143
2219
Was ist mit diesen albernen Katzen?
05:31
Now you get my point.
85
331112
2417
Jetzt verstehen Sie mich sicherlich.
05:33
Even something as simple as a household pet
86
333529
3367
Sogar etwas so Einfaches wie ein Haustier
05:36
can present an infinite number of variations to the object model,
87
336896
4504
kann für das Objektmodell unendlich viele Variationen annehmen.
05:41
and that's just one object.
88
341400
2233
Und das ist nur ein Objekt.
05:44
So about eight years ago,
89
344573
2492
Vor etwa acht Jahren
05:47
a very simple and profound observation changed my thinking.
90
347065
5030
veränderte eine sehr einfache und grundlegende Beobachtung mein Denken.
05:53
No one tells a child how to see,
91
353425
2685
Niemand sagt einem Kind, wie es zu sehen hat,
05:56
especially in the early years.
92
356110
2261
erst recht nicht am Anfang.
05:58
They learn this through real-world experiences and examples.
93
358371
5000
Sie lernen durch eigene Erfahrungen und Beispiele.
06:03
If you consider a child's eyes
94
363371
2740
Wenn man sich die Augen eines Kindes
06:06
as a pair of biological cameras,
95
366111
2554
als ein Paar biologischer Kameras vorstellt,
06:08
they take one picture about every 200 milliseconds,
96
368665
4180
schießen diese alle 200 Millisekunden ein Bild.
06:12
the average time an eye movement is made.
97
372845
3134
Das ist die durchschnittliche Dauer einer Augenbewegung.
06:15
So by age three, a child would have seen hundreds of millions of pictures
98
375979
5550
Mit drei Jahren hat ein Kind also mehrere hundert Millionen Bilder
06:21
of the real world.
99
381529
1834
der realen Welt gesehen.
06:23
That's a lot of training examples.
100
383363
2280
Das sind sehr viel Übungsbeispiele.
06:26
So instead of focusing solely on better and better algorithms,
101
386383
5989
Ich erkannte, dass der Fokus nicht auf immer besseren Algorithmen liegen muss,
06:32
my insight was to give the algorithms the kind of training data
102
392372
5272
sondern dass wir den Algorithmen die Art von Übungsdaten geben müssen,
06:37
that a child was given through experiences
103
397644
3319
die ein Kind durch seine Erfahrungen sammelt,
06:40
in both quantity and quality.
104
400963
3878
sowohl quantitativ und qualitativ.
06:44
Once we know this,
105
404841
1858
Mit dieser Erkenntnis
06:46
we knew we needed to collect a data set
106
406699
2971
war es unsere Aufgabe, einen Datensatz zusammenzustellen,
06:49
that has far more images than we have ever had before,
107
409670
4459
der weit mehr Bilder beinhaltete, als alles bisher Dagewesene.
06:54
perhaps thousands of times more,
108
414129
2577
Vielleicht tausendfach mehr Bilder.
06:56
and together with Professor Kai Li at Princeton University,
109
416706
4111
Zusammen mit Professor Kai Li von der Princeton University
07:00
we launched the ImageNet project in 2007.
110
420817
4752
starteten wir 2007 das ImageNet Projekt.
07:05
Luckily, we didn't have to mount a camera on our head
111
425569
3838
Zum Glück mussten wir keine Kameras an unseren Köpfen anbringen
07:09
and wait for many years.
112
429407
1764
und viele Jahre warten.
07:11
We went to the Internet,
113
431171
1463
Wir nutzten das Internet,
07:12
the biggest treasure trove of pictures that humans have ever created.
114
432634
4436
die größte Fundgrube für Bilder, die die Menschheit erschaffen hat.
07:17
We downloaded nearly a billion images
115
437070
3041
Wir haben fast eine Milliarde Bilder heruntergeladen
07:20
and used crowdsourcing technology like the Amazon Mechanical Turk platform
116
440111
5880
und mithilfe von Crowdsourcing wie der Amazon Mechanical Turk Plattform
07:25
to help us to label these images.
117
445991
2339
all diese Bilder kategorisiert.
07:28
At its peak, ImageNet was one of the biggest employers
118
448330
4900
Zu Spitzenzeiten war ImageNet einer der größten Arbeitgeber
07:33
of the Amazon Mechanical Turk workers:
119
453230
2996
für Amazon Mechanical Turk Mitarbeiter:
07:36
together, almost 50,000 workers
120
456226
3854
Insgesamt bekamen wir Hilfe von fast 50.000 Arbeitern
07:40
from 167 countries around the world
121
460080
4040
aus 167 Ländern weltweit
07:44
helped us to clean, sort and label
122
464120
3947
beim Bereinigen, Sortieren und Benennen
07:48
nearly a billion candidate images.
123
468067
3575
von fast einer Milliarde Bildern.
07:52
That was how much effort it took
124
472612
2653
Das zeigt, wieviel Aufwand nötig war,
07:55
to capture even a fraction of the imagery
125
475265
3900
um auch nur einen Bruchteil der Bilder zu erfassen,
07:59
a child's mind takes in in the early developmental years.
126
479165
4171
die ein Kind in den frühen Jahren seiner Entwicklung verarbeitet.
Rückblickend wirkt die Idee, riesengroße Datensätze zu nutzen,
08:04
In hindsight, this idea of using big data
127
484148
3902
08:08
to train computer algorithms may seem obvious now,
128
488050
4550
um Computeralgorithmen zu trainieren, absolut naheliegend.
08:12
but back in 2007, it was not so obvious.
129
492600
4110
Doch 2007 war das nicht so offensichtlich.
08:16
We were fairly alone on this journey for quite a while.
130
496710
3878
Wir waren auf dieser Reise lange Zeit ziemlich allein.
08:20
Some very friendly colleagues advised me to do something more useful for my tenure,
131
500588
5003
Einige Kollegen rieten mir, mit meiner Anstellung etwas Sinnvolleres zu tun
08:25
and we were constantly struggling for research funding.
132
505591
4342
und wir kämpften ständig um die Finanzierung der Forschung.
08:29
Once, I even joked to my graduate students
133
509933
2485
Einmal scherzte ich mit meinen Studenten darüber,
08:32
that I would just reopen my dry cleaner's shop to fund ImageNet.
134
512418
4063
meine alte Textilreinigung wieder zu öffnen, um ImageNet zu finanzieren.
08:36
After all, that's how I funded my college years.
135
516481
4761
Immerhin hatte ich so auch mein Studium finanziert.
08:41
So we carried on.
136
521242
1856
Also machten wir weiter.
08:43
In 2009, the ImageNet project delivered
137
523098
3715
2009 lieferte das ImageNet-Projekt
08:46
a database of 15 million images
138
526813
4042
eine Datenbank mit über 15 Millionen Bildern,
08:50
across 22,000 classes of objects and things
139
530855
4805
die 22.000 Objektkategorien umfassten
08:55
organized by everyday English words.
140
535660
3320
und nach englischen Alltagsbegriffen geordnet waren.
08:58
In both quantity and quality,
141
538980
2926
Sowohl quantitativ, als auch qualitativ
09:01
this was an unprecedented scale.
142
541906
2972
war das ein noch nie dagewesener Umfang.
09:04
As an example, in the case of cats,
143
544878
3461
Zurück zum Katzenbeispiel:
09:08
we have more than 62,000 cats
144
548339
2809
Wir haben mehr als 62.000 Katzen
09:11
of all kinds of looks and poses
145
551148
4110
mit verschiedenstem Aussehen und in allerlei Posen
09:15
and across all species of domestic and wild cats.
146
555258
5223
über alle Rassen von Haus- und Wildkatzen hinweg.
09:20
We were thrilled to have put together ImageNet,
147
560481
3344
Wir waren begeistert, ImageNet aufgebaut zu haben,
09:23
and we wanted the whole research world to benefit from it,
148
563825
3738
und wollten, dass die ganze Forschungswelt davon profitiert.
09:27
so in the TED fashion, we opened up the entire data set
149
567563
4041
Ganz nach TED-Art machten wir daher unseren kompletten Datensatz
09:31
to the worldwide research community for free.
150
571604
3592
für Wissenschaftler aus aller Welt kostenlos verfügbar.
(Applaus)
09:36
(Applause)
151
576636
4000
09:41
Now that we have the data to nourish our computer brain,
152
581416
4538
Da wir nun die Daten haben, um unser Computerhirn zu füttern,
09:45
we're ready to come back to the algorithms themselves.
153
585954
3737
können wir jetzt zu den Algorithmen zurückkommen.
09:49
As it turned out, the wealth of information provided by ImageNet
154
589691
5178
Es stellte sich heraus, dass die Informationsfülle auf ImageNet
09:54
was a perfect match to a particular class of machine learning algorithms
155
594869
4806
perfekt zu einer bestimmten Art von Machine Learning-Algorithmen passte,
09:59
called convolutional neural network,
156
599675
2415
sogenannte "faltende neuronale Netzwerke",
10:02
pioneered by Kunihiko Fukushima, Geoff Hinton, and Yann LeCun
157
602090
5248
entwickelt von Kunihiko Fukushima, Geoff Hinton und Yann LeCun
10:07
back in the 1970s and '80s.
158
607338
3645
und das schon in den 70er und 80er Jahren.
10:10
Just like the brain consists of billions of highly connected neurons,
159
610983
5619
So wie unser Gehirn aus Milliarden von stark vernetzten Neuronen besteht,
10:16
a basic operating unit in a neural network
160
616602
3854
ist die einfachste Betriebseinheit eines neuronalen Netzwerks
10:20
is a neuron-like node.
161
620456
2415
ein neuronenähnlicher Knotenpunkt.
10:22
It takes input from other nodes
162
622871
2554
Er erhält Input von anderen Knotenpunkten
10:25
and sends output to others.
163
625425
2718
und sendet Output an andere.
10:28
Moreover, these hundreds of thousands or even millions of nodes
164
628143
4713
Zusätzlich sind diese hunderttausende oder sogar Millionen von Knotenpunkten
10:32
are organized in hierarchical layers,
165
632856
3227
in hierarchischen Schichten organisiert,
10:36
also similar to the brain.
166
636083
2554
auch das ähnlich wie im Gehirn.
10:38
In a typical neural network we use to train our object recognition model,
167
638637
4783
Ein typisches Neuronales Netz, das unser Objekterkennungsmodell trainiert,
10:43
it has 24 million nodes,
168
643420
3181
besitzt 24 Millionen Knotenpunkte,
10:46
140 million parameters,
169
646601
3297
140 Millionen Parameter
10:49
and 15 billion connections.
170
649898
2763
und 15 Milliarden Verbindungen.
10:52
That's an enormous model.
171
652661
2415
Das ist ein riesiges Modell.
10:55
Powered by the massive data from ImageNet
172
655076
3901
Dank der immensen Datenmenge von ImageNet
10:58
and the modern CPUs and GPUs to train such a humongous model,
173
658977
5433
und der modernen CPUs und GPUs, auf denen wir dieses gigantische Modell trainieren,
11:04
the convolutional neural network
174
664410
2369
blühte das faltende neuronale Netzwerk
11:06
blossomed in a way that no one expected.
175
666779
3436
auf eine Weise auf, die niemand erwartet hatte.
11:10
It became the winning architecture
176
670215
2508
Es wurde die erfolgreichste Struktur,
11:12
to generate exciting new results in object recognition.
177
672723
5340
um spannende neue Ergebnisse in der Objekterkennung zu generieren.
11:18
This is a computer telling us
178
678063
2810
Das ist ein Computer, der uns sagt,
11:20
this picture contains a cat
179
680873
2300
dass auf diesem Bild eine Katze zu sehen ist
11:23
and where the cat is.
180
683173
1903
und wo sich diese Katze befindet.
11:25
Of course there are more things than cats,
181
685076
2112
Natürlich gibt es noch mehr als nur Katzen.
11:27
so here's a computer algorithm telling us
182
687188
2438
Hier sehen Sie einen Computeralgorithmus, der uns sagt,
11:29
the picture contains a boy and a teddy bear;
183
689626
3274
dass auf dem Bild ein Junge und ein Teddybär sind;
11:32
a dog, a person, and a small kite in the background;
184
692900
4366
hier ein Hund, eine Person und ein kleiner Drachen im Hintergrund;
11:37
or a picture of very busy things
185
697266
3135
oder dieses sehr überladene Bild:
11:40
like a man, a skateboard, railings, a lampost, and so on.
186
700401
4644
ein Mann, ein Skateboard, Geländer, eine Laterne und so weiter.
11:45
Sometimes, when the computer is not so confident about what it sees,
187
705045
5293
Manchmal weiß der Computer nicht genau, was er sieht,
11:51
we have taught it to be smart enough
188
711498
2276
und wir haben ihm beigebracht, schlau genug zu sein,
11:53
to give us a safe answer instead of committing too much,
189
713774
3878
uns eine sichere Antwort zu geben, statt sich zu sehr festzulegen,
11:57
just like we would do,
190
717652
2811
genau so wie wir es auch machen würden.
12:00
but other times our computer algorithm is remarkable at telling us
191
720463
4666
Manchmal ist der Algorithmus dagegen bemerkenswert gut darin, uns zu sagen,
12:05
what exactly the objects are,
192
725129
2253
was genau die Objekte sind,
12:07
like the make, model, year of the cars.
193
727382
3436
wie die Marke, das Modell und das Baujahr eines Autos.
12:10
We applied this algorithm to millions of Google Street View images
194
730818
5386
Wir haben diesen Algorithmus auf Millionen von Google Street View Bilder angewendet
12:16
across hundreds of American cities,
195
736204
3135
in hunderten amerikanischen Städten
12:19
and we have learned something really interesting:
196
739339
2926
und fanden dabei etwas sehr Interessantes heraus:
12:22
first, it confirmed our common wisdom
197
742265
3320
Zunächst bestätigte sich unsere Vermutung,
12:25
that car prices correlate very well
198
745585
3290
dass Fahrzeugpreise in direktem Bezug
12:28
with household incomes.
199
748875
2345
zu Haushaltseinkommen stehen.
12:31
But surprisingly, car prices also correlate well
200
751220
4527
Überraschenderweise korrelieren die Fahrzeugpreise auch stark
12:35
with crime rates in cities,
201
755747
2300
mit den Kriminalitätsraten einer Stadt
12:39
or voting patterns by zip codes.
202
759007
3963
oder den Wahlergebnissen nach Postleitzahlen.
Aber Moment mal. War es das schon?
12:44
So wait a minute. Is that it?
203
764060
2206
12:46
Has the computer already matched or even surpassed human capabilities?
204
766266
5153
Sind Computer mit dem Menschen gleich gezogen oder haben ihn sogar übertroffen?
12:51
Not so fast.
205
771419
2138
Nicht so schnell.
12:53
So far, we have just taught the computer to see objects.
206
773557
4923
Bisher haben wir dem Computer lediglich beigebracht, Objekte zu sehen.
12:58
This is like a small child learning to utter a few nouns.
207
778480
4644
Das ist wie ein kleines Kind, das gerade seine ersten Substantive zu sagen lernt.
13:03
It's an incredible accomplishment,
208
783124
2670
Das ist eine beachtliche Leistung,
13:05
but it's only the first step.
209
785794
2460
aber doch nur der erste Schritt.
13:08
Soon, another developmental milestone will be hit,
210
788254
3762
Bald wird das nächste Entwicklungsziel erreicht
13:12
and children begin to communicate in sentences.
211
792016
3461
und Kinder fangen an, in ganzen Sätzen zu kommunizieren.
13:15
So instead of saying this is a cat in the picture,
212
795477
4224
Anstatt zu sagen, dass auf dem Bild eine Katze ist,
13:19
you already heard the little girl telling us this is a cat lying on a bed.
213
799701
5202
sagte uns das kleine Mädchen schon, dass die Katze auf einem Bett liegt.
13:24
So to teach a computer to see a picture and generate sentences,
214
804903
5595
Um einem Computer beizubringen, ein Bild zu sehen und Sätze zu bilden,
13:30
the marriage between big data and machine learning algorithm
215
810498
3948
muss die Ehe zwischen Big Data und dem Machine Learning-Algorithmus
13:34
has to take another step.
216
814446
2275
den nächsten Schritt gehen.
13:36
Now, the computer has to learn from both pictures
217
816721
4156
Nun muss der Computer sowohl von Bildern
13:40
as well as natural language sentences
218
820877
2856
als auch von natürlichsprachlichen Sätzen lernen,
13:43
generated by humans.
219
823733
3322
die Menschen erzeugen.
13:47
Just like the brain integrates vision and language,
220
827055
3853
Wie auch das Gehirn das Sehen mit der Sprache verbindet,
13:50
we developed a model that connects parts of visual things
221
830908
5201
entwickelten wir ein Modell, das einen Teil der visuellen Dinge
13:56
like visual snippets
222
836109
1904
wie visuelle Ausschnitte
13:58
with words and phrases in sentences.
223
838013
4203
mit Wörtern und Ausdrücken in Sätzen vereint.
14:02
About four months ago,
224
842216
2763
Vor etwa vier Monaten
14:04
we finally tied all this together
225
844979
2647
haben wir das alles endlich miteinander verbunden
14:07
and produced one of the first computer vision models
226
847626
3784
und eines der ersten Computer Vision-Modelle erzeugt,
14:11
that is capable of generating a human-like sentence
227
851410
3994
das in der Lage ist, einen menschenähnlichen Satz zu generieren,
14:15
when it sees a picture for the first time.
228
855404
3506
wenn es ein Bild zum ersten Mal sieht.
14:18
Now, I'm ready to show you what the computer says
229
858910
4644
Jetzt kann ich Ihnen zeigen, was der Computer sagt,
14:23
when it sees the picture
230
863554
1975
wenn er die Bilder sieht,
14:25
that the little girl saw at the beginning of this talk.
231
865529
3830
die das kleine Mädchen am Anfang dieser Präsentation sah.
14:31
(Video) Computer: A man is standing next to an elephant.
232
871519
3344
(Video) Computer: Ein Mann steht neben einem Elefanten.
14:36
A large airplane sitting on top of an airport runway.
233
876393
3634
Ein großes Flugzeug steht auf einer Landebahn.
14:41
FFL: Of course, we're still working hard to improve our algorithms,
234
881057
4212
FFL: Natürlich arbeiten wir noch eifrig daran, diese Algorithmen zu verbessern
14:45
and it still has a lot to learn.
235
885269
2596
und sie müssen noch immer viel lernen.
14:47
(Applause)
236
887865
2291
(Applaus)
14:51
And the computer still makes mistakes.
237
891556
3321
Der Computer macht immer noch Fehler.
14:54
(Video) Computer: A cat lying on a bed in a blanket.
238
894877
3391
(Video) Computer: Eine Katze liegt unter einer Decke auf dem Bett.
14:58
FFL: So of course, when it sees too many cats,
239
898268
2553
FFL: Wenn er zu viele Katzen sieht,
15:00
it thinks everything might look like a cat.
240
900821
2926
denkt er, alles könnte eine Katze sein.
15:05
(Video) Computer: A young boy is holding a baseball bat.
241
905317
2864
(Video) Computer: Ein kleiner Junge hält einen Baseballschläger.
15:08
(Laughter)
242
908181
1765
(Lachen)
15:09
FFL: Or, if it hasn't seen a toothbrush, it confuses it with a baseball bat.
243
909946
4583
Wenn er noch nie eine Zahnbürste gesehen hat, ist es für ihn ein Baseballschläger.
15:15
(Video) Computer: A man riding a horse down a street next to a building.
244
915309
3434
(Video) Computer: Ein Mann reitet auf einem Pferd die Straße hinunter.
15:18
(Laughter)
245
918743
2023
(Lachen)
15:20
FFL: We haven't taught Art 101 to the computers.
246
920766
3552
FFL: Wir haben den Computern das Konzept der Kunst noch nicht beigebracht.
15:25
(Video) Computer: A zebra standing in a field of grass.
247
925768
2884
(Video) Computer: Ein Zebra steht auf einer Wiese.
15:28
FFL: And it hasn't learned to appreciate the stunning beauty of nature
248
928652
3367
FFL: Er hat die phantastische Schönheit der Natur noch nicht schätzen gelernt,
15:32
like you and I do.
249
932019
2438
so wie Sie und ich es tun.
15:34
So it has been a long journey.
250
934457
2832
Wir haben einen langen Weg hinter uns.
15:37
To get from age zero to three was hard.
251
937289
4226
Es war schwer von null bis zu unserem dritten Lebensjahr zu kommen.
15:41
The real challenge is to go from three to 13 and far beyond.
252
941515
5596
Die echte Herausforderung ist es aber, von 3 bis 13 und noch weiter zu kommen.
15:47
Let me remind you with this picture of the boy and the cake again.
253
947111
4365
Erinnern Sie sich an das Bild mit dem Jungen und dem Kuchen.
15:51
So far, we have taught the computer to see objects
254
951476
4064
Bisher haben wir dem Computer beigebracht, Objekte zu sehen
15:55
or even tell us a simple story when seeing a picture.
255
955540
4458
oder uns eine einfache Geschichte zu den Bildern zu erzählen.
15:59
(Video) Computer: A person sitting at a table with a cake.
256
959998
3576
(Video) Computer: Eine Person sitzt an einem Tisch mit einem Kuchen.
16:03
FFL: But there's so much more to this picture
257
963574
2630
FFL: Aber es steckt viel mehr in diesem Bild
16:06
than just a person and a cake.
258
966204
2270
als nur eine Person und ein Kuchen.
16:08
What the computer doesn't see is that this is a special Italian cake
259
968474
4467
Der Computer erkennt nicht, dass es ein spezieller italienischer Kuchen ist,
16:12
that's only served during Easter time.
260
972941
3217
der nur zu Ostern gebacken wird.
16:16
The boy is wearing his favorite t-shirt
261
976158
3205
Der Junge trägt sein Lieblingsshirt,
16:19
given to him as a gift by his father after a trip to Sydney,
262
979363
3970
das ihm sein Vater von einer Reise nach Sydney mitgebracht hat.
16:23
and you and I can all tell how happy he is
263
983333
3808
Sie und ich können sehen, wie glücklich er ist
16:27
and what's exactly on his mind at that moment.
264
987141
3203
und was genau in diesem Moment in seinem Kopf vor sich geht.
16:31
This is my son Leo.
265
991214
3125
Das ist mein Sohn Leo.
16:34
On my quest for visual intelligence,
266
994339
2624
Auf meiner Suche nach visueller Intelligenz
16:36
I think of Leo constantly
267
996963
2391
denke ich ständig an Leo
16:39
and the future world he will live in.
268
999354
2903
und an die Welt der Zukunft, in der er leben wird.
16:42
When machines can see,
269
1002257
2021
Wenn Maschinen sehen können, werden Ärzte und Krankenschwestern
16:44
doctors and nurses will have extra pairs of tireless eyes
270
1004278
4712
ein zusätzliches Paar unermüdlicher Augen haben,
16:48
to help them to diagnose and take care of patients.
271
1008990
4092
um ihnen bei der Diagnose und Behandlung von Patienten zu helfen.
16:53
Cars will run smarter and safer on the road.
272
1013082
4383
Autos werden klüger und sicherer durch die Straßen fahren.
16:57
Robots, not just humans,
273
1017465
2694
Roboter, nicht nur Menschen, werden uns dabei helfen,
17:00
will help us to brave the disaster zones to save the trapped and wounded.
274
1020159
4849
in Katastrophengebiete vorzudringen, um Verschüttete und Verwundete zu retten.
17:05
We will discover new species, better materials,
275
1025798
3796
Wir werden neue Arten und bessere Materialien entdecken
17:09
and explore unseen frontiers with the help of the machines.
276
1029594
4509
und ungesehene Grenzen erkunden, mit Hilfe von Maschinen.
17:15
Little by little, we're giving sight to the machines.
277
1035113
4167
Schritt für Schritt bringen wir Maschinen das Sehen bei.
17:19
First, we teach them to see.
278
1039280
2798
Erst bringen wir es ihnen bei.
17:22
Then, they help us to see better.
279
1042078
2763
Später helfen sie uns dabei, besser zu sehen.
17:24
For the first time, human eyes won't be the only ones
280
1044841
4165
Zum ersten Mal werden unsere Augen nicht die einzigen sein,
die unsere Welt studieren und erkunden.
17:29
pondering and exploring our world.
281
1049006
2934
17:31
We will not only use the machines for their intelligence,
282
1051940
3460
Wir werden Maschinen nicht nur wegen ihrer Intelligenz nutzen,
17:35
we will also collaborate with them in ways that we cannot even imagine.
283
1055400
6179
wir werden mit ihnen zusammenarbeiten, wie es jetzt noch unvorstellbar scheint.
17:41
This is my quest:
284
1061579
2161
Das ist mein Ziel:
17:43
to give computers visual intelligence
285
1063740
2712
Ich möchte Computern visuelle Intelligenz geben
17:46
and to create a better future for Leo and for the world.
286
1066452
5131
und damit eine bessere Zukunft für Leo und die ganze Welt gestalten.
17:51
Thank you.
287
1071583
1811
Danke.
17:53
(Applause)
288
1073394
3785
(Applaus)
Über diese Website

Auf dieser Seite finden Sie YouTube-Videos, die zum Englischlernen nützlich sind. Sie sehen Englischlektionen, die von hochkarätigen Lehrern aus der ganzen Welt unterrichtet werden. Doppelklicken Sie auf die englischen Untertitel, die auf jeder Videoseite angezeigt werden, um das Video von dort aus abzuspielen. Die Untertitel laufen synchron mit der Videowiedergabe. Wenn Sie irgendwelche Kommentare oder Wünsche haben, kontaktieren Sie uns bitte über dieses Kontaktformular.

https://forms.gle/WvT1wiN1qDtmnspy7