How we teach computers to understand pictures | Fei Fei Li

1,159,394 views ・ 2015-03-23

TED


Veuillez double-cliquer sur les sous-titres anglais ci-dessous pour lire la vidéo.

Traducteur: eric vautier Relecteur: Rania Nakhli
00:14
Let me show you something.
0
14366
3738
Je vais vous montrer quelque chose.
00:18
(Video) Girl: Okay, that's a cat sitting in a bed.
1
18104
4156
(Enfant) C'est un chat assis sur un lit.
00:22
The boy is petting the elephant.
2
22260
4040
Le garçon caresse l'éléphant.
00:26
Those are people that are going on an airplane.
3
26300
4354
Des gens montent dans un avion.
00:30
That's a big airplane.
4
30654
2810
C'est un gros avion.
00:33
Fei-Fei Li: This is a three-year-old child
5
33464
2206
(Fei-Fei Li) C'est une enfant de 3 ans
00:35
describing what she sees in a series of photos.
6
35670
3679
qui décrit ce qu'elle voit sur des photos.
00:39
She might still have a lot to learn about this world,
7
39349
2845
Elle a peut-être encore beaucoup à apprendre,
00:42
but she's already an expert at one very important task:
8
42194
4549
mais elle est déjà experte dans un domaine très important :
00:46
to make sense of what she sees.
9
46743
2846
comprendre ce qu'elle voit.
00:50
Our society is more technologically advanced than ever.
10
50229
4226
Notre société est technologiquement plus avancée que jamais.
00:54
We send people to the moon, we make phones that talk to us
11
54455
3629
On envoie des gens sur la Lune, on fait des téléphones qui nous parlent,
00:58
or customize radio stations that can play only music we like.
12
58084
4946
on a des stations de radio qui ne passent que ce qu'on aime.
01:03
Yet, our most advanced machines and computers
13
63030
4055
Pourtant, les machines et les ordinateurs les plus avancés
01:07
still struggle at this task.
14
67085
2903
ont toujours du mal à faire ça.
01:09
So I'm here today to give you a progress report
15
69988
3459
Alors aujourd'hui je vais vous expliquer où nous en sommes,
01:13
on the latest advances in our research in computer vision,
16
73447
4047
nos dernières recherches sur la vision par ordinateur,
01:17
one of the most frontier and potentially revolutionary
17
77494
4161
l'une des technologies les plus novatrices et potentiellement révolutionnaires
01:21
technologies in computer science.
18
81655
3206
en informatique.
01:24
Yes, we have prototyped cars that can drive by themselves,
19
84861
4551
Oui, nous avons des prototypes de voitures qui conduisent toutes seules,
01:29
but without smart vision, they cannot really tell the difference
20
89412
3853
mais sans la vision intelligente, elles ne font pas la différence
01:33
between a crumpled paper bag on the road, which can be run over,
21
93265
3970
entre un sac de papier roulé en boule, que l'on peut écraser,
01:37
and a rock that size, which should be avoided.
22
97235
3340
et une pierre qu'il faut éviter.
01:41
We have made fabulous megapixel cameras,
23
101415
3390
Nous fabriquons des appareils photo à mégapixels incroyables,
01:44
but we have not delivered sight to the blind.
24
104805
3135
mais nous n'avons pas donné la vue aux aveugles.
01:48
Drones can fly over massive land,
25
108420
3305
Les drones peuvent parcourir de grandes distances
01:51
but don't have enough vision technology
26
111725
2134
mais la technologie n'est pas assez avancée
01:53
to help us to track the changes of the rainforests.
27
113859
3461
pour suivre l'évolution des forêts tropicales.
01:57
Security cameras are everywhere,
28
117320
2950
Il y a des caméras de sécurité partout,
02:00
but they do not alert us when a child is drowning in a swimming pool.
29
120270
5067
mais elles ne savent pas nous alerter quand un enfant se noie dans une piscine.
02:06
Photos and videos are becoming an integral part of global life.
30
126167
5595
La photo et la vidéo font partie de notre vie.
02:11
They're being generated at a pace that's far beyond what any human,
31
131762
4087
Elles sont générées tellement vite qu'aucun humain
02:15
or teams of humans, could hope to view,
32
135849
2783
ou groupe d'humains ne peut tout voir,
02:18
and you and I are contributing to that at this TED.
33
138632
3921
Vous et moi, nous y contribuons, avec cette conférence TED.
02:22
Yet our most advanced software is still struggling at understanding
34
142553
5232
Pourtant nos programmes les plus avancés ont du mal à comprendre
02:27
and managing this enormous content.
35
147785
3876
et à gérer cet énorme contenu.
02:31
So in other words, collectively as a society,
36
151661
5272
En d'autres termes, nous, la société,
02:36
we're very much blind,
37
156933
1746
sommes vraiment aveugles,
02:38
because our smartest machines are still blind.
38
158679
3387
parce que nos plus intelligentes machines sont encore aveugles.
02:43
"Why is this so hard?" you may ask.
39
163526
2926
« Pourquoi est-ce si difficile ? », pourriez-vous demander.
02:46
Cameras can take pictures like this one
40
166452
2693
Un appareil peut prendre une photo comme celle-ci,
02:49
by converting lights into a two-dimensional array of numbers
41
169145
3994
il convertit la lumière en tableaux bidimensionnels
02:53
known as pixels,
42
173139
1650
que l'on nomme pixels,
02:54
but these are just lifeless numbers.
43
174789
2251
mais ce ne sont que des nombres sans vie.
02:57
They do not carry meaning in themselves.
44
177040
3111
Par eux-mêmes, ils ne signifient rien.
03:00
Just like to hear is not the same as to listen,
45
180151
4343
Tout comme entendre n'est pas la même chose qu'écouter,
03:04
to take pictures is not the same as to see,
46
184494
4040
prendre une photo, ce n'est pas comme voir,
03:08
and by seeing, we really mean understanding.
47
188534
3829
et par « voir », entendez « comprendre ».
03:13
In fact, it took Mother Nature 540 million years of hard work
48
193293
6177
En fait, Mère Nature a travaillé dur 540 millions d'années
03:19
to do this task,
49
199470
1973
pour accomplir cette tâche,
03:21
and much of that effort
50
201443
1881
et le plus gros de cet effort a été
03:23
went into developing the visual processing apparatus of our brains,
51
203324
5271
le développement de l'appareil qui produit la vision dans notre cerveau,
03:28
not the eyes themselves.
52
208595
2647
pas les yeux.
03:31
So vision begins with the eyes,
53
211242
2747
La vision commence avec les yeux,
03:33
but it truly takes place in the brain.
54
213989
3518
mais tout se passe en fait dans le cerveau.
03:38
So for 15 years now, starting from my Ph.D. at Caltech
55
218287
5060
Depuis maintenant 15 ans, d'abord en thèse à Caltech
03:43
and then leading Stanford's Vision Lab,
56
223347
2926
puis à la tête du Vision Lab à Stanford,
03:46
I've been working with my mentors, collaborators and students
57
226273
4396
je travaille avec mes mentors, collaborateurs et étudiants
03:50
to teach computers to see.
58
230669
2889
pour apprendre la vision aux ordinateurs.
03:54
Our research field is called computer vision and machine learning.
59
234658
3294
Il s'agit de vision par ordinateur et d'apprentissage machine.
03:57
It's part of the general field of artificial intelligence.
60
237952
3878
C'est un pan de la recherche sur l'intelligence artificielle.
04:03
So ultimately, we want to teach the machines to see just like we do:
61
243000
5493
Le but est d'enseigner aux machines à voir comme nous :
04:08
naming objects, identifying people, inferring 3D geometry of things,
62
248493
5387
nommer des objets, identifier des gens, déduire des formes géométriques 3D,
04:13
understanding relations, emotions, actions and intentions.
63
253880
5688
comprendre les relations, les émotions, les actions et les intentions.
04:19
You and I weave together entire stories of people, places and things
64
259568
6153
Nous tissons constamment des histoires de gens, d'endroits, de choses
04:25
the moment we lay our gaze on them.
65
265721
2164
dès que nous posons les yeux dessus.
04:28
The first step towards this goal is to teach a computer to see objects,
66
268955
5583
Le premier pas est d'apprendre à l'ordinateur à voir des objets,
04:34
the building block of the visual world.
67
274538
3368
c'est l'élément de base du monde visuel.
04:37
In its simplest terms, imagine this teaching process
68
277906
4434
Pour parler simplement, imaginez que ce processus d'apprentissage
04:42
as showing the computers some training images
69
282340
2995
consiste à montrer à l'ordinateur
04:45
of a particular object, let's say cats,
70
285335
3321
des images d'un certain objet, par exemple des chats,
04:48
and designing a model that learns from these training images.
71
288656
4737
puis concevoir un modèle qui puisse apprendre avec ces images.
04:53
How hard can this be?
72
293393
2044
Ça ne doit pas être bien difficile !
04:55
After all, a cat is just a collection of shapes and colors,
73
295437
4052
Après tout, un chat est un ensemble de formes et de couleurs.
04:59
and this is what we did in the early days of object modeling.
74
299489
4086
Au début de la modélisation objet, c'est ce que nous avons fait.
05:03
We'd tell the computer algorithm in a mathematical language
75
303575
3622
On rentrait un algorithme en langage mathématique
05:07
that a cat has a round face, a chubby body,
76
307197
3343
pour dire que le chat a un visage rond, un corps un peu dodu,
05:10
two pointy ears, and a long tail,
77
310540
2299
deux oreilles pointues et une longue queue
05:12
and that looked all fine.
78
312839
1410
et tout allait bien.
05:14
But what about this cat?
79
314859
2113
Mais que fait-on pour celui-ci ?
05:16
(Laughter)
80
316972
1091
(Rires)
05:18
It's all curled up.
81
318063
1626
Il est tout retourné.
05:19
Now you have to add another shape and viewpoint to the object model.
82
319689
4719
Alors il faut ajouter d'autres formes et points de vue au modèle objet.
05:24
But what if cats are hidden?
83
324408
1715
Et si le chat est caché ?
05:27
What about these silly cats?
84
327143
2219
Et ces drôles de chats-là ?
05:31
Now you get my point.
85
331112
2417
Vous voyez ce que je veux dire.
05:33
Even something as simple as a household pet
86
333529
3367
Quelque chose d'aussi simple qu'un animal domestique
05:36
can present an infinite number of variations to the object model,
87
336896
4504
présente une infinité de variations du modèle objet.
05:41
and that's just one object.
88
341400
2233
Et ça n'est qu'un seul objet.
05:44
So about eight years ago,
89
344573
2492
Il y a environ 8 ans,
05:47
a very simple and profound observation changed my thinking.
90
347065
5030
une réflexion toute simple mais profonde a changé ma manière de penser.
05:53
No one tells a child how to see,
91
353425
2685
Personne ne dit à un enfant comment voir,
05:56
especially in the early years.
92
356110
2261
surtout dans les premières années.
05:58
They learn this through real-world experiences and examples.
93
358371
5000
Il apprend par l'expérience, par des exemples quotidiens.
06:03
If you consider a child's eyes
94
363371
2740
Pensez aux yeux d'un enfant
06:06
as a pair of biological cameras,
95
366111
2554
comme à deux appareils photo biologiques
06:08
they take one picture about every 200 milliseconds,
96
368665
4180
qui prennent une photo chaque 200 millisecondes,
06:12
the average time an eye movement is made.
97
372845
3134
la durée moyenne du mouvement de l’œil.
06:15
So by age three, a child would have seen hundreds of millions of pictures
98
375979
5550
A 3 ans, un enfant a vu des centaines de millions de photos
06:21
of the real world.
99
381529
1834
du monde réel.
06:23
That's a lot of training examples.
100
383363
2280
Ça nous fait beaucoup d'exemples.
06:26
So instead of focusing solely on better and better algorithms,
101
386383
5989
Alors plutôt que se concentrer sur l'amélioration des algorithmes,
06:32
my insight was to give the algorithms the kind of training data
102
392372
5272
mon idée a été de former les algorithmes avec le genre de données
06:37
that a child was given through experiences
103
397644
3319
qu'un enfant reçoit par l'expérience
06:40
in both quantity and quality.
104
400963
3878
tant en quantité qu'en qualité
06:44
Once we know this,
105
404841
1858
Une fois que nous avons compris ça,
06:46
we knew we needed to collect a data set
106
406699
2971
nous savions qu'il fallait collecter un ensemble de données
06:49
that has far more images than we have ever had before,
107
409670
4459
qui contienne bien plus d'images que jamais auparavant,
06:54
perhaps thousands of times more,
108
414129
2577
peut-être des milliers de fois plus.
06:56
and together with Professor Kai Li at Princeton University,
109
416706
4111
Avec le professeur Kai Li de l'Université de Princeton,
07:00
we launched the ImageNet project in 2007.
110
420817
4752
nous avons donc lancé le projet ImageNet en 2007.
07:05
Luckily, we didn't have to mount a camera on our head
111
425569
3838
Heureusement, ce n'était pas la peine de se mettre une caméra sur la tête
07:09
and wait for many years.
112
429407
1764
et d'attendre plusieurs années.
07:11
We went to the Internet,
113
431171
1463
Nous sommes allés sur Internet,
07:12
the biggest treasure trove of pictures that humans have ever created.
114
432634
4436
la plus grande mine de photos que l'humain ait jamais créée.
07:17
We downloaded nearly a billion images
115
437070
3041
Nous avons téléchargé près d'un milliard d'images.
07:20
and used crowdsourcing technology like the Amazon Mechanical Turk platform
116
440111
5880
Des technologies de crowdsourcing comme le Turc Mécanique d'Amazon
07:25
to help us to label these images.
117
445991
2339
nous ont aidés à cataloguer les images.
07:28
At its peak, ImageNet was one of the biggest employers
118
448330
4900
A son plus haut, ImageNet a été l'un des plus gros employeurs
07:33
of the Amazon Mechanical Turk workers:
119
453230
2996
du Turc Mécanique d'Amazon :
07:36
together, almost 50,000 workers
120
456226
3854
près de 50 000 employés
07:40
from 167 countries around the world
121
460080
4040
dans 167 pays
07:44
helped us to clean, sort and label
122
464120
3947
nous ont aidés à nettoyer, trier, étiqueter
07:48
nearly a billion candidate images.
123
468067
3575
presque un milliard d'images.
07:52
That was how much effort it took
124
472612
2653
C'est vous dire l'effort entrepris
07:55
to capture even a fraction of the imagery
125
475265
3900
pour capturer une fraction des images
07:59
a child's mind takes in in the early developmental years.
126
479165
4171
qu'un enfant stocke pendant ses premières années.
08:04
In hindsight, this idea of using big data
127
484148
3902
Aujourd'hui, cette idée d'utiliser ces masses de données
08:08
to train computer algorithms may seem obvious now,
128
488050
4550
pour construire des algorithmes peut paraître évidente,
08:12
but back in 2007, it was not so obvious.
129
492600
4110
mais pas en 2007.
08:16
We were fairly alone on this journey for quite a while.
130
496710
3878
Pendant longtemps, nous étions bien seuls.
08:20
Some very friendly colleagues advised me to do something more useful for my tenure,
131
500588
5003
Des collègues me conseillaient de trouver autre chose pour devenir titulaire,
08:25
and we were constantly struggling for research funding.
132
505591
4342
et c'était une bataille constante pour trouver des crédits de recherche.
08:29
Once, I even joked to my graduate students
133
509933
2485
Je disais en plaisantant à mes étudiants
08:32
that I would just reopen my dry cleaner's shop to fund ImageNet.
134
512418
4063
que je pourrais reprendre ma laverie pour financer ImageNet.
08:36
After all, that's how I funded my college years.
135
516481
4761
Après tout, j'avais financé mes études grâce à elle.
08:41
So we carried on.
136
521242
1856
Mais nous avons continué.
08:43
In 2009, the ImageNet project delivered
137
523098
3715
En 2009, le projet ImageNet avait
08:46
a database of 15 million images
138
526813
4042
une base de données de 15 millions d'images,
08:50
across 22,000 classes of objects and things
139
530855
4805
22 000 classes d'objets et de choses
08:55
organized by everyday English words.
140
535660
3320
organisées avec des mots d'anglais du quotidien.
08:58
In both quantity and quality,
141
538980
2926
Tant en quantité qu'en qualité,
09:01
this was an unprecedented scale.
142
541906
2972
une telle échelle de grandeur était une première.
09:04
As an example, in the case of cats,
143
544878
3461
Par exemple, les chats,
09:08
we have more than 62,000 cats
144
548339
2809
nous avons plus de 62 000 chats,
09:11
of all kinds of looks and poses
145
551148
4110
toutes sortes d'apparences et de poses,
09:15
and across all species of domestic and wild cats.
146
555258
5223
toutes les espèces, domestiques et sauvages.
09:20
We were thrilled to have put together ImageNet,
147
560481
3344
C'était formidable d'avoir bâti ImageNet,
09:23
and we wanted the whole research world to benefit from it,
148
563825
3738
et nous voulions en faire profiter le monde de la recherche.
09:27
so in the TED fashion, we opened up the entire data set
149
567563
4041
Alors, à la manière de TED, nous avons donné l'accès aux données
09:31
to the worldwide research community for free.
150
571604
3592
à la recherche, gratuitement et dans le monde entier.
(Applaudissements)
09:36
(Applause)
151
576636
4000
09:41
Now that we have the data to nourish our computer brain,
152
581416
4538
Maintenant que nous avons les données pour nourrir notre cerveau informatique,
09:45
we're ready to come back to the algorithms themselves.
153
585954
3737
nous pouvons revenir sur les algorithmes.
09:49
As it turned out, the wealth of information provided by ImageNet
154
589691
5178
Il se trouve que la manne d'informations désormais dans ImageNet
09:54
was a perfect match to a particular class of machine learning algorithms
155
594869
4806
allait parfaitement avec un certain type d'algorithmes,
09:59
called convolutional neural network,
156
599675
2415
le réseau de neurones à convolution,
10:02
pioneered by Kunihiko Fukushima, Geoff Hinton, and Yann LeCun
157
602090
5248
développé par Kunihiko Fukushima, Geoff Hinton et Yann LeCun
10:07
back in the 1970s and '80s.
158
607338
3645
dans les années 1970 et 80.
10:10
Just like the brain consists of billions of highly connected neurons,
159
610983
5619
Tout comme le cerveau est composé de milliards de neurones connectés,
10:16
a basic operating unit in a neural network
160
616602
3854
l'unité de base d'un réseau neuronal
10:20
is a neuron-like node.
161
620456
2415
est le nœud de type neurone.
10:22
It takes input from other nodes
162
622871
2554
Il reçoit des informations d'autres nœuds
10:25
and sends output to others.
163
625425
2718
et en envoie à d'autres.
10:28
Moreover, these hundreds of thousands or even millions of nodes
164
628143
4713
De plus, ces centaines de milliers voire millions de nœuds
10:32
are organized in hierarchical layers,
165
632856
3227
sont organisés en couches hiérarchiques,
10:36
also similar to the brain.
166
636083
2554
similaires au cerveau.
10:38
In a typical neural network we use to train our object recognition model,
167
638637
4783
Dans le réseau neuronal classique que nous utilisons,
10:43
it has 24 million nodes,
168
643420
3181
il y a 24 millions de nœuds,
10:46
140 million parameters,
169
646601
3297
140 millions de paramètres,
10:49
and 15 billion connections.
170
649898
2763
et 15 milliards de connexions.
10:52
That's an enormous model.
171
652661
2415
C'est un modèle énorme.
10:55
Powered by the massive data from ImageNet
172
655076
3901
Avec la puissance des données d'ImageNet
10:58
and the modern CPUs and GPUs to train such a humongous model,
173
658977
5433
et les processeurs modernes pour traiter cet énorme modèle,
11:04
the convolutional neural network
174
664410
2369
le réseau de neurones à convolution
11:06
blossomed in a way that no one expected.
175
666779
3436
s'est transformé de manière inattendue.
11:10
It became the winning architecture
176
670215
2508
Il est devenu l'architecture idéale
11:12
to generate exciting new results in object recognition.
177
672723
5340
pour générer des résultats fabuleux en reconnaissance d'objets.
11:18
This is a computer telling us
178
678063
2810
Ceci est un ordinateur qui nous dit
11:20
this picture contains a cat
179
680873
2300
que la photo contient un chat
11:23
and where the cat is.
180
683173
1903
et où est ce chat.
11:25
Of course there are more things than cats,
181
685076
2112
Bien sûr, il y a autre chose que des chats.
11:27
so here's a computer algorithm telling us
182
687188
2438
Ici un algorithme nous dit
11:29
the picture contains a boy and a teddy bear;
183
689626
3274
que la photo contient un garçon et un ours en peluche,
11:32
a dog, a person, and a small kite in the background;
184
692900
4366
un chien, une personne, et un cerf-volant en arrière-plan.
11:37
or a picture of very busy things
185
697266
3135
Ici, beaucoup d'activités
11:40
like a man, a skateboard, railings, a lampost, and so on.
186
700401
4644
avec un homme, un skateboard, une rampe, un lampadaire, etc.
11:45
Sometimes, when the computer is not so confident about what it sees,
187
705045
5293
Parfois l'ordinateur n'est pas trop sûr,
11:51
we have taught it to be smart enough
188
711498
2276
nous lui avons appris à être assez intelligent
11:53
to give us a safe answer instead of committing too much,
189
713774
3878
pour donner une réponse sûre, sans trop s'engager,
11:57
just like we would do,
190
717652
2811
c'est ce que nous ferions.
12:00
but other times our computer algorithm is remarkable at telling us
191
720463
4666
D'autres fois, l'algorithme a la capacité incroyable
12:05
what exactly the objects are,
192
725129
2253
de nous dire exactement ce qu'est l'objet :
12:07
like the make, model, year of the cars.
193
727382
3436
marque, modèle, année d'une voiture.
12:10
We applied this algorithm to millions of Google Street View images
194
730818
5386
Nous avons utilisé cet algorithme sur des millions d'images Google Street View,
12:16
across hundreds of American cities,
195
736204
3135
dans des centaines de villes américaines,
12:19
and we have learned something really interesting:
196
739339
2926
et nous avons découvert quelque chose de très intéressant.
12:22
first, it confirmed our common wisdom
197
742265
3320
D'abord, il a été confirmé
12:25
that car prices correlate very well
198
745585
3290
que le prix des voitures
12:28
with household incomes.
199
748875
2345
et le revenu des foyers sont liés.
12:31
But surprisingly, car prices also correlate well
200
751220
4527
Mais, étonnamment, le prix des voitures
et le taux de crimes dans les villes sont également liés,
12:35
with crime rates in cities,
201
755747
2300
12:39
or voting patterns by zip codes.
202
759007
3963
même chose avec la répartition géographique des votes.
12:44
So wait a minute. Is that it?
203
764060
2206
Attendez un peu... c'est tout ?
12:46
Has the computer already matched or even surpassed human capabilities?
204
766266
5153
Est-ce que l'ordinateur atteint, voire surpasse, les capacités humaines ?
12:51
Not so fast.
205
771419
2138
Pas si vite.
12:53
So far, we have just taught the computer to see objects.
206
773557
4923
Jusque là, nous avons appris aux ordinateurs à voir des objets,
12:58
This is like a small child learning to utter a few nouns.
207
778480
4644
comme un jeune enfant apprend à prononcer quelques noms.
13:03
It's an incredible accomplishment,
208
783124
2670
C'est déjà incroyable,
13:05
but it's only the first step.
209
785794
2460
mais ce n'est que la première étape.
13:08
Soon, another developmental milestone will be hit,
210
788254
3762
Bientôt, nous atteindrons un autre niveau,
13:12
and children begin to communicate in sentences.
211
792016
3461
l'enfant commence à faire des phrases.
13:15
So instead of saying this is a cat in the picture,
212
795477
4224
Au lieu de dire que c'est un chat sur la photo,
13:19
you already heard the little girl telling us this is a cat lying on a bed.
213
799701
5202
comme nous l'a dit la petite fille tout à l'heure.
13:24
So to teach a computer to see a picture and generate sentences,
214
804903
5595
Pour apprendre à l'ordinateur à générer des phrases à partir d'une photo,
13:30
the marriage between big data and machine learning algorithm
215
810498
3948
le mariage entre les données et l'algorithme d'apprentissage
13:34
has to take another step.
216
814446
2275
doit franchir une autre étape.
13:36
Now, the computer has to learn from both pictures
217
816721
4156
L'ordinateur doit apprendre à partir des photos,
13:40
as well as natural language sentences
218
820877
2856
en utilisant des phrases en langage naturel
13:43
generated by humans.
219
823733
3322
générée par l'être humain.
13:47
Just like the brain integrates vision and language,
220
827055
3853
Tout comme le cerveau combine vision et langage,
13:50
we developed a model that connects parts of visual things
221
830908
5201
notre modèle connecte les parties de choses visuelles,
13:56
like visual snippets
222
836109
1904
des petits bouts visuels,
13:58
with words and phrases in sentences.
223
838013
4203
avec des mots ou groupes de mots, pour en faire des phrases.
14:02
About four months ago,
224
842216
2763
Il y a environ 4 mois,
14:04
we finally tied all this together
225
844979
2647
nous avons enfin réussi
14:07
and produced one of the first computer vision models
226
847626
3784
à créer l'un des premiers modèles de vision artificielle
14:11
that is capable of generating a human-like sentence
227
851410
3994
capagle de générer une phrase comme un être humain
14:15
when it sees a picture for the first time.
228
855404
3506
qui découvre une image.
14:18
Now, I'm ready to show you what the computer says
229
858910
4644
Aujourd'hui, je suis prête à vous montrer ce que dit l'ordinateur
14:23
when it sees the picture
230
863554
1975
quand il voit la photo
14:25
that the little girl saw at the beginning of this talk.
231
865529
3830
que la petite fille voyait tout à l'heure.
14:31
(Video) Computer: A man is standing next to an elephant.
232
871519
3344
(Vidéo) L'ordinateur : Un homme est debout à coté d'un éléphant.
14:36
A large airplane sitting on top of an airport runway.
233
876393
3634
Un grand avion est assis sur une piste d'aéroport.
14:41
FFL: Of course, we're still working hard to improve our algorithms,
234
881057
4212
FFL : Bien sûr, il y a encore beaucoup de travail sur les algorithmes,
14:45
and it still has a lot to learn.
235
885269
2596
l'ordinateur a encore beaucoup à apprendre,
14:47
(Applause)
236
887865
2291
(Applaudissements)
14:51
And the computer still makes mistakes.
237
891556
3321
et il fait encore des erreurs.
14:54
(Video) Computer: A cat lying on a bed in a blanket.
238
894877
3391
(Vidéo) Ordinateur : un chat est couché sur un lit dans une couverture.
14:58
FFL: So of course, when it sees too many cats,
239
898268
2553
FFL : Bien sûr, s'il voit trop de chats,
15:00
it thinks everything might look like a cat.
240
900821
2926
il pense que tout est peut-être un chat.
15:05
(Video) Computer: A young boy is holding a baseball bat.
241
905317
2864
(Vidéo) Ordinateur : un garçon tient une batte de base-ball.
15:08
(Laughter)
242
908181
1765
(Rires)
15:09
FFL: Or, if it hasn't seen a toothbrush, it confuses it with a baseball bat.
243
909946
4583
FFL : Ou alors, s'il n'a jamais vu de brosse à dents, elle devient une batte.
15:15
(Video) Computer: A man riding a horse down a street next to a building.
244
915309
3434
(Vidéo) Ordinateur : Un homme se promène à cheval près d'un bâtiment.
15:18
(Laughter)
245
918743
2023
(Rires)
15:20
FFL: We haven't taught Art 101 to the computers.
246
920766
3552
Nous n'avons pas enseigné l'histoire de l'art à l'ordinateur.
15:25
(Video) Computer: A zebra standing in a field of grass.
247
925768
2884
(Vidéo) L'ordinateur : Un zèbre se trouve dans un pré.
15:28
FFL: And it hasn't learned to appreciate the stunning beauty of nature
248
928652
3367
FFL : Et il ne sait pas apprécier la beauté de la nature
15:32
like you and I do.
249
932019
2438
comme vous et moi.
15:34
So it has been a long journey.
250
934457
2832
Ça a donc été un long voyage.
15:37
To get from age zero to three was hard.
251
937289
4226
Aller de 0 à 3 ans a été difficile.
15:41
The real challenge is to go from three to 13 and far beyond.
252
941515
5596
Le vrai défi est d'aller de 3 à 13 et bien au-delà.
15:47
Let me remind you with this picture of the boy and the cake again.
253
947111
4365
Revoici l'image du garçon avec le gâteau.
15:51
So far, we have taught the computer to see objects
254
951476
4064
Jusque là, nous avons appris à l'ordinateur à voir des objets
15:55
or even tell us a simple story when seeing a picture.
255
955540
4458
ou à créer une petite histoire d'après une photo.
15:59
(Video) Computer: A person sitting at a table with a cake.
256
959998
3576
(Vidéo) L'ordinateur : Une personne assise à une table avec un gâteau.
16:03
FFL: But there's so much more to this picture
257
963574
2630
FFL : Mais il y a beaucoup plus
16:06
than just a person and a cake.
258
966204
2270
qu'une personne et un gâteau.
16:08
What the computer doesn't see is that this is a special Italian cake
259
968474
4467
Ce que l'ordinateur ne voit pas est que c'est un gâteau italien spécial
16:12
that's only served during Easter time.
260
972941
3217
servi uniquement à Pâques.
16:16
The boy is wearing his favorite t-shirt
261
976158
3205
Le garçon porte son t-shirt préféré,
16:19
given to him as a gift by his father after a trip to Sydney,
262
979363
3970
celui que lui a offert son père après un voyage à Sydney,
16:23
and you and I can all tell how happy he is
263
983333
3808
et vous et moi voyons bien à quel point il est heureux
16:27
and what's exactly on his mind at that moment.
264
987141
3203
et ce qu'il pense à ce moment.
16:31
This is my son Leo.
265
991214
3125
C'est mon fils Léo.
16:34
On my quest for visual intelligence,
266
994339
2624
Au cours de ma quête de l'intelligence visuelle,
16:36
I think of Leo constantly
267
996963
2391
Léo était constamment dans mes pensées
16:39
and the future world he will live in.
268
999354
2903
ainsi que le monde dans lequel il vivra.
16:42
When machines can see,
269
1002257
2021
Quand les machines pourront voir,
16:44
doctors and nurses will have extra pairs of tireless eyes
270
1004278
4712
les médecins et infirmières auront une paire d'yeux infatigables en plus
16:48
to help them to diagnose and take care of patients.
271
1008990
4092
pour les aider au diagnostic et au soin des patients.
16:53
Cars will run smarter and safer on the road.
272
1013082
4383
Les voitures seront plus intelligentes et plus sûres.
16:57
Robots, not just humans,
273
1017465
2694
Des robots, pas seulement des humains,
17:00
will help us to brave the disaster zones to save the trapped and wounded.
274
1020159
4849
nous aideront à sauver des vies dans des zones sinistrées.
17:05
We will discover new species, better materials,
275
1025798
3796
Nous découvrirons de nouvelles espèces, de meilleurs matériaux,
17:09
and explore unseen frontiers with the help of the machines.
276
1029594
4509
nous explorerons d'autres frontières, avec l'aide des machines.
17:15
Little by little, we're giving sight to the machines.
277
1035113
4167
Petit à petit, nous donnons la vue aux machines.
17:19
First, we teach them to see.
278
1039280
2798
D'abord nous leur apprenons à voir.
17:22
Then, they help us to see better.
279
1042078
2763
Puis c'est elles qui nous aident à mieux voir.
17:24
For the first time, human eyes won't be the only ones
280
1044841
4165
Pour la première fois, les yeux humains ne seront pas les seuls
17:29
pondering and exploring our world.
281
1049006
2934
à questionner et explorer notre monde.
17:31
We will not only use the machines for their intelligence,
282
1051940
3460
En plus d'utiliser les machines pour leur intelligence,
17:35
we will also collaborate with them in ways that we cannot even imagine.
283
1055400
6179
nous collaborerons avec elles de manière inédite.
17:41
This is my quest:
284
1061579
2161
C'est ma quête :
17:43
to give computers visual intelligence
285
1063740
2712
donner aux ordinateurs l'intelligence visuelle
17:46
and to create a better future for Leo and for the world.
286
1066452
5131
et créer un meilleur avenir pour Léo et pour le monde.
17:51
Thank you.
287
1071583
1811
Merci.
17:53
(Applause)
288
1073394
3785
(Applaudissements)
À propos de ce site Web

Ce site vous présentera des vidéos YouTube utiles pour apprendre l'anglais. Vous verrez des leçons d'anglais dispensées par des professeurs de premier ordre du monde entier. Double-cliquez sur les sous-titres anglais affichés sur chaque page de vidéo pour lire la vidéo à partir de là. Les sous-titres défilent en synchronisation avec la lecture de la vidéo. Si vous avez des commentaires ou des demandes, veuillez nous contacter en utilisant ce formulaire de contact.

https://forms.gle/WvT1wiN1qDtmnspy7