How we teach computers to understand pictures | Fei Fei Li

1,115,930 views ・ 2015-03-23

TED


Fare doppio clic sui sottotitoli in inglese per riprodurre il video.

Traduttore: Silvia Littarru Revisore: Kevin Álvarez
00:14
Let me show you something.
0
14366
3738
Lasciate che vi mostri qualcosa.
00:18
(Video) Girl: Okay, that's a cat sitting in a bed.
1
18104
4156
Ok, è un gatto seduto sul letto.
00:22
The boy is petting the elephant.
2
22260
4040
Il ragazzo sta accarezzando l'elefante.
00:26
Those are people that are going on an airplane.
3
26300
4354
Sono persone che salgono su un aereo.
00:30
That's a big airplane.
4
30654
2810
È un grande aereo.
00:33
Fei-Fei Li: This is a three-year-old child
5
33464
2206
È una bambina di tre anni
00:35
describing what she sees in a series of photos.
6
35670
3679
che descrive ciò che vede nelle foto.
00:39
She might still have a lot to learn about this world,
7
39349
2845
Anche se ha ancora tanto da imparare,
00:42
but she's already an expert at one very important task:
8
42194
4549
è già un'esperta in un compito importante:
00:46
to make sense of what she sees.
9
46743
2846
capire ciò che vede.
La tecnologia nella nostra società è più sviluppata che mai.
00:50
Our society is more technologically advanced than ever.
10
50229
4226
00:54
We send people to the moon, we make phones that talk to us
11
54455
3629
Mandiamo persone sulla Luna, creiamo cellulari che ci parlano
00:58
or customize radio stations that can play only music we like.
12
58084
4946
o personalizziamo le stazioni radio per ascoltare la musica che ci piace.
01:03
Yet, our most advanced machines and computers
13
63030
4055
Eppure, i computer e i dispositivi più avanzati
01:07
still struggle at this task.
14
67085
2903
non sono ancora in grado di svolgere questo compito.
01:09
So I'm here today to give you a progress report
15
69988
3459
Oggi vi mostrerò un rapporto di avanzamento
01:13
on the latest advances in our research in computer vision,
16
73447
4047
sui progressi della nostra ricerca sulla visione artificiale,
01:17
one of the most frontier and potentially revolutionary
17
77494
4161
una delle tecnologie informatiche
01:21
technologies in computer science.
18
81655
3206
più rivoluzionarie.
01:24
Yes, we have prototyped cars that can drive by themselves,
19
84861
4551
Sì, abbiamo prototipi di auto che si guidano da sole,
01:29
but without smart vision, they cannot really tell the difference
20
89412
3853
ma senza la smart vision, non riescono a distinguere fra
01:33
between a crumpled paper bag on the road, which can be run over,
21
93265
3970
un sacchetto spiegazzato sulla strada che può essere investito
01:37
and a rock that size, which should be avoided.
22
97235
3340
e una pietra che sarebbe da evitare.
01:41
We have made fabulous megapixel cameras,
23
101415
3390
Abbiamo creato favolose fotocamere con megapixel,
01:44
but we have not delivered sight to the blind.
24
104805
3135
ma non abbiamo ancora ridato la vista ai ciechi.
01:48
Drones can fly over massive land,
25
108420
3305
I droni volano su grandi parti di terra,
01:51
but don't have enough vision technology
26
111725
2134
ma la loro tecnologia visiva non basta
01:53
to help us to track the changes of the rainforests.
27
113859
3461
a monitorare le variazioni delle foreste pluviali.
01:57
Security cameras are everywhere,
28
117320
2950
Ci sono telecamere a circuito chiuso ovunque,
02:00
but they do not alert us when a child is drowning in a swimming pool.
29
120270
5067
che però non ci avvertono quando un bambino sta affogando in una piscina.
02:06
Photos and videos are becoming an integral part of global life.
30
126167
5595
Video e foto stanno diventando parte integrante della vita globale.
02:11
They're being generated at a pace that's far beyond what any human,
31
131762
4087
Sono generati a un ritmo più veloce di quello che ogni uomo
02:15
or teams of humans, could hope to view,
32
135849
2783
o gruppi di uomini spera di poter avere,
02:18
and you and I are contributing to that at this TED.
33
138632
3921
e vi contribuiamo in questo TED.
02:22
Yet our most advanced software is still struggling at understanding
34
142553
5232
Eppure il nostro software più avanzato non riesce ancora a capire
02:27
and managing this enormous content.
35
147785
3876
e amministrare quest'enorme contenuto.
02:31
So in other words, collectively as a society,
36
151661
5272
In altri termini collettivamente
siamo una società di ciechi
02:36
we're very much blind,
37
156933
1746
02:38
because our smartest machines are still blind.
38
158679
3387
perché le nostre macchine più intelligenti sono ancora cieche.
02:43
"Why is this so hard?" you may ask.
39
163526
2926
Vi chiederete perché sia così difficile.
02:46
Cameras can take pictures like this one
40
166452
2693
Le fotocamere scattano foto come questa,
trasformando le luci in una matrice bidimensionale di numeri,
02:49
by converting lights into a two-dimensional array of numbers
41
169145
3994
i pixels,
02:53
known as pixels,
42
173139
1650
02:54
but these are just lifeless numbers.
43
174789
2251
però sono solo numeri senza vita.
02:57
They do not carry meaning in themselves.
44
177040
3111
Non hanno alcun significato di per sé.
03:00
Just like to hear is not the same as to listen,
45
180151
4343
Proprio come udire non è come ascoltare,
03:04
to take pictures is not the same as to see,
46
184494
4040
scattare foto non è come vedere,
03:08
and by seeing, we really mean understanding.
47
188534
3829
e con vedere intendiamo capire.
03:13
In fact, it took Mother Nature 540 million years of hard work
48
193293
6177
In effetti, ci sono voluti 540 milioni anni di duro lavoro a Madre Natura
03:19
to do this task,
49
199470
1973
per completare questo compito,
03:21
and much of that effort
50
201443
1881
e gran parte di questo sforzo
03:23
went into developing the visual processing apparatus of our brains,
51
203324
5271
è andato allo sviluppo dell'elaborazione ottica del cervello,
03:28
not the eyes themselves.
52
208595
2647
non agli occhi.
03:31
So vision begins with the eyes,
53
211242
2747
Quindi la visione inizia con gli occhi,
03:33
but it truly takes place in the brain.
54
213989
3518
ma in realtà avviene nel cervello.
03:38
So for 15 years now, starting from my Ph.D. at Caltech
55
218287
5060
Dunque da 15 anni, prima con il Ph.D al Caltech
03:43
and then leading Stanford's Vision Lab,
56
223347
2926
e poi a capo del Vision Lab di Stanford,
lavoro con i miei mentori, collaboratori e studenti
03:46
I've been working with my mentors, collaborators and students
57
226273
4396
03:50
to teach computers to see.
58
230669
2889
per insegnare ai computer a vedere.
03:54
Our research field is called computer vision and machine learning.
59
234658
3294
Il campo di ricerca si chiama visione artificiale e apprendimento automatico.
03:57
It's part of the general field of artificial intelligence.
60
237952
3878
Fa parte del campo generale dell'intelligenza artificiale.
04:03
So ultimately, we want to teach the machines to see just like we do:
61
243000
5493
Allora in sostanza, vogliamo insegnare alle macchine a vedere proprio come noi:
04:08
naming objects, identifying people, inferring 3D geometry of things,
62
248493
5387
indicare cose, riconoscere persone, dedurre la geometria 3D degli oggetti,
04:13
understanding relations, emotions, actions and intentions.
63
253880
5688
comprendere relazioni, emozioni, azioni e intenzioni.
04:19
You and I weave together entire stories of people, places and things
64
259568
6153
Tessiamo intere storie di persone, luoghi e cose
04:25
the moment we lay our gaze on them.
65
265721
2164
quando fissiamo lo sguardo su di loro.
04:28
The first step towards this goal is to teach a computer to see objects,
66
268955
5583
Il primo passo verso questo scopo è insegnare a un computer a vedere cose,
04:34
the building block of the visual world.
67
274538
3368
il mattone del mondo visivo.
04:37
In its simplest terms, imagine this teaching process
68
277906
4434
In parole povere immaginate questo processo d'insegnamento
04:42
as showing the computers some training images
69
282340
2995
come mostrare ai computer immagini
04:45
of a particular object, let's say cats,
70
285335
3321
di un oggetto specifico, come gatti,
04:48
and designing a model that learns from these training images.
71
288656
4737
e creare un modello che impara da queste immagini.
04:53
How hard can this be?
72
293393
2044
Quanto può essere difficile?
04:55
After all, a cat is just a collection of shapes and colors,
73
295437
4052
Dopotutto, un gatto è solo un insieme di forme e colori,
04:59
and this is what we did in the early days of object modeling.
74
299489
4086
e l'abbiamo fatto nella prima fase di realizzazione dei modelli.
05:03
We'd tell the computer algorithm in a mathematical language
75
303575
3622
Abbiamo detto all'algoritmo con un linguaggio matematico
05:07
that a cat has a round face, a chubby body,
76
307197
3343
che un gatto ha una faccia tonda, un corpo paffuto,
05:10
two pointy ears, and a long tail,
77
310540
2299
due orecchie a punta e una coda lunga,
05:12
and that looked all fine.
78
312839
1410
e fin qui tutto ok.
05:14
But what about this cat?
79
314859
2113
Ma che dire di questo gatto?
05:16
(Laughter)
80
316972
1091
(Risate)
È tutto accartocciato.
05:18
It's all curled up.
81
318063
1626
05:19
Now you have to add another shape and viewpoint to the object model.
82
319689
4719
Ora si deve aggiungere un'altra forma e punto di vista al modello.
05:24
But what if cats are hidden?
83
324408
1715
Ma se i gatti sono nascosti?
05:27
What about these silly cats?
84
327143
2219
Che dire di questi gatti sciocchi?
05:31
Now you get my point.
85
331112
2417
Ora mi capite.
05:33
Even something as simple as a household pet
86
333529
3367
Anche qualcosa di semplice come un animale domestico
05:36
can present an infinite number of variations to the object model,
87
336896
4504
può presentare un numero infinito di variazioni,
05:41
and that's just one object.
88
341400
2233
ed è un oggetto solo.
05:44
So about eight years ago,
89
344573
2492
Allora otto anni fa,
05:47
a very simple and profound observation changed my thinking.
90
347065
5030
un'osservazione molto semplice e profonda ha cambiato il mio parere.
05:53
No one tells a child how to see,
91
353425
2685
Nessuno dice a un bambino come vedere,
05:56
especially in the early years.
92
356110
2261
soprattutto nei primi anni.
05:58
They learn this through real-world experiences and examples.
93
358371
5000
Lo imparano con esperienze e esempi del mondo reale.
06:03
If you consider a child's eyes
94
363371
2740
Se considerate gli occhi di un bambino
come un paio di fotocamere biologiche,
06:06
as a pair of biological cameras,
95
366111
2554
06:08
they take one picture about every 200 milliseconds,
96
368665
4180
scattano una foto ogni 200 millisecondi,
06:12
the average time an eye movement is made.
97
372845
3134
il tempo medio di un movimento dell'occhio.
06:15
So by age three, a child would have seen hundreds of millions of pictures
98
375979
5550
Dunque entro i 3 anni, un bambino vede centinaia di migliaia di immagini
06:21
of the real world.
99
381529
1834
del mondo reale.
06:23
That's a lot of training examples.
100
383363
2280
Questi sono tanti esempi d'insegnamento.
06:26
So instead of focusing solely on better and better algorithms,
101
386383
5989
Così invece di concentrarci solo su algoritmi sempre migliori,
06:32
my insight was to give the algorithms the kind of training data
102
392372
5272
la mia idea era dare agli algoritmi dati d'insegnamento
06:37
that a child was given through experiences
103
397644
3319
come quelli che un bambino ottiene con le esperienze
06:40
in both quantity and quality.
104
400963
3878
con la stessa qualità e quantità.
06:44
Once we know this,
105
404841
1858
Una volta capito questo,
06:46
we knew we needed to collect a data set
106
406699
2971
dovevamo accumulare un set di dati
06:49
that has far more images than we have ever had before,
107
409670
4459
che aveva più immagini che mai,
forse migliaia di volte di più,
06:54
perhaps thousands of times more,
108
414129
2577
06:56
and together with Professor Kai Li at Princeton University,
109
416706
4111
e con il Professore Kai Li dell'Università di Princeton,
07:00
we launched the ImageNet project in 2007.
110
420817
4752
abbiamo lanciato il progetto ImageNet nel 2007.
07:05
Luckily, we didn't have to mount a camera on our head
111
425569
3838
Per fortuna non abbiamo dovuto montare una videocamera in testa
07:09
and wait for many years.
112
429407
1764
e aspettare tanti anni.
Siamo andati su Internet,
07:11
We went to the Internet,
113
431171
1463
07:12
the biggest treasure trove of pictures that humans have ever created.
114
432634
4436
il più grande tesoro d'immagini che gli uomini abbiano mai creato.
07:17
We downloaded nearly a billion images
115
437070
3041
Abbiamo scaricato quasi un miliardo d'immagini
07:20
and used crowdsourcing technology like the Amazon Mechanical Turk platform
116
440111
5880
e usato il crowdsourcing come Amazon Mechanical Turk
07:25
to help us to label these images.
117
445991
2339
per aiutarci a etichettarle.
07:28
At its peak, ImageNet was one of the biggest employers
118
448330
4900
Al suo culumine ImageNet era uno dei maggiori datori di lavoro
07:33
of the Amazon Mechanical Turk workers:
119
453230
2996
di Amazon Mechanical Turk:
07:36
together, almost 50,000 workers
120
456226
3854
insieme, quasi 50.000 dipendenti
07:40
from 167 countries around the world
121
460080
4040
di 167 paesi in tutto il mondo
07:44
helped us to clean, sort and label
122
464120
3947
ci hanno aiutato a pulire, smistare e etichettare
07:48
nearly a billion candidate images.
123
468067
3575
quasi un miliardo di aspiranti immagini.
07:52
That was how much effort it took
124
472612
2653
Ecco lo sforzo che c'è voluto
07:55
to capture even a fraction of the imagery
125
475265
3900
a catturare persino una frazione delle immagini
della mente infantile nei primi anni di sviluppo.
07:59
a child's mind takes in in the early developmental years.
126
479165
4171
A cose fatte l'idea di usare Big Data
08:04
In hindsight, this idea of using big data
127
484148
3902
08:08
to train computer algorithms may seem obvious now,
128
488050
4550
per addestrare algoritmi informatici forse oggi sembra ovvia,
08:12
but back in 2007, it was not so obvious.
129
492600
4110
però nel 2007 non lo era così tanto.
08:16
We were fairly alone on this journey for quite a while.
130
496710
3878
Per un bel po' siamo stati soli in questo viaggio.
08:20
Some very friendly colleagues advised me to do something more useful for my tenure,
131
500588
5003
Dei colleghi mi hanno consigliato di fare qualcosa di più utile all'incarico
e avevamo di continuo difficoltà con il finanziamento.
08:25
and we were constantly struggling for research funding.
132
505591
4342
08:29
Once, I even joked to my graduate students
133
509933
2485
Una volta ho scherzato con i miei studenti
08:32
that I would just reopen my dry cleaner's shop to fund ImageNet.
134
512418
4063
dicendo che avrei riaperto la lavanderia per finanziare ImageNet.
08:36
After all, that's how I funded my college years.
135
516481
4761
Alla fine in questo modo ho finanziato i miei anni al college.
Allora abbiamo continuato.
08:41
So we carried on.
136
521242
1856
Nel 2009 ImageNet project ha consegnato
08:43
In 2009, the ImageNet project delivered
137
523098
3715
08:46
a database of 15 million images
138
526813
4042
un database di 15 milioni d'immagini
08:50
across 22,000 classes of objects and things
139
530855
4805
in 22.000 categorie di oggetti e cose
08:55
organized by everyday English words.
140
535660
3320
organizzate in parole di uso quotidiano.
08:58
In both quantity and quality,
141
538980
2926
Sia in quantità sia in qualità
09:01
this was an unprecedented scale.
142
541906
2972
era una scala senza precedenti.
09:04
As an example, in the case of cats,
143
544878
3461
Per esempio, nel caso dei gatti,
09:08
we have more than 62,000 cats
144
548339
2809
abbiamo più di 62.000 gatti
09:11
of all kinds of looks and poses
145
551148
4110
di tutti i tipi di aspetto e pose
09:15
and across all species of domestic and wild cats.
146
555258
5223
e in tutte le specie di gatti domestici e selvatici.
09:20
We were thrilled to have put together ImageNet,
147
560481
3344
Eravamo emozionati per il completamento di ImageNet,
09:23
and we wanted the whole research world to benefit from it,
148
563825
3738
e volevamo che tutto il mondo di ricerca ne beneficiasse,
09:27
so in the TED fashion, we opened up the entire data set
149
567563
4041
così come TED abbiamo aperto gratis tutto il set di dati
09:31
to the worldwide research community for free.
150
571604
3592
alla comunità di ricerca mondiale.
09:36
(Applause)
151
576636
4000
(Applausi)
09:41
Now that we have the data to nourish our computer brain,
152
581416
4538
Ora grazie ai dati per nutrire il cervello del nostro computer
09:45
we're ready to come back to the algorithms themselves.
153
585954
3737
siamo pronti a ritornare agli algoritmi.
09:49
As it turned out, the wealth of information provided by ImageNet
154
589691
5178
Infatti, la ricchezza d'informazioni di ImageNet
09:54
was a perfect match to a particular class of machine learning algorithms
155
594869
4806
era perfetta per una particolare classe di algoritmi di apprendimento automatico
09:59
called convolutional neural network,
156
599675
2415
chiamata rete neurale,
10:02
pioneered by Kunihiko Fukushima, Geoff Hinton, and Yann LeCun
157
602090
5248
innovazione di Kunihiko Fukushima, Geoff Hinton e Yann LeCun
10:07
back in the 1970s and '80s.
158
607338
3645
negli anni '70 e '80.
10:10
Just like the brain consists of billions of highly connected neurons,
159
610983
5619
Proprio come il cervello è fatto di miliardi di neuroni ben collegati,
10:16
a basic operating unit in a neural network
160
616602
3854
un'unità operativa elementare in una rete neurale
10:20
is a neuron-like node.
161
620456
2415
è un nodo tipo neurone.
10:22
It takes input from other nodes
162
622871
2554
Prende input di altri nodi
10:25
and sends output to others.
163
625425
2718
e invia output a altri.
10:28
Moreover, these hundreds of thousands or even millions of nodes
164
628143
4713
Inoltre quelle centinaia di migliaia o persino milioni di nodi
10:32
are organized in hierarchical layers,
165
632856
3227
sono organizzate in strati gerarchici,
anche simili al cervello.
10:36
also similar to the brain.
166
636083
2554
10:38
In a typical neural network we use to train our object recognition model,
167
638637
4783
In una tipica rete neurale usata per addestrare il modello di riconoscimento
ci sono 24 milioni di nodi,
10:43
it has 24 million nodes,
168
643420
3181
10:46
140 million parameters,
169
646601
3297
140 milioni di parametri
10:49
and 15 billion connections.
170
649898
2763
e 15 miliardi di connessioni.
10:52
That's an enormous model.
171
652661
2415
È un modello enorme.
10:55
Powered by the massive data from ImageNet
172
655076
3901
Alimentata dai dati di ImageNet
10:58
and the modern CPUs and GPUs to train such a humongous model,
173
658977
5433
e dalle moderne CPU e GPU per addestrare un modello così immenso,
11:04
the convolutional neural network
174
664410
2369
la rete neurale convoluzionale
11:06
blossomed in a way that no one expected.
175
666779
3436
è sbocciata in un modo che nessuno si aspettava.
11:10
It became the winning architecture
176
670215
2508
È diventata l'architettura vincente
11:12
to generate exciting new results in object recognition.
177
672723
5340
che genera risultati eclatanti nel riconoscimento degli oggetti.
11:18
This is a computer telling us
178
678063
2810
Questo è un computer che ci dice
11:20
this picture contains a cat
179
680873
2300
che in questa foto c'è un gatto
11:23
and where the cat is.
180
683173
1903
e dov'è il gatto.
Certo ci sono anche altre cose oltre ai gatti
11:25
Of course there are more things than cats,
181
685076
2112
11:27
so here's a computer algorithm telling us
182
687188
2438
quindi ecco un algoritmo informatico che ci dice
11:29
the picture contains a boy and a teddy bear;
183
689626
3274
che nella foto ci sono un ragazzo e un orsacchiotto;
11:32
a dog, a person, and a small kite in the background;
184
692900
4366
un cane, una persona e un aquilone sullo sfondo;
11:37
or a picture of very busy things
185
697266
3135
o una foto di molte cose curiose
11:40
like a man, a skateboard, railings, a lampost, and so on.
186
700401
4644
come un uomo, uno skateboard, ringhiere, un lampione e così via.
11:45
Sometimes, when the computer is not so confident about what it sees,
187
705045
5293
A volte quando il computer non è tanto sicuro di quello che vede,
11:51
we have taught it to be smart enough
188
711498
2276
gli insegnamo a essere abbastanza intelligente
11:53
to give us a safe answer instead of committing too much,
189
713774
3878
da darci una risposta sicura invece d'impegnarsi troppo,
11:57
just like we would do,
190
717652
2811
proprio come faremmo noi,
12:00
but other times our computer algorithm is remarkable at telling us
191
720463
4666
ma altre volte gli algoritmi ci dicono in modo eccezionale
12:05
what exactly the objects are,
192
725129
2253
esattamente che oggetti sono,
12:07
like the make, model, year of the cars.
193
727382
3436
come tipo, modello, anno delle macchine.
12:10
We applied this algorithm to millions of Google Street View images
194
730818
5386
Abbiamo applicato questi algoritmi a tante immagini di Google Street View
12:16
across hundreds of American cities,
195
736204
3135
in centinaia di città americane
12:19
and we have learned something really interesting:
196
739339
2926
e abbiamo imparato una cosa molto interessante:
12:22
first, it confirmed our common wisdom
197
742265
3320
primo, ha confermato il nostro sapere comune
12:25
that car prices correlate very well
198
745585
3290
che i prezzi delle auto sono legati molto bene
12:28
with household incomes.
199
748875
2345
ai redditi familiari.
12:31
But surprisingly, car prices also correlate well
200
751220
4527
Ma stupisce che i prezzi delle auto siano legati bene anche
12:35
with crime rates in cities,
201
755747
2300
al tasso di criminalità nelle città,
o agli schemi di votazione con codici postali.
12:39
or voting patterns by zip codes.
202
759007
3963
Allora aspettate. Ce l'abbiamo fatta?
12:44
So wait a minute. Is that it?
203
764060
2206
12:46
Has the computer already matched or even surpassed human capabilities?
204
766266
5153
Il computer ha già le stesse capacità dell'uomo o perfino migliori?
12:51
Not so fast.
205
771419
2138
Non ancora.
12:53
So far, we have just taught the computer to see objects.
206
773557
4923
Finora abbiamo insegnato ai computer a vedere oggetti.
12:58
This is like a small child learning to utter a few nouns.
207
778480
4644
È come un bambino piccolo che impara a pronunciare alcuni sostantivi.
13:03
It's an incredible accomplishment,
208
783124
2670
È un risultato incredibile,
13:05
but it's only the first step.
209
785794
2460
ma è solo il primo passo.
13:08
Soon, another developmental milestone will be hit,
210
788254
3762
Presto raggiungeremo un'altra pietra miliare dello sviluppo
e i bambini inizieranno a comunicare con frasi.
13:12
and children begin to communicate in sentences.
211
792016
3461
13:15
So instead of saying this is a cat in the picture,
212
795477
4224
Allora invece di dire che c'è un gatto nella foto,
13:19
you already heard the little girl telling us this is a cat lying on a bed.
213
799701
5202
avete sentito la ragazzina dire che è un gatto sdraiato sul letto.
13:24
So to teach a computer to see a picture and generate sentences,
214
804903
5595
Quindi per insegnare al computer a vedere una foto e generare frasi,
13:30
the marriage between big data and machine learning algorithm
215
810498
3948
il connubio fra Big Data e algoritmo di apprendimento automatico
13:34
has to take another step.
216
814446
2275
deve fare un altro passo.
13:36
Now, the computer has to learn from both pictures
217
816721
4156
Ora il computer deve imparare sia dalle foto
13:40
as well as natural language sentences
218
820877
2856
che dalle frasi naturali
13:43
generated by humans.
219
823733
3322
generate dagli uomini.
13:47
Just like the brain integrates vision and language,
220
827055
3853
Proprio come il cervello integra lingua e visione,
13:50
we developed a model that connects parts of visual things
221
830908
5201
abbiamo sviluppato un modello che collega parti di oggetti ottici
13:56
like visual snippets
222
836109
1904
come frammenti ottici
a parole e espressioni nelle frasi.
13:58
with words and phrases in sentences.
223
838013
4203
14:02
About four months ago,
224
842216
2763
Circa quattro mesi fa,
14:04
we finally tied all this together
225
844979
2647
abbiamo finalmente provato tutto insieme
14:07
and produced one of the first computer vision models
226
847626
3784
e prodotto uno dei primi modelli di visione artificiale
14:11
that is capable of generating a human-like sentence
227
851410
3994
capace di generare una frase tipo quella umana
14:15
when it sees a picture for the first time.
228
855404
3506
quando vede una foto per la prima volta.
14:18
Now, I'm ready to show you what the computer says
229
858910
4644
Ora sono pronta a mostrarvi cosa dice il computer
14:23
when it sees the picture
230
863554
1975
quando vede la foto
14:25
that the little girl saw at the beginning of this talk.
231
865529
3830
che la ragazzina ha visto all'inizio di questa conferenza.
Un uomo in piedi vicino a un elefante.
14:31
(Video) Computer: A man is standing next to an elephant.
232
871519
3344
14:36
A large airplane sitting on top of an airport runway.
233
876393
3634
Un grande aereo sulla pista di un aeroporto.
Certo, lavoriamo duro per migliorare i nostri algoritmi
14:41
FFL: Of course, we're still working hard to improve our algorithms,
234
881057
4212
14:45
and it still has a lot to learn.
235
885269
2596
e ci sono ancora molte cose da imparare.
14:47
(Applause)
236
887865
2291
(Applausi)
14:51
And the computer still makes mistakes.
237
891556
3321
E il computer fa ancora errori.
14:54
(Video) Computer: A cat lying on a bed in a blanket.
238
894877
3391
Un gatto sdraiato a letto con una coperta.
Quindi quando vede troppi gatti,
14:58
FFL: So of course, when it sees too many cats,
239
898268
2553
15:00
it thinks everything might look like a cat.
240
900821
2926
crede che tutto somigli a un gatto.
15:05
(Video) Computer: A young boy is holding a baseball bat.
241
905317
2864
Un ragazzino con una mazza da baseball.
15:08
(Laughter)
242
908181
1765
(Risate)
15:09
FFL: Or, if it hasn't seen a toothbrush, it confuses it with a baseball bat.
243
909946
4583
Se non ha mai visto uno spazzolino lo confonde con una mazza da baseball.
15:15
(Video) Computer: A man riding a horse down a street next to a building.
244
915309
3434
Un uomo a cavallo in una strada vicino a un edificio.
15:18
(Laughter)
245
918743
2023
(Risate)
15:20
FFL: We haven't taught Art 101 to the computers.
246
920766
3552
Non abbiamo insegnato l'Art. 101 ai computer.
15:25
(Video) Computer: A zebra standing in a field of grass.
247
925768
2884
Una zebra in una prateria.
15:28
FFL: And it hasn't learned to appreciate the stunning beauty of nature
248
928652
3367
E non ha imparato a apprezzare la magnifica bellezza della natura
15:32
like you and I do.
249
932019
2438
come me e voi.
15:34
So it has been a long journey.
250
934457
2832
Quindi è un lungo vaggio.
15:37
To get from age zero to three was hard.
251
937289
4226
Andare dall'età zero all'età tre era faticoso.
15:41
The real challenge is to go from three to 13 and far beyond.
252
941515
5596
La vera sfida è andare da 3 a 13 e più lontano.
15:47
Let me remind you with this picture of the boy and the cake again.
253
947111
4365
Ripensate alla foto del bambino con la torta.
15:51
So far, we have taught the computer to see objects
254
951476
4064
Finora abbiamo insegnato al computer a vedere oggetti
15:55
or even tell us a simple story when seeing a picture.
255
955540
4458
o a raccontarci una semplice storia quando vede un'immagine.
15:59
(Video) Computer: A person sitting at a table with a cake.
256
959998
3576
Una persona seduta a tavola con una torta.
16:03
FFL: But there's so much more to this picture
257
963574
2630
Ma c'è molto di più in questa foto
di una persona con una torta.
16:06
than just a person and a cake.
258
966204
2270
16:08
What the computer doesn't see is that this is a special Italian cake
259
968474
4467
Ciò che il computer non vede è che è una torta italiana speciale
16:12
that's only served during Easter time.
260
972941
3217
che si serve solo a Pasqua.
Il bambino indossa la sua t-shirt preferita
16:16
The boy is wearing his favorite t-shirt
261
976158
3205
16:19
given to him as a gift by his father after a trip to Sydney,
262
979363
3970
regalatagli dal padre dopo un viaggio a Sidney,
16:23
and you and I can all tell how happy he is
263
983333
3808
e possiamo notare quanto sia felice
16:27
and what's exactly on his mind at that moment.
264
987141
3203
e cosa c'è di preciso nella sua mente in quel momento.
Questo è mio figlio Leo.
16:31
This is my son Leo.
265
991214
3125
16:34
On my quest for visual intelligence,
266
994339
2624
Nella mia ricerca dell'intelligenza ottica,
16:36
I think of Leo constantly
267
996963
2391
penso a Leo di continuo
16:39
and the future world he will live in.
268
999354
2903
e al mondo futuro in cui vivrà.
Quando le macchine potranno vedere,
16:42
When machines can see,
269
1002257
2021
16:44
doctors and nurses will have extra pairs of tireless eyes
270
1004278
4712
i medici e gli infermieri avranno un paio extra di occhi instancabili
16:48
to help them to diagnose and take care of patients.
271
1008990
4092
a aiutarli con diagnosi e cura dei pazienti.
16:53
Cars will run smarter and safer on the road.
272
1013082
4383
Le auto saranno più intelligenti e sicure sulla strada.
16:57
Robots, not just humans,
273
1017465
2694
I robot, non solo gli umani,
17:00
will help us to brave the disaster zones to save the trapped and wounded.
274
1020159
4849
ci aiuteranno a salvare persone intrappolate e ferite.
17:05
We will discover new species, better materials,
275
1025798
3796
Scopriremo nuove specie, materiali migliori,
17:09
and explore unseen frontiers with the help of the machines.
276
1029594
4509
e esploreremo frontiere invisibili con l'aiuto delle macchine.
Un po' alla volta diamo la vista alle macchine.
17:15
Little by little, we're giving sight to the machines.
277
1035113
4167
17:19
First, we teach them to see.
278
1039280
2798
In primo luogo le insegnamo a vedere.
Poi ci aiutano a vedere meglio.
17:22
Then, they help us to see better.
279
1042078
2763
17:24
For the first time, human eyes won't be the only ones
280
1044841
4165
Per la prima volta gli occhi umani non saranno i soli
a meditare e esplorare il nostro mondo.
17:29
pondering and exploring our world.
281
1049006
2934
17:31
We will not only use the machines for their intelligence,
282
1051940
3460
Useremo le macchine non solo per la loro intelligenza,
17:35
we will also collaborate with them in ways that we cannot even imagine.
283
1055400
6179
ma collaboreremo anche con loro in modi che neanche immaginiamo.
17:41
This is my quest:
284
1061579
2161
Questa è la mia ricerca:
17:43
to give computers visual intelligence
285
1063740
2712
dare ai computer intelligenza ottica
17:46
and to create a better future for Leo and for the world.
286
1066452
5131
e creare un futuro migliore per Leo e per il mondo.
17:51
Thank you.
287
1071583
1811
Grazie.
17:53
(Applause)
288
1073394
3785
(Applausi)
A proposito di questo sito web

Questo sito vi presenterà i video di YouTube utili per l'apprendimento dell'inglese. Vedrete lezioni di inglese tenute da insegnanti di alto livello provenienti da tutto il mondo. Fate doppio clic sui sottotitoli in inglese visualizzati su ogni pagina video per riprodurre il video da lì. I sottotitoli scorrono in sincronia con la riproduzione del video. Se avete commenti o richieste, contattateci tramite questo modulo di contatto.

https://forms.gle/WvT1wiN1qDtmnspy7