How we teach computers to understand pictures | Fei Fei Li

Fei-Fei Li: Cómo estamos enseñando a las computadoras a entender imágenes

1,162,036 views

2015-03-23 ・ TED


New videos

How we teach computers to understand pictures | Fei Fei Li

Fei-Fei Li: Cómo estamos enseñando a las computadoras a entender imágenes

1,162,036 views ・ 2015-03-23

TED


Haga doble clic en los subtítulos en inglés para reproducir el vídeo.

Traductor: Cuicani Ríos Revisor: Sebastian Betti
00:14
Let me show you something.
0
14366
3738
Les mostraré algo.
00:18
(Video) Girl: Okay, that's a cat sitting in a bed.
1
18104
4156
(Video) Niña: Eso es un gato sentado en una cama.
00:22
The boy is petting the elephant.
2
22260
4040
El niño está acariciando al elefante.
00:26
Those are people that are going on an airplane.
3
26300
4354
Esas son personas que van en un avión.
00:30
That's a big airplane.
4
30654
2810
Ese es un avión grande.
00:33
Fei-Fei Li: This is a three-year-old child
5
33464
2206
Fei-Fei Li: Así describe una niña
00:35
describing what she sees in a series of photos.
6
35670
3679
de 3 años lo que ve en una serie de fotos.
00:39
She might still have a lot to learn about this world,
7
39349
2845
Tal vez le falta mucho por aprender sobre este mundo,
00:42
but she's already an expert at one very important task:
8
42194
4549
pero ya es experta en algo importante:
00:46
to make sense of what she sees.
9
46743
2846
entender lo que ve.
00:50
Our society is more technologically advanced than ever.
10
50229
4226
Tecnológicamente, nuestra sociedad está más avanzada que nunca.
00:54
We send people to the moon, we make phones that talk to us
11
54455
3629
Enviamos personas a la luna, nuestros teléfonos nos hablan
00:58
or customize radio stations that can play only music we like.
12
58084
4946
o personalizan radios para reproducir solo la música que nos gusta.
01:03
Yet, our most advanced machines and computers
13
63030
4055
Sin embargo, nuestras máquinas y computadoras más avanzadas
01:07
still struggle at this task.
14
67085
2903
aún tienen problemas en ese aspecto.
01:09
So I'm here today to give you a progress report
15
69988
3459
Hoy estoy aquí para darles un reporte
01:13
on the latest advances in our research in computer vision,
16
73447
4047
de nuestros últimos avances en visión artificial,
01:17
one of the most frontier and potentially revolutionary
17
77494
4161
una de las tecnologías potencialmente más revolucionarias
01:21
technologies in computer science.
18
81655
3206
en la ciencia de la computación.
01:24
Yes, we have prototyped cars that can drive by themselves,
19
84861
4551
Es cierto, hemos inventado autos que conducen solos,
01:29
but without smart vision, they cannot really tell the difference
20
89412
3853
pero sin una visión inteligente, realmente no pueden distinguir
01:33
between a crumpled paper bag on the road, which can be run over,
21
93265
3970
entre una bolsa arrugada de papel en el camino, que puede uno pisar,
01:37
and a rock that size, which should be avoided.
22
97235
3340
y una roca del mismo tamaño, que debemos evitar.
01:41
We have made fabulous megapixel cameras,
23
101415
3390
Hemos creado fabulosas cámaras de muchos megapíxeles,
01:44
but we have not delivered sight to the blind.
24
104805
3135
pero aún no podemos devolverle la vista a un ciego.
01:48
Drones can fly over massive land,
25
108420
3305
Los drones pueden volar sobre grandes superficies de tierra,
01:51
but don't have enough vision technology
26
111725
2134
pero no tienen tecnología
01:53
to help us to track the changes of the rainforests.
27
113859
3461
de visión suficiente
para ayudarnos a monitorear los cambios en los bosques tropicales.
01:57
Security cameras are everywhere,
28
117320
2950
Hay cámaras de seguridad en todas partes,
02:00
but they do not alert us when a child is drowning in a swimming pool.
29
120270
5067
pero no nos alertan cuando un niño se está ahogando en una piscina.
02:06
Photos and videos are becoming an integral part of global life.
30
126167
5595
Las fotos y los videos se están volviendo parte integral de la vida global.
02:11
They're being generated at a pace that's far beyond what any human,
31
131762
4087
Se generan a un ritmo mucho mayor de lo que cualquier humano,
02:15
or teams of humans, could hope to view,
32
135849
2783
o equipo de humanos, podría ver,
02:18
and you and I are contributing to that at this TED.
33
138632
3921
y Uds. y yo contribuimos a eso en este TED.
02:22
Yet our most advanced software is still struggling at understanding
34
142553
5232
Aun así, nuestro software más avanzado tiene problemas para entender
02:27
and managing this enormous content.
35
147785
3876
y gestionar este enorme contenido.
02:31
So in other words, collectively as a society,
36
151661
5272
En otras palabras, colectivamente como una sociedad,
02:36
we're very much blind,
37
156933
1746
somos muy ciegos,
02:38
because our smartest machines are still blind.
38
158679
3387
porque nuestras máquinas más inteligentes aún son ciegas.
02:43
"Why is this so hard?" you may ask.
39
163526
2926
Se preguntarán: "¿Por qué es tan difícil?"
02:46
Cameras can take pictures like this one
40
166452
2693
Las cámaras pueden tomar fotos como esta
02:49
by converting lights into a two-dimensional array of numbers
41
169145
3994
convirtiendo luz en matrices numéricas bidimensionales
02:53
known as pixels,
42
173139
1650
conocidas como pixeles,
02:54
but these are just lifeless numbers.
43
174789
2251
pero estos son solo números vacíos.
02:57
They do not carry meaning in themselves.
44
177040
3111
En sí mismos no tienen significado.
03:00
Just like to hear is not the same as to listen,
45
180151
4343
Al igual que oír no es lo mismo que escuchar,
03:04
to take pictures is not the same as to see,
46
184494
4040
tomar fotografías no es lo mismo que ver;
03:08
and by seeing, we really mean understanding.
47
188534
3829
y solo viendo podemos realmente entender.
03:13
In fact, it took Mother Nature 540 million years of hard work
48
193293
6177
De hecho, le tomó a la Madre Naturaleza 540 millones de años de arduo trabajo
03:19
to do this task,
49
199470
1973
lograr esta tarea,
03:21
and much of that effort
50
201443
1881
y mucho de ese esfuerzo
03:23
went into developing the visual processing apparatus of our brains,
51
203324
5271
consistió en desarrollar el sistema de procesamiento visual en el cerebro,
03:28
not the eyes themselves.
52
208595
2647
no los ojos en sí.
03:31
So vision begins with the eyes,
53
211242
2747
La visión empieza en los ojos,
03:33
but it truly takes place in the brain.
54
213989
3518
pero, en realidad, ocurre en nuestro cerebro.
03:38
So for 15 years now, starting from my Ph.D. at Caltech
55
218287
5060
Durante 15 años, empezando desde mi doctorado en Caltech
03:43
and then leading Stanford's Vision Lab,
56
223347
2926
y luego al frente del laboratorio Stanford Vision Lab,
03:46
I've been working with my mentors, collaborators and students
57
226273
4396
he trabajado con mis mentores, colaboradores y estudiantes
03:50
to teach computers to see.
58
230669
2889
para enseñar a las computadoras a ver.
03:54
Our research field is called computer vision and machine learning.
59
234658
3294
Nuestro campo de investigación se llama
"visión artificial y aprendizaje automático".
03:57
It's part of the general field of artificial intelligence.
60
237952
3878
Es parte del campo de la inteligencia artificial.
04:03
So ultimately, we want to teach the machines to see just like we do:
61
243000
5493
Queremos enseñar a las máquinas a ver tal como nosotros lo hacemos:
04:08
naming objects, identifying people, inferring 3D geometry of things,
62
248493
5387
nombrar objetos, identificar personas, inferir la geometría 3D de las cosas,
04:13
understanding relations, emotions, actions and intentions.
63
253880
5688
entender relaciones, emociones, acciones e intenciones.
04:19
You and I weave together entire stories of people, places and things
64
259568
6153
Nosotros tejemos historias completas de la gente, los lugares y las cosas
04:25
the moment we lay our gaze on them.
65
265721
2164
simplemente con mirarlas.
04:28
The first step towards this goal is to teach a computer to see objects,
66
268955
5583
El primer paso hacia esta meta es enseñar a una computadora a ver objetos,
04:34
the building block of the visual world.
67
274538
3368
la unidad básica del mundo visual.
04:37
In its simplest terms, imagine this teaching process
68
277906
4434
En términos más simples, imaginen este proceso
04:42
as showing the computers some training images
69
282340
2995
mostrando a las computadoras algunas imágenes de entrenamiento
04:45
of a particular object, let's say cats,
70
285335
3321
de un objeto en particular, digamos gatos,
04:48
and designing a model that learns from these training images.
71
288656
4737
y diseñar un modelo que aprenda de estas imágenes.
04:53
How hard can this be?
72
293393
2044
¿Qué tan difícil puede ser esto?
04:55
After all, a cat is just a collection of shapes and colors,
73
295437
4052
A fin de cuentas, un gato es solo un conjunto de formas y colores,
04:59
and this is what we did in the early days of object modeling.
74
299489
4086
y eso fue lo que hacíamos en los inicios de la modelización de objetos.
05:03
We'd tell the computer algorithm in a mathematical language
75
303575
3622
Decíamos al algoritmo de la computadora
en un lenguaje matemático
05:07
that a cat has a round face, a chubby body,
76
307197
3343
que un gato tiene cara redonda, cuerpo regordete,
05:10
two pointy ears, and a long tail,
77
310540
2299
dos orejas puntiagudas y cola larga,
05:12
and that looked all fine.
78
312839
1410
y así quedaba bien.
05:14
But what about this cat?
79
314859
2113
Pero ¿qué me dicen de este gato?
05:16
(Laughter)
80
316972
1091
(Risas)
05:18
It's all curled up.
81
318063
1626
Está todo retorcido.
05:19
Now you have to add another shape and viewpoint to the object model.
82
319689
4719
Se debe agregar otra figura y otra perspectiva al modelo del objeto.
05:24
But what if cats are hidden?
83
324408
1715
¿Y si los gatos están escondidos?
05:27
What about these silly cats?
84
327143
2219
¿Qué tal estos gatos tontos?
05:31
Now you get my point.
85
331112
2417
Ahora entienden mi idea.
05:33
Even something as simple as a household pet
86
333529
3367
Incluso algo tan simple como una mascota
05:36
can present an infinite number of variations to the object model,
87
336896
4504
puede tener un número infinito de variaciones en el modelo del objeto,
05:41
and that's just one object.
88
341400
2233
y eso es solo un objeto.
05:44
So about eight years ago,
89
344573
2492
Así que hace unos 8 años,
05:47
a very simple and profound observation changed my thinking.
90
347065
5030
una observación simple y profunda cambió mi perspectiva.
05:53
No one tells a child how to see,
91
353425
2685
Nadie le dice al niño cómo ver,
05:56
especially in the early years.
92
356110
2261
menos aún en los primeros años.
05:58
They learn this through real-world experiences and examples.
93
358371
5000
Ellos aprenden a través de ejemplos y experiencias del mundo real.
06:03
If you consider a child's eyes
94
363371
2740
Si consideramos los ojos de un niño
06:06
as a pair of biological cameras,
95
366111
2554
como un par de cámaras biológicas,
06:08
they take one picture about every 200 milliseconds,
96
368665
4180
toman una foto cada 200 milisegundos,
06:12
the average time an eye movement is made.
97
372845
3134
el tiempo promedio en que el ojo hace un movimiento.
06:15
So by age three, a child would have seen hundreds of millions of pictures
98
375979
5550
Entonces, a los 3 años un niño ha visto cientos de millones de fotografías
06:21
of the real world.
99
381529
1834
del mundo real.
06:23
That's a lot of training examples.
100
383363
2280
Esos son muchos ejemplares de entrenamiento.
06:26
So instead of focusing solely on better and better algorithms,
101
386383
5989
Así que en lugar de enfocarnos solo en mejorar los algoritmos,
06:32
my insight was to give the algorithms the kind of training data
102
392372
5272
mi intención fue dotar a los algoritmos con los datos de entrenamiento
06:37
that a child was given through experiences
103
397644
3319
que un niño adquiere con la experiencia
06:40
in both quantity and quality.
104
400963
3878
tanto en cantidad como en calidad.
06:44
Once we know this,
105
404841
1858
Al conocer esto
06:46
we knew we needed to collect a data set
106
406699
2971
supimos que necesitábamos recolectar
06:49
that has far more images than we have ever had before,
107
409670
4459
muchas más imágenes que nunca,
06:54
perhaps thousands of times more,
108
414129
2577
tal vez miles de veces más;
06:56
and together with Professor Kai Li at Princeton University,
109
416706
4111
y junto con el profesor Kai Li en la Universidad de Princeton,
07:00
we launched the ImageNet project in 2007.
110
420817
4752
lanzamos el proyecto ImageNet en 2007.
07:05
Luckily, we didn't have to mount a camera on our head
111
425569
3838
Por suerte, no tuvimos que ponernos una cámara en la cabeza
07:09
and wait for many years.
112
429407
1764
y esperar muchos años.
07:11
We went to the Internet,
113
431171
1463
Entramos a Internet,
07:12
the biggest treasure trove of pictures that humans have ever created.
114
432634
4436
el banco de imágenes más grande creado por la humanidad.
07:17
We downloaded nearly a billion images
115
437070
3041
Descargamos casi 1000 millones de imágenes
07:20
and used crowdsourcing technology like the Amazon Mechanical Turk platform
116
440111
5880
y usamos tecnología de crowdsourcing como la plataforma Amazon Mechanical Turk
07:25
to help us to label these images.
117
445991
2339
para etiquetar estas imágenes.
07:28
At its peak, ImageNet was one of the biggest employers
118
448330
4900
En su mejor momento, ImageNet fue uno de los empleadores más importantes
07:33
of the Amazon Mechanical Turk workers:
119
453230
2996
de trabajadores en Amazon Mechanical Turk:
07:36
together, almost 50,000 workers
120
456226
3854
Casi 50 000 trabajadores
07:40
from 167 countries around the world
121
460080
4040
de 167 países del mundo
07:44
helped us to clean, sort and label
122
464120
3947
nos ayudaron a limpiar, separar y etiquetar
07:48
nearly a billion candidate images.
123
468067
3575
casi 1000 millones de imágenes candidatas.
07:52
That was how much effort it took
124
472612
2653
Se necesitó todo ese esfuerzo
07:55
to capture even a fraction of the imagery
125
475265
3900
para capturar apenas una fracción de todas las imágenes
07:59
a child's mind takes in in the early developmental years.
126
479165
4171
que un niño asimila en sus primeros años de desarrollo.
08:04
In hindsight, this idea of using big data
127
484148
3902
Viendo en retrospectiva, esta idea de usar muchos datos
08:08
to train computer algorithms may seem obvious now,
128
488050
4550
para entrenar algoritmos puede parecer obvia ahora.
08:12
but back in 2007, it was not so obvious.
129
492600
4110
Sin embargo, en 2007 no era tan evidente.
08:16
We were fairly alone on this journey for quite a while.
130
496710
3878
Estuvimos solos en este viaje por un buen rato.
08:20
Some very friendly colleagues advised me to do something more useful for my tenure,
131
500588
5003
Algunos colegas me sugerían hacer algo más útil para mi cátedra,
08:25
and we were constantly struggling for research funding.
132
505591
4342
y con frecuencia teníamos problemas para conseguir financiamiento.
08:29
Once, I even joked to my graduate students
133
509933
2485
Incluso llegué a decir a mis alumnos, como broma,
08:32
that I would just reopen my dry cleaner's shop to fund ImageNet.
134
512418
4063
que tendría que reabrir mi tintorería para financiar ImageNet.
08:36
After all, that's how I funded my college years.
135
516481
4761
Después de todo, así fue como financié mis años de universidad.
08:41
So we carried on.
136
521242
1856
Seguimos adelante.
08:43
In 2009, the ImageNet project delivered
137
523098
3715
En 2009, el proyecto ImageNet juntó
08:46
a database of 15 million images
138
526813
4042
una base de datos con 15 millones de imágenes
08:50
across 22,000 classes of objects and things
139
530855
4805
de 22 000 tipos de objetos
08:55
organized by everyday English words.
140
535660
3320
organizados por palabra en inglés de uso cotidiano.
08:58
In both quantity and quality,
141
538980
2926
En cantidad y calidad,
09:01
this was an unprecedented scale.
142
541906
2972
tuvieron una escala sin precedentes.
09:04
As an example, in the case of cats,
143
544878
3461
Por ejemplo, en el caso de los gatos,
09:08
we have more than 62,000 cats
144
548339
2809
tenemos más de 62 000 gatos
09:11
of all kinds of looks and poses
145
551148
4110
con todo tipo de apariencias y poses
09:15
and across all species of domestic and wild cats.
146
555258
5223
y todo tipo de gatos domésticos y salvajes.
09:20
We were thrilled to have put together ImageNet,
147
560481
3344
Estábamos entusiasmados por haber creado ImageNet
09:23
and we wanted the whole research world to benefit from it,
148
563825
3738
y queríamos que todo el mundo de la investigación se beneficiara,
09:27
so in the TED fashion, we opened up the entire data set
149
567563
4041
así que, al estilo TED, abrimos toda la base de datos
09:31
to the worldwide research community for free.
150
571604
3592
a la comunidad mundial de investigadores de forma gratuita.
09:36
(Applause)
151
576636
4000
(Aplausos)
09:41
Now that we have the data to nourish our computer brain,
152
581416
4538
Ahora que tenemos los datos para nutrir el cerebro de nuestra computadora,
09:45
we're ready to come back to the algorithms themselves.
153
585954
3737
estamos listos para volver a los algoritmos.
09:49
As it turned out, the wealth of information provided by ImageNet
154
589691
5178
La abundancia de información aportada por ImageNet
09:54
was a perfect match to a particular class of machine learning algorithms
155
594869
4806
fue el complemento perfecto para un tipo particular de algoritmos
09:59
called convolutional neural network,
156
599675
2415
de aprendizaje automático llamado red neuronal convolucional,
10:02
pioneered by Kunihiko Fukushima, Geoff Hinton, and Yann LeCun
157
602090
5248
ideado por Kunihiko Fukushima, Geoff Hinton y Yann LeCun
10:07
back in the 1970s and '80s.
158
607338
3645
en los años 70 y 80.
10:10
Just like the brain consists of billions of highly connected neurons,
159
610983
5619
Como el cerebro que tiene miles de millones de neuronas muy bien conectadas,
10:16
a basic operating unit in a neural network
160
616602
3854
la unidad operativa fundamental en una red neuronal
10:20
is a neuron-like node.
161
620456
2415
es un nodo con forma de neurona.
10:22
It takes input from other nodes
162
622871
2554
Toma datos de otros nodos
10:25
and sends output to others.
163
625425
2718
los procesa y los manda a otros nodos.
10:28
Moreover, these hundreds of thousands or even millions of nodes
164
628143
4713
Además, estos cientos de miles o incluso millones de nodos
10:32
are organized in hierarchical layers,
165
632856
3227
se organizan en capas jerárquicas,
10:36
also similar to the brain.
166
636083
2554
algo parecido al cerebro.
10:38
In a typical neural network we use to train our object recognition model,
167
638637
4783
En una red neuronal típica que usamos para entrenar
nuestro modelo de reconocimiento de objetos
10:43
it has 24 million nodes,
168
643420
3181
hay 24 millones de nodos,
10:46
140 million parameters,
169
646601
3297
140 millones de parámetros
10:49
and 15 billion connections.
170
649898
2763
y 15 000 millones de conexiones.
10:52
That's an enormous model.
171
652661
2415
Es un modelo enorme.
10:55
Powered by the massive data from ImageNet
172
655076
3901
Alimentado por la información masiva de ImageNet
10:58
and the modern CPUs and GPUs to train such a humongous model,
173
658977
5433
y las CPUs y GPUs modernas que entrenan este inmenso modelo,
11:04
the convolutional neural network
174
664410
2369
la red neuronal convolucional
11:06
blossomed in a way that no one expected.
175
666779
3436
tuvo un éxito inesperado.
11:10
It became the winning architecture
176
670215
2508
Se volvió la ingeniería ganadora
11:12
to generate exciting new results in object recognition.
177
672723
5340
para generar nuevos y emocionantes resultados en reconocimiento de objetos.
11:18
This is a computer telling us
178
678063
2810
Esta es una computadora que nos dice
11:20
this picture contains a cat
179
680873
2300
que la foto tiene un gato
11:23
and where the cat is.
180
683173
1903
y dónde está el gato.
11:25
Of course there are more things than cats,
181
685076
2112
Desde luego hay más cosas aparte de los gatos
11:27
so here's a computer algorithm telling us
182
687188
2438
así que hay un algoritmo informático que nos dice
11:29
the picture contains a boy and a teddy bear;
183
689626
3274
que hay un niño y un oso de peluche en la foto;
11:32
a dog, a person, and a small kite in the background;
184
692900
4366
un perro, una persona y un papalote al fondo;
11:37
or a picture of very busy things
185
697266
3135
o una foto de cosas muy ocupadas
11:40
like a man, a skateboard, railings, a lampost, and so on.
186
700401
4644
como un hombre, una patineta, un barandal, una lámpara etc.
11:45
Sometimes, when the computer is not so confident about what it sees,
187
705045
5293
A veces, cuando la computadora no está segura de lo que ve,
11:51
we have taught it to be smart enough
188
711498
2276
le hemos enseñado
11:53
to give us a safe answer instead of committing too much,
189
713774
3878
a darnos una respuesta segura en lugar de comprometer su respuesta,
11:57
just like we would do,
190
717652
2811
tal como lo haríamos nosotros.
12:00
but other times our computer algorithm is remarkable at telling us
191
720463
4666
Pero otras veces nuestro algoritmo informático es muy acertado al decirnos
12:05
what exactly the objects are,
192
725129
2253
qué son los objetos exactamente,
12:07
like the make, model, year of the cars.
193
727382
3436
como la marca, modelo y año de los coches.
12:10
We applied this algorithm to millions of Google Street View images
194
730818
5386
Aplicamos este algoritmo a millones de imágenes de Google Street View
12:16
across hundreds of American cities,
195
736204
3135
de cientos de ciudades de Estados Unidos
12:19
and we have learned something really interesting:
196
739339
2926
y hemos aprendido algo muy interesante:
12:22
first, it confirmed our common wisdom
197
742265
3320
primero, confirmó nuestra idea
12:25
that car prices correlate very well
198
745585
3290
de que los precios de los autos se relacionan bien
12:28
with household incomes.
199
748875
2345
con los ingresos del hogar.
12:31
But surprisingly, car prices also correlate well
200
751220
4527
Pero sorprendentemente, los precios de los autos se relacionan también
12:35
with crime rates in cities,
201
755747
2300
con las tasas de criminalidad en la ciudades
12:39
or voting patterns by zip codes.
202
759007
3963
o los patrones de votación por código postal.
12:44
So wait a minute. Is that it?
203
764060
2206
Un minuto. ¿Eso es todo?
12:46
Has the computer already matched or even surpassed human capabilities?
204
766266
5153
¿Acaso la computadora ya sobrepasó las capacidades humanas?
12:51
Not so fast.
205
771419
2138
No tan rápido.
12:53
So far, we have just taught the computer to see objects.
206
773557
4923
Hasta ahora solo hemos enseñado a la computadora a ver objetos.
12:58
This is like a small child learning to utter a few nouns.
207
778480
4644
Es como un niño pequeño que aprende a decir palabras.
13:03
It's an incredible accomplishment,
208
783124
2670
Es un logro increíble,
13:05
but it's only the first step.
209
785794
2460
pero es apenas el primer paso.
13:08
Soon, another developmental milestone will be hit,
210
788254
3762
Pronto daremos otro paso
13:12
and children begin to communicate in sentences.
211
792016
3461
y los niños empiezan a comunicarse con frases.
13:15
So instead of saying this is a cat in the picture,
212
795477
4224
Así que en lugar de decir que hay un gato en la foto,
13:19
you already heard the little girl telling us this is a cat lying on a bed.
213
799701
5202
la niña ya dice que el gato está sobre la cama.
13:24
So to teach a computer to see a picture and generate sentences,
214
804903
5595
Así que para enseñar a una computadora a ver una foto y generar frases
13:30
the marriage between big data and machine learning algorithm
215
810498
3948
la conjunción de mucha información y el algoritmo de aprendizaje automático
13:34
has to take another step.
216
814446
2275
debe dar otro paso.
13:36
Now, the computer has to learn from both pictures
217
816721
4156
Ahora, la computadora tiene que aprender de fotografías
13:40
as well as natural language sentences
218
820877
2856
así como de frases en lenguaje natural
13:43
generated by humans.
219
823733
3322
generado por humanos.
13:47
Just like the brain integrates vision and language,
220
827055
3853
De la forma en que el cerebro integra visión y lenguaje,
13:50
we developed a model that connects parts of visual things
221
830908
5201
desarrollamos un modelo que conecta partes de cosas visuales
13:56
like visual snippets
222
836109
1904
como fragmentos visuales
13:58
with words and phrases in sentences.
223
838013
4203
con palabras y frases en oraciones.
14:02
About four months ago,
224
842216
2763
Hace unos 4 meses
14:04
we finally tied all this together
225
844979
2647
finalmente juntamos todo esto
14:07
and produced one of the first computer vision models
226
847626
3784
y produjimos uno de los primeros modelos de visión artificial
14:11
that is capable of generating a human-like sentence
227
851410
3994
que puede generar frases como las de un humano
14:15
when it sees a picture for the first time.
228
855404
3506
cuando ve una foto por primera vez.
14:18
Now, I'm ready to show you what the computer says
229
858910
4644
Ahora estoy lista para mostrarles lo que dice la computadora
14:23
when it sees the picture
230
863554
1975
cuando ve la fotografía
14:25
that the little girl saw at the beginning of this talk.
231
865529
3830
que la niña vio al inicio de esta charla.
14:31
(Video) Computer: A man is standing next to an elephant.
232
871519
3344
(Video) Computadora: Un hombre está junto a un elefante.
14:36
A large airplane sitting on top of an airport runway.
233
876393
3634
Un avión grande está encima de una pista de aeropuerto.
14:41
FFL: Of course, we're still working hard to improve our algorithms,
234
881057
4212
FFL: Desde luego, seguimos trabajando para mejorar los algoritmos
14:45
and it still has a lot to learn.
235
885269
2596
y aún tiene mucho que aprender.
14:47
(Applause)
236
887865
2291
(Aplausos)
14:51
And the computer still makes mistakes.
237
891556
3321
Y la computadora aún comete errores.
14:54
(Video) Computer: A cat lying on a bed in a blanket.
238
894877
3391
(Video) Computadora: Un gato recostado en la cama en una sábana.
14:58
FFL: So of course, when it sees too many cats,
239
898268
2553
FFL: Y cuando ha visto demasiados gatos,
15:00
it thinks everything might look like a cat.
240
900821
2926
cree que todo lo que ve parece un gato.
15:05
(Video) Computer: A young boy is holding a baseball bat.
241
905317
2864
(Video) Computadora: Un niño tiene un bate de béisbol.
15:08
(Laughter)
242
908181
1765
(Risas)
15:09
FFL: Or, if it hasn't seen a toothbrush, it confuses it with a baseball bat.
243
909946
4583
FFL: O si nunca ha visto un cepillo de dientes,
lo confunde con un bate de béisbol.
15:15
(Video) Computer: A man riding a horse down a street next to a building.
244
915309
3434
(Video) Computadora: Un hombre montando un caballo junto a un edificio.
15:18
(Laughter)
245
918743
2023
(Risas)
15:20
FFL: We haven't taught Art 101 to the computers.
246
920766
3552
FFL: No le hemos enseñado arte elemental a las computadoras.
15:25
(Video) Computer: A zebra standing in a field of grass.
247
925768
2884
(Video) Computadora: Una cebra en un campo de hierba.
15:28
FFL: And it hasn't learned to appreciate the stunning beauty of nature
248
928652
3367
FFL: Y no ha aprendido a apreciar la belleza deslumbrante
15:32
like you and I do.
249
932019
2438
de la naturaleza, como lo hacemos nosotros.
15:34
So it has been a long journey.
250
934457
2832
Así que ha sido un largo camino.
15:37
To get from age zero to three was hard.
251
937289
4226
Pasar de los 0 a los 3 años fue difícil.
15:41
The real challenge is to go from three to 13 and far beyond.
252
941515
5596
El verdadero reto es llegar a los 13 y mucho más todavía.
15:47
Let me remind you with this picture of the boy and the cake again.
253
947111
4365
Recordemos nuevamente esta foto del niño y el pastel.
15:51
So far, we have taught the computer to see objects
254
951476
4064
Hasta ahora, le hemos enseñado a la computadora a ver objetos
15:55
or even tell us a simple story when seeing a picture.
255
955540
4458
o incluso darnos una pequeña historia cuando ve la foto.
15:59
(Video) Computer: A person sitting at a table with a cake.
256
959998
3576
(Video) Computadora: Una persona sentada a la mesa con un pastel.
16:03
FFL: But there's so much more to this picture
257
963574
2630
FFL: Pero hay mucho más en esta fotografía
16:06
than just a person and a cake.
258
966204
2270
que simplemente una persona y un pastel.
16:08
What the computer doesn't see is that this is a special Italian cake
259
968474
4467
Lo que la computadora no ve es que este es un pastel especial italiano
16:12
that's only served during Easter time.
260
972941
3217
exclusivo de Pascua.
16:16
The boy is wearing his favorite t-shirt
261
976158
3205
El niño viste su camiseta favorita,
16:19
given to him as a gift by his father after a trip to Sydney,
262
979363
3970
que le regaló su papá tras un viaje a Sídney,
16:23
and you and I can all tell how happy he is
263
983333
3808
y nosotros podemos decir qué tan feliz está
16:27
and what's exactly on his mind at that moment.
264
987141
3203
y qué pasa por su mente en ese momento.
16:31
This is my son Leo.
265
991214
3125
Ese es mi hijo Leo.
16:34
On my quest for visual intelligence,
266
994339
2624
En mi búsqueda de inteligencia visual,
16:36
I think of Leo constantly
267
996963
2391
pienso constantemente en él
16:39
and the future world he will live in.
268
999354
2903
y en el futuro en que va a vivir.
16:42
When machines can see,
269
1002257
2021
Cuando las máquinas puedan ver,
16:44
doctors and nurses will have extra pairs of tireless eyes
270
1004278
4712
los médicos y enfermeras tendrán un par extra de ojos incansables
16:48
to help them to diagnose and take care of patients.
271
1008990
4092
para ayudarlos a diagnosticar y cuidar de los pacientes.
16:53
Cars will run smarter and safer on the road.
272
1013082
4383
Los autos andarán de forma inteligente y segura en los caminos.
16:57
Robots, not just humans,
273
1017465
2694
Robots, y no solo humanos,
17:00
will help us to brave the disaster zones to save the trapped and wounded.
274
1020159
4849
nos ayudarán a desafiar zonas de desastre para salvar heridos y atrapados.
17:05
We will discover new species, better materials,
275
1025798
3796
Descubriremos nuevas especies, mejores materiales,
17:09
and explore unseen frontiers with the help of the machines.
276
1029594
4509
y exploraremos fronteras nunca vistas con ayuda de las máquinas.
17:15
Little by little, we're giving sight to the machines.
277
1035113
4167
Poco a poco, damos a las máquinas el don de la vista.
17:19
First, we teach them to see.
278
1039280
2798
Primero les enseñamos a ver.
17:22
Then, they help us to see better.
279
1042078
2763
Luego ellas nos ayudarán a ver mejor.
17:24
For the first time, human eyes won't be the only ones
280
1044841
4165
Por primera vez, los ojos humanos no serán los únicos
17:29
pondering and exploring our world.
281
1049006
2934
que exploren nuestro mundo.
17:31
We will not only use the machines for their intelligence,
282
1051940
3460
No solo usaremos máquinas por su inteligencia,
17:35
we will also collaborate with them in ways that we cannot even imagine.
283
1055400
6179
también colaboraremos con ellas de formas que ni siquiera imaginamos.
17:41
This is my quest:
284
1061579
2161
Esta es mi misión:
17:43
to give computers visual intelligence
285
1063740
2712
dar a las computadoras inteligencia visual
17:46
and to create a better future for Leo and for the world.
286
1066452
5131
y crear un mejor futuro para Leo y para el mundo.
17:51
Thank you.
287
1071583
1811
Gracias.
17:53
(Applause)
288
1073394
3785
(Aplausos)
Acerca de este sitio web

Este sitio le presentará vídeos de YouTube útiles para aprender inglés. Verá lecciones de inglés impartidas por profesores de primera categoría de todo el mundo. Haz doble clic en los subtítulos en inglés que aparecen en cada página de vídeo para reproducir el vídeo desde allí. Los subtítulos se desplazan en sincronía con la reproducción del vídeo. Si tiene algún comentario o petición, póngase en contacto con nosotros mediante este formulario de contacto.

https://forms.gle/WvT1wiN1qDtmnspy7