Massive-scale online collaboration | Luis von Ahn

Luis von Ahn: colaboración virtual a escala masiva

309,846 views

2011-12-06 ・ TED


New videos

Massive-scale online collaboration | Luis von Ahn

Luis von Ahn: colaboración virtual a escala masiva

309,846 views ・ 2011-12-06

TED


Haga doble clic en los subtítulos en inglés para reproducir el vídeo.

Traductor: Sebastian Betti Revisor: Lidia Cámara de la Fuente
00:15
How many of you had to fill out a web form
0
15260
2000
¿Cuántos han tenido que llenar un formulario web
00:17
where you've been asked to read
1
17284
1512
e ingresar unas letras distorsionadas como estas?
00:18
a distorted sequence of characters like this?
2
18820
2136
¿Cuántos odian hacerlo?
00:20
How many of you found it really annoying?
3
20980
1953
Excelente. Bueno, eso lo inventé yo.
00:22
(Laughter)
4
22957
1099
00:24
OK, outstanding. So I invented that.
5
24080
1736
(Risas)
00:25
(Laughter)
6
25840
1836
Participé en el invento.
00:27
Or I was one of the people who did it.
7
27700
1856
Eso se llama captcha
00:29
That thing is called a CAPTCHA.
8
29580
1536
y sirve para asegurar que quien llena el formulario
00:31
And it is there to make sure you, the entity filling out the form,
9
31140
3136
es un humano y no un programa informático
00:34
are a human and not a computer program
10
34300
1856
diseñado para enviar el formulario millones de millones de veces.
00:36
that was written to submit the form millions of times.
11
36180
2576
Y funciona porque los humanos,
00:38
The reason it works is because humans, at least non-visually-impaired humans,
12
38780
3656
salvo los discapacitados visuales,
pueden leer estos caracteres distorsionados
00:42
have no trouble reading these distorted characters,
13
42460
2416
pero los programas informáticos no pueden.
00:44
whereas programs can't do it as well yet.
14
44900
1976
00:46
In the case of Ticketmaster,
15
46900
1496
Por ejemplo, en el caso de Ticketmaster
00:48
the reason you have to type these characters
16
48420
2096
hay que ingresar estos caracteres distorsionados
00:50
is to prevent scalpers from writing a program
17
50540
2136
para evitar que los revendedores escriban un programa
00:52
that can buy millions of tickets, two at a time.
18
52700
2256
que compre millones de entradas, dos a la vez.
00:54
CAPTCHAs are used all over the Internet.
19
54980
1936
Los captchas se extienden por Internet.
00:56
And since they're used so often,
20
56940
1576
Y dado que se usan tan a menudo
00:58
a lot of times the sequence of random characters shown to the user
21
58540
3136
muchas veces la secuencia de letras escogidas al azar
es un poco desafortunada.
01:01
is not so fortunate.
22
61700
1216
01:02
So this is an example from the Yahoo registration page.
23
62940
2656
Por ejemplo, esto viene de Yahoo.
01:05
The random characters that happened to be shown to the user
24
65620
2816
Las letras escogidas totalmente al azar fueron
WAIT que en inglés significa «esperar».
01:08
were W, A, I, T, which, of course, spell a word.
25
68460
2696
Pero lo mejor es el mensaje que,
01:11
But the best part is the message
26
71180
2096
01:13
that the Yahoo help desk got about 20 minutes later.
27
73300
2456
unos 20 minutos después, recibió Yahoo de este usuario.
01:15
[Help! I've been waiting for over 20 minutes and nothing happens.]
28
75780
3136
(Texto: "¡Ayuda! Hace 20 minutos que espero y no pasa nada")
01:18
(Laughter)
29
78940
4856
(Risas)
01:23
This person thought they needed to wait.
30
83820
1905
Esta persona pensó que tenía que esperar.
01:25
This, of course, is not as bad as this poor person.
31
85749
2407
Claro, no es tan malo como éste. (Texto: REINICIAR)
01:28
(Laughter)
32
88180
2376
(Risas)
01:30
CAPTCHA Project is something that we did at Carnegie Melllon over 10 years ago,
33
90580
3736
El proyecto CAPTCHA fue concebido aquí Carnegie Mellon hace 10 años,
y se usa en todos lados.
01:34
and it's been used everywhere.
34
94340
1456
01:35
Let me now tell you about a project that we did a few years later,
35
95820
3136
Les contaré de un proyecto de hace unos años
que es una evolución de captcha.
01:38
which is sort of the next evolution of CAPTCHA.
36
98980
2216
Es un proyecto que se llama reCAPTCHA.
01:41
This is a project that we call reCAPTCHA,
37
101220
1976
Algo que iniciamos aquí en Carnegie Mellon,
01:43
which is something that we started here at Carnegie Mellon,
38
103220
2776
y que luego convertimos en empresa.
01:46
then we turned it into a start-up company.
39
106020
2008
Y hace cosa de año y medio
01:48
And then about a year and a half ago, Google actually acquired this company.
40
108052
3588
fue adquirida por Google.
Les contaré el origen de este proyecto.
01:51
Let me tell you what this project started.
41
111664
2007
Este proyecto surgió al darnos cuenta
01:53
This project started from the following realization:
42
113695
2531
de que cada día la gente de todo el mundo
01:56
It turns out that approximately 200 million CAPTCHAs
43
116250
2437
ingresa unos 200 millones de captchas.
01:58
are typed everyday by people around the world.
44
118711
2151
02:00
When I first heard this, I was quite proud of myself.
45
120886
2484
Al principio sentí orgullo de esto.
Pensé, mira el impacto que ha tenido mi trabajo.
02:03
I thought, look at the impact my research has had.
46
123394
2341
Pero después empecé a sentirme mal.
02:05
But then I started feeling bad.
47
125759
1484
Y es que cada vez que ingresamos un captcha
02:07
Here's the thing: each time you type a CAPTCHA,
48
127267
2206
perdemos unos 10 segundos de nuestro tiempo.
02:09
essentially, you waste 10 seconds of your time.
49
129497
2339
02:11
And if you multiply that by 200 million,
50
131860
1936
Y si multiplicamos eso por 200 millones
02:13
you get that humanity is wasting about 500,000 hours every day
51
133820
3016
llegamos a que la humanidad en su conjunto pierde unas 500 mil horas diarias
02:16
typing these annoying CAPTCHAs.
52
136860
1536
ingresando captchas en la Web.
02:18
(Laughter)
53
138420
1016
Eso me hizo sentir mal.
02:19
So then I started feeling bad.
54
139460
1429
02:20
(Laughter)
55
140913
1803
(Risas)
02:22
And then I started thinking, of course, we can't just get rid of CAPTCHAs,
56
142740
3496
Pero después pensé que no podemos deshacernos de los captchas
porque de eso depende en parte la seguridad de la red.
02:26
because the security of the web depends on them.
57
146260
2256
Y me pregunté si habría alguna forma de usar este esfuerzo
02:28
But then I started thinking, can we use this effort
58
148540
2416
02:30
for something that is good for humanity?
59
150980
1936
en algo de utilidad para la humanidad.
02:32
So see, here's the thing.
60
152940
1496
La cosa es así:
02:34
While you're typing a CAPTCHA, during those 10 seconds,
61
154460
2616
en esos 10 segundos que ingresamos un captcha
los cerebros están haciendo algo genial.
02:37
your brain is doing something amazing.
62
157100
1856
02:38
Your brain is doing something that computers cannot yet do.
63
158980
2816
Están haciendo algo imposible para las computadoras.
¿Podemos hacerles hacer algo beneficioso en esos 10 segundos?
02:41
So can we get you to do useful work for those 10 seconds?
64
161820
2696
Dicho de otro modo,
02:44
Is there some humongous problem that we cannot yet get computers to solve,
65
164540
3496
¿existe algún problema gigantesco que las computadoras aún no puedan resolver
pero que podamos dividir en pedacitos de 10 segundos
02:48
yet we can split into tiny 10-second chunks
66
168060
2776
02:50
such that each time somebody solves a CAPTCHA,
67
170860
2176
de modo que cada vez que alguien resuelva un captcha
resuelva un pedacito de ese problema?
02:53
they solve a little bit of this problem?
68
173060
1936
La respuesta es "sí" y eso es lo que hacemos.
02:55
And the answer to that is "yes," and this is what we're doing now.
69
175020
3136
Hoy en día, si alguien ingresa un captcha, lo que tal vez no saben
02:58
Nowadays, while you're typing a CAPTCHA,
70
178180
1936
es que no sólo verifican que son humanos
03:00
not only are you authenticating yourself as a human,
71
180140
2429
sino que además nos ayudan a digitalizar libros.
03:02
but in addition you're helping us to digitize books.
72
182593
2443
Les explicaré como funciona.
03:05
Let me explain how this works.
73
185060
1456
Hay varios proyectos de digitalización de libros.
03:06
There's a lot of projects trying to digitize books.
74
186540
2416
Hay uno de Google, otro de The Internet Archive.
03:08
Google has one. The Internet Archive has one.
75
188980
2136
Amazon tiene otro con el Kindle.
03:11
Amazon, with the Kindle, is trying to digitize books.
76
191140
2496
Básicamente, eso funciona así.
03:13
Basically, the way this works is you start with an old book.
77
193660
3176
Se empieza con esas cosas físicas.
03:16
You've seen those things, right?
78
196860
1576
¿Las han visto, verdad?
03:18
Like a book?
79
198460
1216
(Risas)
03:19
(Laughter)
80
199700
1256
03:20
So you start with a book and then you scan it.
81
200980
2536
Empezamos con un libro y luego lo escaneamos.
Escanear un libro
03:23
Now, scanning a book
82
203540
1216
03:24
is like taking a digital photograph of every page.
83
204780
2376
es tomar una foto digital a cada página.
Eso nos da una imagen que contiene
03:27
It gives you an image for every page.
84
207180
1816
el texto de cada página.
03:29
This is an image with text for every page of the book.
85
209020
2576
En el paso siguiente
03:31
The next step in the process is that the computer needs to be able
86
211620
3136
un programa informático convierte a texto todas las palabras de la imagen.
03:34
to decipher the words in this image.
87
214780
1736
Esta tecnología se llama ROC,
03:36
That's using a technology called OCR, for optical character recognition,
88
216540
3416
reconocimiento óptico de caracteres,
03:39
which takes a picture of text
89
219980
1416
y consiste en tomar una imagen del texto
03:41
and tries to figure out what text is in there.
90
221420
2176
e intentar averiguar el texto que contiene.
03:43
Now, the problem is that OCR is not perfect.
91
223620
2656
Pero el problema es que el ROC no es perfecto.
En particular en los libros antiguos
03:46
Especially for older books
92
226300
1416
03:47
where the ink has faded and the pages have turned yellow,
93
227740
3136
de páginas amarillentas, en los que la tinta se ha desvanecido
03:50
OCR cannot recognize a lot of the words.
94
230900
1936
hay muchas palabras que el OCR no reconoce.
03:52
For things that were written more than 50 years ago,
95
232860
2456
Por ejemplo, en obras escritas hace más de 50 años,
hay un 30% de palabras que la computadora no reconoce.
03:55
the computer cannot recognize about 30 percent of the words.
96
235340
2856
Por eso ahora
03:58
So now we're taking all of the words that the computer cannot recognize
97
238220
3376
tomamos todas esas palabras que la computadora no descifra
04:01
and we're getting people to read them for us
98
241620
2256
y hacemos que las personas las reconozcan
04:03
while they're typing a CAPTCHA on the Internet.
99
243900
2216
mientras introducen un captcha en la Web.
O sea que la próxima vez que llenen un captcha, esas palabras ingresadas
04:06
So the next time you type a CAPTCHA, these words that you're typing
100
246140
3176
son palabras que vienen de libros que han sido digitalizados
04:09
are actually words from books that are being digitized
101
249340
2576
04:11
that the computer could not recognize.
102
251940
1856
y que la computadora no pudo reconocer.
04:13
The reason we have two words nowadays instead of one
103
253820
2456
La razón por la que hoy tenemos dos palabras en vez de una
es que el sistema
04:16
is because one of the words
104
256300
1416
04:17
is a word that the system just got out of a book,
105
257740
2576
toma una palabra desconocida
de un libro y la pone frente a ustedes.
04:20
it didn't know what it was and it's going to present it to you.
106
260340
3016
Pero dado que no conoce la respuesta, no puede puntuarlos.
04:23
But since it doesn't know the answer, it cannot grade it.
107
263380
2696
Entonces ponemos otra palabra
04:26
So we give you another word,
108
266100
1376
04:27
for which the system does know the answer.
109
267500
2000
conocida por el sistema.
04:29
We don't tell you which one's which and we say, please type both.
110
269524
3072
No decimos cuál es cuál; pedimos que ingresen ambas.
Y si ingresan la palabra correcta,
04:32
And if you type the correct word
111
272620
1575
para la cual el sistema ya sabe la respuesta,
04:34
for the one for which the system knows the answer,
112
274219
2377
suponemos que es un humano
04:36
it assumes you are human
113
276620
1256
04:37
and it also gets some confidence that you typed the other word correctly.
114
277900
3456
y eso da cierta confianza de que se ingresó la otra palabra correctamente.
Si repetimos el proceso con diez personas diferentes
04:41
And if we repeat this process to 10 different people
115
281380
2456
y todos están de acuerdo en la nueva palabra
04:43
and they agree on what the new word is,
116
283860
1896
entonces tenemos una nueva palabra digitalizada con precisión.
04:45
then we get one more word digitized accurately.
117
285780
2216
Así funciona el sistema.
04:48
So this is how the system works.
118
288020
1576
Y como lo lanzamos hace tres o cuatro años
04:49
And since we released it about three or four years ago,
119
289620
2616
muchos sitios web pasaron
04:52
a lot of websites have started switching from the old CAPTCHA,
120
292260
2936
del viejo captcha en el que la gente perdía el tiempo
04:55
where people wasted their time,
121
295220
1536
al nuevo captcha en el que la gente ayuda a digitalizar libros.
04:56
to the new CAPTCHA where people are helping to digitize books.
122
296780
2936
Un ejemplo es Ticketmaster.
04:59
So every time you buy tickets on Ticketmaster,
123
299740
2176
Cada vez que compramos entradas en Ticketmaster, ayudamos a digitalizar un libro.
05:01
you help to digitize a book.
124
301940
1376
Facebook: cada vez que añadimos un amigo o tocamos a alguien
05:03
Facebook: Every time you add a friend or poke somebody,
125
303340
2616
ayudamos a digitalizar un libro.
05:05
you help to digitize a book.
126
305980
1376
Twitter y otros 350 mil sitios usan recaptcha.
05:07
Twitter and about 350,000 other sites are all using reCAPTCHA.
127
307380
2936
De hecho, la cantidad de sitios que usan recaptcha es tan alta
05:10
And the number of sites that are using reCAPTCHA is so high
128
310340
2816
que digitalizamos diariamente una cantidad muy grande de palabras.
05:13
that the number of words we're digitizing per day is really large.
129
313180
3136
Son unas 100 millones al día
05:16
It's about 100 million a day,
130
316340
1416
que es el equivalente a unos 2 millones y medio de libros al año.
05:17
which is the equivalent of about two and a half million books a year.
131
317780
3496
Y todo se hace palabra a palabra por cada vez
05:21
And this is all being done one word at a time
132
321300
2136
con el ingreso de captchas por Internet.
05:23
by just people typing CAPTCHAs on the Internet.
133
323460
2216
(Aplausos)
05:25
(Applause)
134
325700
6880
05:32
Now, of course,
135
332940
1216
Ahora, claro,
05:34
since we're doing so many words per day,
136
334180
3336
como procesamos tantas palabras al día
suceden cosas divertidas.
05:37
funny things can happen.
137
337540
1256
05:38
This is especially true because now we're giving people
138
338820
2616
Y esto es particularmente cierto dado que ahora ponemos
dos palabras al azar, una al lado de la otra.
05:41
two randomly chosen English words next to each other.
139
341460
2496
Por eso ocurren cosas divertidas.
05:43
So funny things can happen.
140
343980
1336
Por ejemplo, presentamos esta palabra.
05:45
For example, we presented this word.
141
345340
1736
Es la palabra "cristianos"; no tiene nada de malo.
05:47
It's the word "Christians"; there's nothing wrong with it.
142
347100
2736
Pero si se la presenta con otra palabra elegida al azar
05:49
But if you present it along with another randomly chosen word,
143
349860
2936
pueden pasar cosas malas
05:52
bad things can happen.
144
352820
1336
como esta. (Texto: malos cristianos)
05:54
So we get this.
145
354180
1216
05:55
[bad Christians]
146
355420
1216
Pero es aún peor porque el sitio en el que apareció
05:56
But it's even worse, because the website where we showed this
147
356660
2896
se llama La Embajada del Reino de Dios.
05:59
actually happened to be called The Embassy of the Kingdom of God.
148
359580
3056
(Risas)
06:02
(Laughter)
149
362660
1696
¡Uy!
06:04
Oops.
150
364380
1216
06:05
(Laughter)
151
365620
3856
(Risas)
Aquí hay otro tremendo.
06:09
Here's another really bad one.
152
369500
1696
JohnEdwards.com
06:11
JohnEdwards.com
153
371220
1296
06:12
[Damn liberal]
154
372540
1216
(Texto: maldito liberal)
06:13
(Laughter)
155
373780
4496
(Risas)
Y seguimos insultando gente de izquierdas y de derechas.
06:18
So we keep on insulting people left and right everyday.
156
378300
2816
Pero no sólo son insultos.
06:21
Of course, we're not just insulting people.
157
381140
2016
Así, como presentamos pares de palabras elegidas al azar
06:23
Here's the thing. Since we're presenting two randomly chosen words,
158
383180
3176
ocurren cosas interesantes.
06:26
interesting things can happen.
159
386380
1456
06:27
So this actually has given rise to a really big Internet meme
160
387860
4616
Eso ha dado lugar
a un gran meme de Internet
06:32
that tens of thousands of people have participated in,
161
392500
2536
en el que han participado decenas de miles de personas
que se llama arte de captchas.
06:35
which is called CAPTCHA art.
162
395060
1656
06:36
I'm sure some of you have heard about it.
163
396740
1976
Estoy seguro de que muchos de Uds. lo han oído.
06:38
Here's how it works.
164
398740
1256
Funciona así.
06:40
Imagine you're using the Internet and you see a CAPTCHA
165
400020
2616
Imaginen que están usando Internet y ven un captcha
06:42
that you think is somewhat peculiar,
166
402660
1736
que les parece interesante.
06:44
like this CAPTCHA.
167
404420
1216
Como éste. (Texto: tostadora invisible)
06:45
[invisible toaster]
168
405660
1216
06:46
What you're supposed to do is you take a screenshot of it.
169
406900
2736
La idea es que capturen la pantalla.
Después tienen que ingresar el captcha
06:49
Then of course, you fill out the CAPTCHA because you help us digitize a book.
170
409660
3656
porque así nos ayudan a digitalizar libros.
Y después dibujan algo
06:53
But first you take a screenshot
171
413340
1496
06:54
and then you draw something that is related to it.
172
414860
2376
basado en este captcha.
(Risas)
06:57
(Laughter)
173
417260
1696
06:58
That's how it works.
174
418980
1216
Así funciona.
07:00
(Laughter)
175
420220
1336
07:01
There are tens of thousands of these.
176
421580
2656
Hay decenas de miles de ejemplos.
07:04
Some of them are very cute.
177
424260
2072
Algunos son muy tiernos. (Texto: ¡Gané!)
07:06
[clenched it]
178
426356
1213
(Risas)
07:07
(Laughter)
179
427593
1843
Otros son más divertidos.
07:09
Some of them are funnier.
180
429460
1536
(Texto: fundadores drogados)
07:11
[stoned Founders]
181
431020
1216
07:12
(Laughter)
182
432260
4376
(Risas)
07:16
And some of them, like paleontological shvisle ...
183
436660
3429
Y algunos
como el shvisle paleontológico
07:20
(Laughter)
184
440113
1923
tienen a Snoop Dogg.
07:22
they contain Snoop Dogg.
185
442060
1216
07:23
(Laughter)
186
443300
3136
(Risas)
07:26
OK, so this is my favorite number of reCAPTCHA.
187
446460
2576
Este es mi número favorito de recaptcha.
Esto es lo que más me gusta de todo el proyecto.
07:29
So this is the favorite thing that I like about this whole project.
188
449060
3176
Es la cantidad de personas distintas
07:32
This is the number of distinct people
189
452260
1816
que nos han ayudado a digitalizar al menos una palabra de un libro con captchas:
07:34
that have helped us digitize at least one word out of a book through reCAPTCHA:
190
454100
3736
750 millones,
07:37
750 million, a little over 10 percent of the world's population,
191
457860
3056
poco más del 10% de la población mundial
07:40
has helped us digitize human knowledge.
192
460940
1896
nos ha ayudado a digitalizar el conocimiento humano.
07:42
And it is numbers like these that motivate my research agenda.
193
462860
3096
Y son números como estos los que motivan mi programa de investigación.
07:45
So the question that motivates my research is the following:
194
465980
3056
La pregunta que motiva mi investigación es la siguiente:
si miramos los grandes logros de la humanidad,
07:49
If you look at humanity's large-scale achievements,
195
469060
2416
esos megaproyectos
07:51
these really big things
196
471500
1216
07:52
that humanity has gotten together and done historically --
197
472740
2715
que la humanidad ha hecho históricamente
07:55
like, for example, building the pyramids of Egypt
198
475479
2477
como las pirámides de Egipto,
07:57
or the Panama Canal
199
477980
1576
el Canal de Panamá,
07:59
or putting a man on the Moon --
200
479580
2056
o llevar a un hombre a la Luna;
08:01
there is a curious fact about them,
201
481660
1696
hay algo curioso en ello
08:03
and it is that they were all done with about the same number of people.
202
483380
3336
y es que todos se realizaron con más o menos la misma cantidad de personas.
Es raro, pero todos se hicieron con cerca de 100 mil personas.
08:06
It's weird; they were all done with about 100,000 people.
203
486740
2696
Y la razón es que, antes de Internet,
08:09
And the reason for that is because, before the Internet,
204
489460
2656
coordinar a más de 100 mil personas
08:12
coordinating more than 100,000 people,
205
492140
1856
aparte de pagarles, era esencialmente imposible.
08:14
let alone paying them, was essentially impossible.
206
494020
3016
Pero ahora con Internet les acabo de enseñar un proyecto
08:17
But now with the Internet, I've just shown you a project
207
497060
2656
donde hemos coordinado a 750 millones
08:19
where we've gotten 750 million people to help us digitize human knowledge.
208
499740
3496
de personas para digitalizar conocimiento.
Entonces la pregunta que motiva mi trabajo es
08:23
So the question that motivates my research is,
209
503260
2176
si podemos poner a un hombre en la Luna con 100 mil personas,
08:25
if we can put a man on the Moon with 100,000,
210
505460
2136
08:27
what can we do with 100 million?
211
507620
2176
¿Qué podemos hacer con 100 millones?
08:29
So based on this question,
212
509820
1256
Y basados en esa pregunta
08:31
we've had a lot of different projects that we've been working on.
213
511100
3056
hemos trabajado en varios proyectos.
Quiero explicar uno que me tiene entusiasmado.
08:34
Let me tell you about one that I'm most excited about.
214
514180
2536
08:36
This is something that we've been semiquietly working on
215
516740
2656
Llevamos cerca de un año y medio trabajando
silenciosamente en este proyecto.
08:39
for the last year and a half or so.
216
519420
1696
Todavía no lo lanzamos. Se llama Duolingo.
08:41
It hasn't yet been launched. It's called Duolingo.
217
521140
2376
Silencio, por favor, que aún no lo lanzamos.
08:43
Since it hasn't been launched, shhh!
218
523540
1736
(Risas)
08:45
(Laughter)
219
525300
1656
08:46
Yeah, I can trust you'll do that.
220
526980
2256
Confío en que guardarán silencio.
Este es el proyecto. Así es como empezó.
08:49
So this is the project. Here's how it started.
221
529260
2216
Todo empezó con una pregunta a mi estudiante de postgrado,
08:51
It started with me posing a question to my graduate student, Severin Hacker.
222
531500
3576
Severin Hacker.
Ese es Severin Hacker.
08:55
OK, that's Severin Hacker.
223
535100
1280
Le planteé una pregunta a mi estudiante.
08:57
So I posed the question to my graduate student.
224
537299
2217
Por cierto, oyeron bien:
08:59
By the way, you did hear me correctly; his last name is Hacker.
225
539540
2976
su apellido es Hacker.
09:02
(Laughter)
226
542540
1016
Le planteé esta pregunta:
09:03
So I posed this question to him: How can we get 100 million people
227
543580
3296
¿Cómo podemos hacer que 100 millones de personas
09:06
translating the web into every major language for free?
228
546900
2960
traduzcan la Web a los principales idiomas, gratis?
Hay varias cosas que decir acerca de esta pregunta.
09:10
There's a lot of things to say about this question.
229
550500
2416
La primera es traducir la Web.
09:12
First of all, translating the web.
230
552940
1656
Como todos sabemos, la Web está fragmentada en varios idiomas.
09:14
Right now, the web is partitioned into multiple languages.
231
554620
2796
Una gran parte está en inglés.
09:17
A large fraction of it is in English.
232
557440
1816
Si alguien no sabe inglés no puede acceder.
09:19
If you don't know English, you can't access it.
233
559280
2216
Y hay gran cantidad de contenido en otros idiomas
09:21
But there's large fractions in other different languages,
234
561520
2696
pero si alguien no sabe esos idiomas tampoco los puede consultar.
09:24
and if you don't know them, you can't access it.
235
564240
2256
Yo quisiera traducir toda la Web
09:26
So I would like to translate all of the web,
236
566520
2096
09:28
or at least most of it, into every major language.
237
568640
2376
a los principales idiomas.
Eso es lo que yo quisiera hacer.
09:31
That's what I would like to do.
238
571040
1496
09:32
Now, some of you may say, why can't we use computers to translate?
239
572560
4476
Mucha gente me podría decir por qué no usamos computadoras para hacerlo.
¿Por qué no usar traducción automática?
09:37
Machine translation is starting to translate
240
577060
2096
Últimamente las computadoras están traduciendo algunas oraciones aquí y allá.
09:39
some sentences here and there.
241
579180
1456
¿Por qué no usar eso para traducir toda la Web?
09:40
Why can't we use it to translate the web?
242
580660
1976
Las computadoras no son muy buenas para traducir.
09:42
The problem with that is it's not yet good enough
243
582660
2336
Y no van a ser muy buenas en los próximos 20 o 30 años.
09:45
and it probably won't be for the next 15 to 20 years.
244
585020
2496
Cometen muchos errores.
09:47
It makes a lot of mistakes. Even when it doesn't,
245
587540
2336
Incluso cuando no se comete un error,
09:49
since it makes so many mistakes, you don't know whether to trust it or not.
246
589900
3576
dado hay muchos errores, no se sabe si confiar o no en el resultado.
Les mostraré un ejemplo
09:53
So let me show you an example
247
593500
1416
09:54
of something that was translated with a machine.
248
594940
2256
de una traducción automática.
En realidad era el mensaje de un foro.
09:57
Actually, it was a forum post.
249
597220
1456
09:58
It was somebody who was trying to ask a question about JavaScript.
250
598700
3176
Era alguien que preguntaba algo de programación
10:01
It was translated from Japanese into English.
251
601900
2616
y fue traducido del japonés al inglés.
10:04
So I'll just let you read.
252
604540
1776
Quiero que lean esto.
10:06
This person starts apologizing
253
606340
1776
La persona empieza disculpándose
10:08
for the fact that it's translated with a computer.
254
608140
2456
por tratarse de una traducción automática.
10:10
So the next sentence is going to be the preamble to the question.
255
610620
3776
Aquí viene el preámbulo de la pregunta.
Está explicando algo.
10:14
So he's just explaining something.
256
614420
1656
Recuerden. Esto es una pregunta de programación.
10:16
Remember, it's a question about JavaScript.
257
616100
2056
10:18
[At often, the goat-time install a error is vomit.]
258
618180
2616
(Texto: A menudo, la cabra durante la instalación de un error es vomitar)
10:20
(Laughter)
259
620820
5096
(Risas)
10:25
Then comes the first part of the question.
260
625940
3536
Después viene la primera parte de la pregunta.
10:29
[How many times like the wind, a pole, and the dragon?]
261
629500
2936
(Texto: ¿Cuántas veces como el viento, un poste, y el dragón?)
10:32
(Laughter)
262
632460
4656
(Risas)
Después viene mi parte favorita de la pregunta.
10:37
Then comes my favorite part of the question.
263
637140
2056
10:39
[This insult to father's stones?]
264
639220
1936
(Texto: ¿Este insulto a las piedras de mi padre?)
10:41
(Laughter)
265
641180
3856
(Risas)
Y después viene mi parte favorita de todo el mensaje.
10:45
And then comes the ending,
266
645060
1296
10:46
which is my favorite part of the whole thing.
267
646380
2136
(Texto: Por favor, pedir disculpas por su estupidez. Hay muchos gracias)
10:48
[Please apologize for your stupidity. There are a many thank you.]
268
648540
3136
10:51
(Laughter)
269
651700
2176
(Risas)
10:53
OK, so computer translation, not yet good enough.
270
653900
2936
O sea, las traducciones automáticas no son muy buenas aún.
Volviendo a la pregunta.
10:56
So back to the question.
271
656860
1256
Necesitamos humanos para traducir la Web.
10:58
So we need people to translate the whole web.
272
658140
2976
Entonces la pregunta sería
11:01
So now the next question you may have is,
273
661140
1976
¿por qué no le pagamos a alguien para que lo haga?
11:03
well, why can't we just pay people to do this?
274
663140
2176
Le podríamos pagar a traductores profesionales.
11:05
We could pay professional translators to translate the whole web.
275
665340
3096
Podríamos hacerlo.
11:08
We could do that.
276
668460
1256
11:09
Unfortunately, it would be extremely expensive.
277
669740
2216
Por desgracia, sería extremadamente caro.
11:11
For example, translating a tiny fraction of the whole web, Wikipedia,
278
671980
3256
Por ejemplo, traducir una fracción muy, muy pequeña de toda la Web, la Wikipedia,
a otro idioma como el español,
11:15
into one other language, Spanish.
279
675260
2496
11:17
OK? Wikipedia exists in Spanish,
280
677780
1976
Wikipedia existe en español
11:19
but it's very small compared to the size of English.
281
679780
2456
pero es muy pequeña respecto de la versión en inglés;
es de un 20% del tamaño de la versión en inglés.
11:22
It's about 20 percent of the size of English.
282
682260
2176
Si quisiéramos traducir el otro 80% al español
11:24
If we wanted to translate the other 80 percent into Spanish,
283
684460
2856
costaría al menos US$ 50 millones.
11:27
it would cost at least 50 million dollars --
284
687340
2136
Y esto incluso con la mayoría de recursos subcontratados en países explotados.
11:29
and this is even at the most exploited, outsourcing country out there.
285
689500
3656
Sería muy caro.
11:33
So it would be very expensive.
286
693180
1456
Entonces queremos que 100 millones de personas
11:34
So what we want to do is, we want to get 100 million people
287
694660
2762
traduzcan la Web a los principales idiomas
11:37
translating the web into every major language for free.
288
697446
2590
gratis.
Si queremos hacerlo
11:40
If this is what you want to do, you quickly realize
289
700060
2416
nos damos cuenta de que hay dos grandes obstáculos
11:42
you're going to run into two big hurdles, two big obstacles.
290
702500
2936
para lograrlo.
11:45
The first one is a lack of bilinguals.
291
705460
3296
El primero es la falta de personas bilingües.
11:48
So I don't even know
292
708780
2176
No sé si existen
11:50
if there exists 100 million people out there using the web
293
710980
2736
100 millones de personas que usan la Web
11:53
who are bilingual enough to help us translate.
294
713740
2296
lo suficientemente bilingües para ayudarnos a traducir.
Ese es un gran problema.
11:56
That's a big problem.
295
716060
1216
11:57
The other problem you're going to run into is a lack of motivation.
296
717300
3176
El segundo problema es la falta de motivación.
¿Cómo hacer para motivar a las personas
12:00
How are we going to motivate people to actually translate the web for free?
297
720500
3536
para que traduzcan en forma gratuita?
Por lo general este trabajo se paga.
12:04
Normally, you have to pay people to do this.
298
724060
2296
12:06
So how are we going to motivate them to do it for free?
299
726380
2616
¿Cómo motivar a las personas para que lo hagan gratis?
Después de pensar en esos dos problemas durante varios meses,
12:09
When we were starting to think about this, we were blocked by these two things.
300
729020
3736
nos dimos cuenta que había una manera
12:12
But then we realized, there's a way
301
732780
1696
de resolver ambos problemas con la misma solución.
12:14
to solve both these problems with the same solution.
302
734500
2456
Es decir, matar dos pájaros de un tiro.
12:16
To kill two birds with one stone.
303
736980
1616
Y la manera es transformar la traducción de idiomas
12:18
And that is to transform language translation
304
738620
2136
12:20
into something that millions of people want to do
305
740780
2816
en algo que millones de personas quieran hacer
12:23
and that also helps with the problem of lack of bilinguals,
306
743620
3136
y que además ayude con el problema de falta de personas bilingües.
12:26
and that is language education.
307
746780
2376
Y eso es el aprendizaje de otros idiomas.
12:29
So it turns out that today,
308
749180
1976
Resulta ser que hoy en día
12:31
there are over 1.2 billion people learning a foreign language.
309
751180
3400
hay 1.200 millones de personas aprendiendo otro idioma.
La gente quiere aprender nuevos idiomas.
12:35
People really want to learn a foreign language.
310
755300
2216
Y no sólo porque los obliguen a hacerlo en el colegio.
12:37
And it's not just because they're being forced to do so in school.
311
757540
3136
En EEUU, por ejemplo,
12:40
In the US alone, there are over five million people
312
760700
2416
hay más de 5 millones de personas que han pagado más de US$ 500
12:43
who have paid over $500 for software to learn a new language.
313
763140
2896
por programas para aprender nuevos idiomas.
La gente quiere aprender nuevos idiomas.
12:46
So people really want to learn a new language.
314
766060
2176
En el último año y medio hemos trabajado en un nuevo sitio web
12:48
So what we've been working on for the last year and a half
315
768260
2736
llamado Duolingo
12:51
is a new website -- it's called Duolingo --
316
771020
2056
en el que la gente puede aprender un nuevo idioma, 100% gratis,
12:53
where the basic idea is people learn a new language for free
317
773100
2856
12:55
while simultaneously translating the web.
318
775980
2056
y al mismo tiempo, mientras aprenden, traducen la Web.
O sea, aprenden traduciendo.
12:58
And so basically, they're learning by doing.
319
778060
2536
Más precisamente
13:00
So the way this works
320
780620
1216
13:01
is whenever you're a just a beginner, we give you very simple sentences.
321
781860
3416
cuando empiecen les daremos
oraciones muy sencillas de la Web.
13:05
There's a lot of very simple sentences on the web.
322
785300
2376
Les daremos oraciones muy, muy sencillas
13:07
We give you very simple sentences along with what each word means.
323
787700
3216
y les diremos qué significa cada palabra.
13:10
And as you translate them
324
790940
1336
Y después verán cómo otras personas traducen la misma oración
13:12
and as you see how other people translate them,
325
792300
2216
y van a ir aprendiendo cómo se traduce.
13:14
you start learning the language.
326
794540
1576
Y después que usen el sitio
13:16
And as you get more advanced,
327
796140
1416
13:17
we give you more complex sentences to translate.
328
797580
2256
les vamos a ir dando oraciones más y más complejas.
13:19
But at all times, you're learning by doing.
329
799860
2016
Pero en todo momento aprenden traduciendo.
13:21
Now, the crazy thing about this method is that it actually really works.
330
801900
3696
Lo increíble de este método
es que realmente funciona.
13:25
People are really learning a language.
331
805620
1856
En primer lugar la gente aprende idiomas.
13:27
We're mostly done building it and now we're testing it.
332
807500
2616
Ya casi terminamos de construirlo y ahora lo estamos probando.
Las personas aprenden idiomas muy bien.
13:30
People really can learn a language with it.
333
810140
2056
Tan bien como con cualquier otro método informático de enseñanza de idiomas.
13:32
And they learn it about as well as the leading language learning software.
334
812220
3496
Realmente la gente aprende idiomas.
13:35
So people really do learn a language.
335
815740
1816
Pero no sólo aprenden bien
13:37
And not only do they learn it as well, but actually it's more interesting.
336
817580
3496
sino que es más interesante.
Porque con Duolingo las personas aprenden con contenido real.
13:41
Because with Duolingo, people are learning with real content.
337
821100
2896
En vez de aprender con oraciones inventadas
13:44
As opposed to learning with made-up sentences,
338
824020
2176
las personas aprenden con contenido real, que es de por sí interesante.
13:46
people are learning with real content, which is inherently interesting.
339
826220
3336
Por eso la gente aprende los idiomas.
13:49
So people really do learn a language.
340
829580
1816
Pero quizá aún más increíble,
13:51
But perhaps more surprisingly,
341
831420
1616
las traducciones que realiza la gente,
13:53
the translations that we get from people using the site,
342
833060
2736
13:55
even though they're just beginners,
343
835820
1776
incluso los principiantes,
13:57
the translations that we get
344
837620
1376
son muy buenas. Tan buenas como las traducciones profesionales.
13:59
are as accurate as those of professional language translators,
345
839020
2936
Muy sorprendente.
14:01
which is very surprising.
346
841980
1216
Les mostraré un ejemplo.
14:03
So let me show you one example.
347
843220
1536
14:04
This is a sentence that was translated from German into English.
348
844780
3016
Esta es una oración traducida del alemán al inglés.
La parte superior está en alemán.
14:07
The top is the German. The middle is an English translation
349
847820
2776
En el centro hay una traducción al inglés
14:10
that was done by a professional translator
350
850620
2256
hecha por un traductor profesional
14:12
who we paid 20 cents a word for this translation.
351
852900
2376
al que le pagamos 20 centavos por palabra.
En la parte inferior hay una traducción de usuarios de Duolingo;
14:15
And the bottom is a translation by users of Duolingo,
352
855300
2696
ninguno sabía alemán
14:18
none of whom knew any German before they started using the site.
353
858020
3736
antes de empezar a usar el sitio.
14:21
If you can see, it's pretty much perfect.
354
861780
1976
Como ven, es casi perfecta.
14:23
Of course, we play a trick here
355
863780
1536
Claro, hay un truco en esto
14:25
to make the translations as good as professional language translators.
356
865340
3336
para lograr traducciones tan buenas como las profesionales.
Combinamos las traducciones de varios principiantes
14:28
We combine the translations of multiple beginners
357
868700
2336
para obtener la calidad un traductor profesional.
14:31
to get the quality of a single professional translator.
358
871060
2896
14:33
Now, even though we're combining the translations,
359
873980
4536
Además de combinar las traducciones, en el sitio
14:38
the site actually can translate pretty fast.
360
878540
2776
podemos traducir realmente bastante rápido.
Les mostraré una estimación
14:41
So let me show you,
361
881340
1216
14:42
this is our estimates of how fast we could translate Wikipedia
362
882580
2936
de la velocidad con la que podríamos traducir la Wikipedia
del inglés al español.
14:45
from English into Spanish.
363
885540
1296
14:46
Remember, this is 50 million dollars' worth of value.
364
886860
2976
Recuerden que esta traducción vale costaría al menos US$ 50 millones.
14:49
So if we wanted to translate Wikipedia into Spanish,
365
889860
2456
Si quisiéramos traducir la Wikipedia al español
con 100 mil usuarios podríamos hacerlo en 5 semanas.
14:52
we could do it in five weeks with 100,000 active users.
366
892340
2696
Y si tuviéramos un millón de usuarios podríamos hacerlo en 80 horas.
14:55
And we could do it in about 80 hours with a million active users.
367
895060
3056
Y ya que todos mis proyectos hasta la fecha han logrado tener millones de usuarios
14:58
Since all the projects my group has worked on so far
368
898140
2456
15:00
have gotten millions of users,
369
900620
1456
esperamos poder traducir extremadamente rápido
15:02
we're hopeful that we'll be able to translate extremely fast.
370
902100
2896
con este proyecto.
Lo que más me entusiasma de Duolingo
15:05
Now, the thing that I'm most excited about with Duolingo
371
905020
2976
es que creo que brinda un buen modelo de negocio para la enseñanza de idiomas.
15:08
is I think this provides a fair business model for language education.
372
908020
3736
Hoy es así:
15:11
So here's the thing:
373
911780
1216
en el modelo de negocio de la enseñanza de idiomas
15:13
The current business model for language education
374
913020
2336
el estudiante paga
15:15
is the student pays,
375
915380
1376
15:16
and in particular, the student pays Rosetta Stone 500 dollars.
376
916780
3056
en particular, paga costaría al menos US$ 500 por Rosetta Stone.
(Risas)
15:19
(Laughter)
377
919860
1816
Ese es el modelo de negocio actual.
15:21
That's the current business model.
378
921700
1656
El problema con este modelo de negocio
15:23
The problem with this business model
379
923380
1736
es que el 95% de la población del mundo no tiene US$ 500.
15:25
is that 95 percent of the world's population doesn't have 500 dollars.
380
925140
3296
Esto es muy injusto para con los pobres.
15:28
So it's extremely unfair towards the poor.
381
928460
2776
Y totalmente orientado hacia los ricos.
15:31
This is totally biased towards the rich.
382
931260
1936
En Duolingo
15:33
Now, see, in Duolingo,
383
933220
1616
15:34
because while you learn, you're actually creating value,
384
934860
3656
dado que uno aprende
se crea valor, uno traduce material
15:38
you're translating stuff --
385
938540
1336
15:39
which, for example, we could charge somebody for translations,
386
939900
2936
y, por ejemplo, podríamos cobrar por las traducciones.
15:42
so this is how we could monetize this.
387
942860
1856
Así podríamos obtener beneficios económicos.
15:44
Since people are creating value while they're learning,
388
944740
2616
Como las personas crean valor mientras aprenden
no tienen que pagar con dinero, pagan con su tiempo.
15:47
they don't have to pay with their money, they pay with their time.
389
947380
3096
Pero lo mágico es que están pagando con su tiempo,
15:50
But the magical thing here
390
950500
1923
15:52
is that is time that would have had to have been spent anyways
391
952447
2996
un tiempo que de todos modos habrían pasado
aprendiendo el idioma.
15:55
learning the language.
392
955467
1209
15:56
So the nice thing about Duolingo
393
956700
1576
Por eso lo bueno de Duolingo es que creo que es un modelo de negocio justo
15:58
is, I think, it provides a fair business model --
394
958300
2336
que no discrimina a los pobres.
16:00
one that doesn't discriminate against poor people.
395
960660
2376
Este es el sitio. Gracias.
16:03
So here's the site. Thank you.
396
963060
1456
(Aplausos)
16:04
(Applause)
397
964540
7000
Este es el sitio.
16:13
We haven't yet launched,
398
973060
2416
Todavía no lo lanzamos
16:15
but if you go there, you can sign up to be part of our private beta,
399
975500
3296
pero si van al sitio pueden entrar a la versión beta privada
16:18
which is probably going to start in three or four weeks.
400
978820
2656
que se presentará en unas tres o cuatro semanas.
Todavía no hemos lanzado Duolingo.
16:21
We haven't yet launched it.
401
981500
1336
16:22
By the way, I'm the one talking here,
402
982860
1816
Por cierto, yo soy la cara visible
16:24
but Duolingo is the work of a really awesome team,
403
984700
2376
pero Duolingo es obra de un equipo impresionante y estos son algunos integrantes.
16:27
some of whom are here. So thank you.
404
987100
1736
Gracias.
16:28
(Applause)
405
988860
5240
(Aplausos)
Acerca de este sitio web

Este sitio le presentará vídeos de YouTube útiles para aprender inglés. Verá lecciones de inglés impartidas por profesores de primera categoría de todo el mundo. Haz doble clic en los subtítulos en inglés que aparecen en cada página de vídeo para reproducir el vídeo desde allí. Los subtítulos se desplazan en sincronía con la reproducción del vídeo. Si tiene algún comentario o petición, póngase en contacto con nosotros mediante este formulario de contacto.

https://forms.gle/WvT1wiN1qDtmnspy7