Massive-scale online collaboration | Luis von Ahn

310,873 views ・ 2011-12-06

TED


Fare doppio clic sui sottotitoli in inglese per riprodurre il video.

Traduttore: Anna Cristiana Minoli Revisore: Daniele Buratti
00:15
How many of you had to fill out a web form
0
15260
2000
Quanti di voi hanno dovuto riempire qualche tipo di modulo via web
00:17
where you've been asked to read
1
17284
1512
dove viene chiesto di leggere una sequenza distorta di caratteri come questa?
00:18
a distorted sequence of characters like this?
2
18820
2136
Quanti di voi l'hanno trovato molto, molto irritante?
00:20
How many of you found it really annoying?
3
20980
1953
Ok, notevole. L'ho inventata io.
00:22
(Laughter)
4
22957
1099
00:24
OK, outstanding. So I invented that.
5
24080
1736
(Risate)
00:25
(Laughter)
6
25840
1836
O almeno ero una delle persone che lo ha fatto.
00:27
Or I was one of the people who did it.
7
27700
1856
Quella cosa si chiama CAPTCHA.
00:29
That thing is called a CAPTCHA.
8
29580
1536
E il motivo per cui è lì è assicurarsi è che voi, l'entità che sta riempiendo il modulo,
00:31
And it is there to make sure you, the entity filling out the form,
9
31140
3136
sia realmente un essere umano e non un programma
00:34
are a human and not a computer program
10
34300
1856
scritto per inviare il modulo milioni e milioni di volte.
00:36
that was written to submit the form millions of times.
11
36180
2576
Il motivo per cui funziona è perché gli esseri umani,
00:38
The reason it works is because humans, at least non-visually-impaired humans,
12
38780
3656
almeno gli umani che non hanno problemi di vista,
non hanno problemi a leggere questi caratteri ondulati e distorti,
00:42
have no trouble reading these distorted characters,
13
42460
2416
mentre un programma di computer non lo può fare altrettanto bene.
00:44
whereas programs can't do it as well yet.
14
44900
1976
00:46
In the case of Ticketmaster,
15
46900
1496
Quindi per esempio, nel caso di Ticketmaster,
00:48
the reason you have to type these characters
16
48420
2096
il motivo per cui dovete digitare questi caratteri distorti
00:50
is to prevent scalpers from writing a program
17
50540
2136
è prevenire che i bagarini scrivano un programma
00:52
that can buy millions of tickets, two at a time.
18
52700
2256
che possa comprare milioni di biglietti, due alla volta.
00:54
CAPTCHAs are used all over the Internet.
19
54980
1936
I CAPTCHA vengono utilizzati ovunque su Internet.
00:56
And since they're used so often,
20
56940
1576
E considerato che sono utilizzati così di frequente,
00:58
a lot of times the sequence of random characters shown to the user
21
58540
3136
tante volte la sequenza precisa di caratteri casuali mostrata all'utente
non è così fortunata.
01:01
is not so fortunate.
22
61700
1216
01:02
So this is an example from the Yahoo registration page.
23
62940
2656
Questo è un esempio dalla pagina di registrazione di Yahoo.
01:05
The random characters that happened to be shown to the user
24
65620
2816
I caratteri casuali che sono capitati all'utente
sono stati A,T,T,E,N,D,I, che ovviamente scandiscono una parola.
01:08
were W, A, I, T, which, of course, spell a word.
25
68460
2696
Ma la parte migliore è il messaggio
01:11
But the best part is the message
26
71180
2096
01:13
that the Yahoo help desk got about 20 minutes later.
27
73300
2456
che il servizio clienti di Yahoo ha ricevuto 20 minuti dopo.
01:15
[Help! I've been waiting for over 20 minutes and nothing happens.]
28
75780
3136
Testo:"Aiuto! Sto aspettando da più di 20 minuti e non succede niente."
01:18
(Laughter)
29
78940
4856
(Risate)
01:23
This person thought they needed to wait.
30
83820
1905
Questa persona ha pensato di dover aspettare.
01:25
This, of course, is not as bad as this poor person.
31
85749
2407
Certo, questo poveraccio non è messo tanto bene.
01:28
(Laughter)
32
88180
2376
(Risate)
01:30
CAPTCHA Project is something that we did at Carnegie Melllon over 10 years ago,
33
90580
3736
Il progetto CAPTCHA è una cosa che abbiamo creato qui al Carnegie Mellon più di 10 anni fa,
e viene utilizzata ovunque.
01:34
and it's been used everywhere.
34
94340
1456
01:35
Let me now tell you about a project that we did a few years later,
35
95820
3136
Lasciate che ora vi racconti del progetto che abbiamo seguito qualche anno dopo,
che è l'evoluzione del CAPTCHA.
01:38
which is sort of the next evolution of CAPTCHA.
36
98980
2216
È un progetto che chiamiamo reCAPTCHA,
01:41
This is a project that we call reCAPTCHA,
37
101220
1976
ed è una cosa che abbiamo iniziato qui al Carnegie Mellon,
01:43
which is something that we started here at Carnegie Mellon,
38
103220
2776
e che poi abbiamo trasformato in startup.
01:46
then we turned it into a start-up company.
39
106020
2008
E poi circa un anno e mezzo fa,
01:48
And then about a year and a half ago, Google actually acquired this company.
40
108052
3588
Google ha acquistato la società.
Fatemi spiegare che cosa ha dato il via questo progetto.
01:51
Let me tell you what this project started.
41
111664
2007
Questo progetto nasce dalla seguente constatazione:
01:53
This project started from the following realization:
42
113695
2531
che circa 200 milioni di CAPTCHA
01:56
It turns out that approximately 200 million CAPTCHAs
43
116250
2437
vengono digitati ogni giorno dalla gente in tutto il mondo.
01:58
are typed everyday by people around the world.
44
118711
2151
02:00
When I first heard this, I was quite proud of myself.
45
120886
2484
Quando l'ho sentito, mi sono sentito fiero di me stesso.
Ho pensato, guarda che impatto ha avuto la mia ricerca.
02:03
I thought, look at the impact my research has had.
46
123394
2341
Ma poi ho cominciato a sentirmi male.
02:05
But then I started feeling bad.
47
125759
1484
Ecco perché, ogni volta che digitate un CAPTCHA,
02:07
Here's the thing: each time you type a CAPTCHA,
48
127267
2206
sostanzialmente sprecate 10 secondi del vostro tempo.
02:09
essentially, you waste 10 seconds of your time.
49
129497
2339
02:11
And if you multiply that by 200 million,
50
131860
1936
E se lo moltiplicate per 200 milioni,
02:13
you get that humanity is wasting about 500,000 hours every day
51
133820
3016
ottenete che l'umanità intera spreca circa 500 000 ore ogni giorno
02:16
typing these annoying CAPTCHAs.
52
136860
1536
a digitare questi fastidiosi CAPTCHA.
02:18
(Laughter)
53
138420
1016
Allora ho cominciato a sentirmi male.
02:19
So then I started feeling bad.
54
139460
1429
02:20
(Laughter)
55
140913
1803
(Risate)
02:22
And then I started thinking, of course, we can't just get rid of CAPTCHAs,
56
142740
3496
E poi ho cominciato a pensare, certo, non possiamo sbarazzarci dei CAPTCHA,
perché la sicurezza del Web in qualche modo ne dipende.
02:26
because the security of the web depends on them.
57
146260
2256
Ma poi ho cominciato a pensare, c'è un modo di usare questo sforzo
02:28
But then I started thinking, can we use this effort
58
148540
2416
02:30
for something that is good for humanity?
59
150980
1936
per qualcosa che sia buono per l'umanità?
02:32
So see, here's the thing.
60
152940
1496
Vedete, ecco qui.
02:34
While you're typing a CAPTCHA, during those 10 seconds,
61
154460
2616
Mentre digitate un CAPTCHA, durante questi 10 secondi,
il vostro cervello sta facendo qualcosa di straordinario.
02:37
your brain is doing something amazing.
62
157100
1856
02:38
Your brain is doing something that computers cannot yet do.
63
158980
2816
Sta facendo quello che un computer non può ancora fare.
Possiamo portarvi a fare un lavoro utile in questi 10 secondi?
02:41
So can we get you to do useful work for those 10 seconds?
64
161820
2696
Si può metterla in altro modo,
02:44
Is there some humongous problem that we cannot yet get computers to solve,
65
164540
3496
c'è qualche problema enorme che non riusciamo ancora a far risolvere ai computer,
e che possiamo spezzare in pezzetti da 10 secondi
02:48
yet we can split into tiny 10-second chunks
66
168060
2776
02:50
such that each time somebody solves a CAPTCHA,
67
170860
2176
così che ogni volta che qualcuno risolve un CAPTCHA
risolve un piccolo pezzo di questo problema?
02:53
they solve a little bit of this problem?
68
173060
1936
E la risposta è "si", ed ecco cosa stiamo facendo ora.
02:55
And the answer to that is "yes," and this is what we're doing now.
69
175020
3136
Quello che potreste non sapere è che oggi mentre digitate un CAPTCHA,
02:58
Nowadays, while you're typing a CAPTCHA,
70
178180
1936
non solo vi state identificando come essere umano,
03:00
not only are you authenticating yourself as a human,
71
180140
2429
ma oltre a questo, di fatto, ci state aiutando a digitalizzare libri.
03:02
but in addition you're helping us to digitize books.
72
182593
2443
Fatemi spiegare come funziona.
03:05
Let me explain how this works.
73
185060
1456
Ci sono tantissimi progetti che cercano di digitalizzare libri.
03:06
There's a lot of projects trying to digitize books.
74
186540
2416
Google ne segue uno. The Internet Archive ne ha uno.
03:08
Google has one. The Internet Archive has one.
75
188980
2136
Amazon, ora con il Kindle, sta cercando di digitalizzare libri.
03:11
Amazon, with the Kindle, is trying to digitize books.
76
191140
2496
Sostanzialmente funziona in questo modo:
03:13
Basically, the way this works is you start with an old book.
77
193660
3176
si comincia con un vecchio libro.
03:16
You've seen those things, right?
78
196860
1576
Avete visto queste cose, vero? Un libro?
03:18
Like a book?
79
198460
1216
(Risate)
03:19
(Laughter)
80
199700
1256
03:20
So you start with a book and then you scan it.
81
200980
2536
Cominciate con un libro, lo scannerizzate.
Scannerizzare un libro
03:23
Now, scanning a book
82
203540
1216
03:24
is like taking a digital photograph of every page.
83
204780
2376
è come scattare una foto digitale di ogni singola pagina.
Vi dà un'immagine di ogni singola pagina del libro.
03:27
It gives you an image for every page.
84
207180
1816
Questa è un'immagine con testo di ogni pagina del libro.
03:29
This is an image with text for every page of the book.
85
209020
2576
Il passo successivo del processo
03:31
The next step in the process is that the computer needs to be able
86
211620
3136
è che il computer deve essere in grado di decifrare tutte le parole in questa immagine.
03:34
to decipher the words in this image.
87
214780
1736
Lo si fa usando una tecnologia chiamata OCR,
03:36
That's using a technology called OCR, for optical character recognition,
88
216540
3416
per il riconoscimento ottico dei caratteri,
03:39
which takes a picture of text
89
219980
1416
che scatta una foto del testo
03:41
and tries to figure out what text is in there.
90
221420
2176
e cerca di decifrarlo.
03:43
Now, the problem is that OCR is not perfect.
91
223620
2656
Il problema è che l'OCR non è perfetto.
Specialmente per i libri più vecchi
03:46
Especially for older books
92
226300
1416
03:47
where the ink has faded and the pages have turned yellow,
93
227740
3136
dove l'inchiostro è sbiadito e le pagine sono ingiallite,
03:50
OCR cannot recognize a lot of the words.
94
230900
1936
l'OCR non riesce a riconoscere tante parole.
03:52
For things that were written more than 50 years ago,
95
232860
2456
Per esempio, per cose che sono state scritte più di 50 anni fa,
il computer non riesce a riconoscere circa il 30% delle parole.
03:55
the computer cannot recognize about 30 percent of the words.
96
235340
2856
Quindi quello che facciamo ora
03:58
So now we're taking all of the words that the computer cannot recognize
97
238220
3376
è prendere tutte le parole che il computer non riesce a riconoscere
04:01
and we're getting people to read them for us
98
241620
2256
e far sì che le persone le leggano per noi
04:03
while they're typing a CAPTCHA on the Internet.
99
243900
2216
mentre digitano un CAPTCHA su Internet.
Quindi la prossima volta che digitate un CAPTCHA, queste parole che state digitando
04:06
So the next time you type a CAPTCHA, these words that you're typing
100
246140
3176
sono in realtà parole che provengono da libri che sono stati digitalizzati
04:09
are actually words from books that are being digitized
101
249340
2576
04:11
that the computer could not recognize.
102
251940
1856
che il computer non è riuscito a riconoscere.
04:13
The reason we have two words nowadays instead of one
103
253820
2456
E il motivo per cui oggi ci sono due parole invece di una
è perché, sapete, una delle parole
04:16
is because one of the words
104
256300
1416
04:17
is a word that the system just got out of a book,
105
257740
2576
è una parola che il sistema ha tirato fuori da un libro,
e che non sapeva cosa fosse, e ve la sottopone.
04:20
it didn't know what it was and it's going to present it to you.
106
260340
3016
Ma siccome non sa la risposta, non può valutarla.
04:23
But since it doesn't know the answer, it cannot grade it.
107
263380
2696
Quindi quello che facciamo è assegnarvi un'altra parola,
04:26
So we give you another word,
108
266100
1376
04:27
for which the system does know the answer.
109
267500
2000
di cui il sistema conosce la risposta.
04:29
We don't tell you which one's which and we say, please type both.
110
269524
3072
Non vi diciamo quale delle due, e vi chiediamo di digitarle entrambe.
E se digitate la parola giusta
04:32
And if you type the correct word
111
272620
1575
per quella di cui il sistema conosce già la risposta,
04:34
for the one for which the system knows the answer,
112
274219
2377
suppone che siate umani,
04:36
it assumes you are human
113
276620
1256
04:37
and it also gets some confidence that you typed the other word correctly.
114
277900
3456
ed è abbastanza fiducioso che abbiate digitato l'altra parola correttamente.
E se ripetete questo processo per 10 persone diverse
04:41
And if we repeat this process to 10 different people
115
281380
2456
e tutte sono d'accordo su qual è la parola nuova,
04:43
and they agree on what the new word is,
116
283860
1896
si ottiene un'altra parola digitalizzata correttamente.
04:45
then we get one more word digitized accurately.
117
285780
2216
Quindi il sistema funziona in questo modo.
04:48
So this is how the system works.
118
288020
1576
E sostanzialmente, da quanto l'abbiamo rilasciato circa 3 o 4 anni fa,
04:49
And since we released it about three or four years ago,
119
289620
2616
tantissimi siti hanno cominciato a passare
04:52
a lot of websites have started switching from the old CAPTCHA,
120
292260
2936
dal vecchio CAPTCHA dove la gente buttava via il tempo
04:55
where people wasted their time,
121
295220
1536
al nuovo CAPTCHA dove la gente aiuta a digitalizzare libri.
04:56
to the new CAPTCHA where people are helping to digitize books.
122
296780
2936
Per esempio, Ticketmaster.
04:59
So every time you buy tickets on Ticketmaster,
123
299740
2176
Ogni volta che comprate biglietti con Ticketmaster, aiutate a digitalizzare un libro.
05:01
you help to digitize a book.
124
301940
1376
Facebook: Ogni volta che aggiungete un amico o fate un poke a qualcuno,
05:03
Facebook: Every time you add a friend or poke somebody,
125
303340
2616
aiutate a digitalizzare un libro.
05:05
you help to digitize a book.
126
305980
1376
Twitter e circa 350 000 altri sisti usano tutti reCAPTCHA.
05:07
Twitter and about 350,000 other sites are all using reCAPTCHA.
127
307380
2936
E in realtà, il numero di siti che usano reCAPTCHA è così alto
05:10
And the number of sites that are using reCAPTCHA is so high
128
310340
2816
che il numero di parole che digitalizziamo ogni giorno è davvero enorme.
05:13
that the number of words we're digitizing per day is really large.
129
313180
3136
Sono circa 100 milioni al giorno,
05:16
It's about 100 million a day,
130
316340
1416
che equivale a circa 2,5 milioni di libri all'anno.
05:17
which is the equivalent of about two and a half million books a year.
131
317780
3496
E viene tutto fatto una parola alla volta
05:21
And this is all being done one word at a time
132
321300
2136
solo grazie a persone che digitano CAPTCHA su Internet.
05:23
by just people typing CAPTCHAs on the Internet.
133
323460
2216
(Applausi)
05:25
(Applause)
134
325700
6880
05:32
Now, of course,
135
332940
1216
Ora naturalmente,
05:34
since we're doing so many words per day,
136
334180
3336
visto che facciamo così tante parole al giorno,
capitano cose divertenti.
05:37
funny things can happen.
137
337540
1256
05:38
This is especially true because now we're giving people
138
338820
2616
E questo è vero anche perché diamo alle persone
due parole inglesi casuali una accanto all'altra.
05:41
two randomly chosen English words next to each other.
139
341460
2496
Possono capitare cose divertenti.
05:43
So funny things can happen.
140
343980
1336
Per esempio, abbiamo presentato questa parola.
05:45
For example, we presented this word.
141
345340
1736
È la parola "Cristiani"; non c'è niente di sbagliato.
05:47
It's the word "Christians"; there's nothing wrong with it.
142
347100
2736
Ma se la presentate insieme ad un'altra parola casuale,
05:49
But if you present it along with another randomly chosen word,
143
349860
2936
possono capitare cose brutte.
05:52
bad things can happen.
144
352820
1336
Otteniamo questo. (Testo: cattivi cristiani)
05:54
So we get this.
145
354180
1216
05:55
[bad Christians]
146
355420
1216
Ma è anche peggio, perché il sito dove veniva mostrato
05:56
But it's even worse, because the website where we showed this
147
356660
2896
in realtà si chiamava Ambasciata del Regno di Dio.
05:59
actually happened to be called The Embassy of the Kingdom of God.
148
359580
3056
(Risate)
06:02
(Laughter)
149
362660
1696
Ops.
06:04
Oops.
150
364380
1216
06:05
(Laughter)
151
365620
3856
(Risate)
Eccone un'altro bruttissimo.
06:09
Here's another really bad one.
152
369500
1696
JohnEdwards.com
06:11
JohnEdwards.com
153
371220
1296
06:12
[Damn liberal]
154
372540
1216
(Testo: Dannato liberale)
06:13
(Laughter)
155
373780
4496
(Risate)
Continuiamo a insultare la gente a destra e a sinistra ogni giorno.
06:18
So we keep on insulting people left and right everyday.
156
378300
2816
Naturalmente, non stiamo solo insultando persone.
06:21
Of course, we're not just insulting people.
157
381140
2016
Vedete, da quando proponiamo due parole scelte casualmente,
06:23
Here's the thing. Since we're presenting two randomly chosen words,
158
383180
3176
possono capitare cose interessanti.
06:26
interesting things can happen.
159
386380
1456
06:27
So this actually has given rise to a really big Internet meme
160
387860
4616
In realtà tutto questo ha dato luogo
ad un grande fenomeno su Internet
06:32
that tens of thousands of people have participated in,
161
392500
2536
a cui hanno partecipato migliaia di persone,
che si chiama CAPTCHA art.
06:35
which is called CAPTCHA art.
162
395060
1656
06:36
I'm sure some of you have heard about it.
163
396740
1976
Sono sicuro che qualcuno di voi ne ha sentito parlare.
06:38
Here's how it works.
164
398740
1256
Ecco come funziona.
06:40
Imagine you're using the Internet and you see a CAPTCHA
165
400020
2616
Immaginate di utilizzare Internet e vedete un CAPTCHA
06:42
that you think is somewhat peculiar,
166
402660
1736
che pensate sia peculiare,
06:44
like this CAPTCHA.
167
404420
1216
come questo CAPTCHA. (Testo: tostapane invisibile)
06:45
[invisible toaster]
168
405660
1216
06:46
What you're supposed to do is you take a screenshot of it.
169
406900
2736
Tutto quello che dovete fare è catturare la schermata.
Poi naturalmente, inserite il CAPTCHA
06:49
Then of course, you fill out the CAPTCHA because you help us digitize a book.
170
409660
3656
perché ci aiutate a digitalizzare un libro.
Ma poi, prima catturate la schermata,
06:53
But first you take a screenshot
171
413340
1496
06:54
and then you draw something that is related to it.
172
414860
2376
e poi disegnate qualcosa che abbia un nesso.
(Risate)
06:57
(Laughter)
173
417260
1696
06:58
That's how it works.
174
418980
1216
Ecco come funziona.
07:00
(Laughter)
175
420220
1336
07:01
There are tens of thousands of these.
176
421580
2656
Ce ne sono decine di migliaia.
07:04
Some of them are very cute.
177
424260
2072
Qualcuno è veramente delizioso. (Testo: afferrato)
07:06
[clenched it]
178
426356
1213
(Risate)
07:07
(Laughter)
179
427593
1843
Qualcuno è divertente.
07:09
Some of them are funnier.
180
429460
1536
(Testo: fondatori impietriti)
07:11
[stoned Founders]
181
431020
1216
07:12
(Laughter)
182
432260
4376
(Risate)
07:16
And some of them, like paleontological shvisle ...
183
436660
3429
E qualcuno,
come "certezza paleontologica",
07:20
(Laughter)
184
440113
1923
contiene Snoop Dogg.
07:22
they contain Snoop Dogg.
185
442060
1216
07:23
(Laughter)
186
443300
3136
(Risate)
07:26
OK, so this is my favorite number of reCAPTCHA.
187
446460
2576
Ok, questo è il mio numero preferito di reCAPTCHA.
Questa è la cosa che preferisco di questo progetto.
07:29
So this is the favorite thing that I like about this whole project.
188
449060
3176
Questo è il numero di utenti unici
07:32
This is the number of distinct people
189
452260
1816
che hanno aiutato a digitalizzare almeno una parola di un libro con reCAPTCHA:
07:34
that have helped us digitize at least one word out of a book through reCAPTCHA:
190
454100
3736
750 milioni,
07:37
750 million, a little over 10 percent of the world's population,
191
457860
3056
che è un po' più del 10% della popolazione mondiale,
07:40
has helped us digitize human knowledge.
192
460940
1896
che ci ha aiutato a digitalizzare le conoscenze dell'uomo.
07:42
And it is numbers like these that motivate my research agenda.
193
462860
3096
E sono numeri come questi che danno la motivazione per pianificare la mia ricerca.
07:45
So the question that motivates my research is the following:
194
465980
3056
La domanda che motiva la mia ricerca è la seguente:
Se guardate le conquiste dell'umanità su larga scala,
07:49
If you look at humanity's large-scale achievements,
195
469060
2416
sono cose veramente grandi
07:51
these really big things
196
471500
1216
07:52
that humanity has gotten together and done historically --
197
472740
2715
che l'umanità ha fatto e messo insieme storicamente --
07:55
like, for example, building the pyramids of Egypt
198
475479
2477
come per esempio, costruire le piramidi d'Egitto
07:57
or the Panama Canal
199
477980
1576
o il Canale di Panama
07:59
or putting a man on the Moon --
200
479580
2056
o mandare l'uomo sulla luna --
08:01
there is a curious fact about them,
201
481660
1696
c'è un fatto curioso riguardo a queste imprese,
08:03
and it is that they were all done with about the same number of people.
202
483380
3336
cioè che sono state realizzate con circa lo stesso numero di persone.
È strano; tutte sono state fatte con circa 100 000 persone.
08:06
It's weird; they were all done with about 100,000 people.
203
486740
2696
E il motivo è che, prima di Internet,
08:09
And the reason for that is because, before the Internet,
204
489460
2656
coordinare più di 100 000 persone,
08:12
coordinating more than 100,000 people,
205
492140
1856
senza contare la remunerazione, era sostanzialmente impossibile.
08:14
let alone paying them, was essentially impossible.
206
494020
3016
Ma ora con Internet, vi ho appena mostrato un progetto
08:17
But now with the Internet, I've just shown you a project
207
497060
2656
dove abbiamo coinvolto 750 milioni di persone
08:19
where we've gotten 750 million people to help us digitize human knowledge.
208
499740
3496
per aiutare a digitalizzare la conoscenza umana.
Quindi la domanda che motiva la mia ricerca è,
08:23
So the question that motivates my research is,
209
503260
2176
se possiamo mandare l'uomo sulla luna con 100 000 persone,
08:25
if we can put a man on the Moon with 100,000,
210
505460
2136
08:27
what can we do with 100 million?
211
507620
2176
cosa possiamo fare con 100 milioni?
08:29
So based on this question,
212
509820
1256
Basandomi su questa domanda,
08:31
we've had a lot of different projects that we've been working on.
213
511100
3056
abbiamo avuto tanti progetti diversi su cui abbiamo lavorato.
Fatemi raccontare di uno dei progetti che più mi esalta.
08:34
Let me tell you about one that I'm most excited about.
214
514180
2536
08:36
This is something that we've been semiquietly working on
215
516740
2656
È una cosa su cui abbiamo lavorato silenziosamente
nell'ultimo anno e mezzo o giù di lì.
08:39
for the last year and a half or so.
216
519420
1696
Non è ancora stato lanciato. Si chiama Duolingo.
08:41
It hasn't yet been launched. It's called Duolingo.
217
521140
2376
Visto che non è ancora stato lanciato, shhhh!
08:43
Since it hasn't been launched, shhh!
218
523540
1736
(Risate)
08:45
(Laughter)
219
525300
1656
08:46
Yeah, I can trust you'll do that.
220
526980
2256
Sì, mi fido di voi.
Questo è il progetto. Ecco come è cominciato.
08:49
So this is the project. Here's how it started.
221
529260
2216
È cominciato quando ho posto una domanda a un mio studente laureando,
08:51
It started with me posing a question to my graduate student, Severin Hacker.
222
531500
3576
Severin Hacker.
Ok, questo è Severin Hacker.
08:55
OK, that's Severin Hacker.
223
535100
1280
Allora, ho fatto una domanda al mio studente.
08:57
So I posed the question to my graduate student.
224
537299
2217
A proposito, mi avete sentito bene;
08:59
By the way, you did hear me correctly; his last name is Hacker.
225
539540
2976
il suo cognome è Hacker.
09:02
(Laughter)
226
542540
1016
Allora, gli ho fatto questa domanda:
09:03
So I posed this question to him: How can we get 100 million people
227
543580
3296
Come riusciamo a portare 100 milioni di persone
09:06
translating the web into every major language for free?
228
546900
2960
a tradurre il Web in tutte le principali lingue gratuitamente?
Ok, ci sono molte cose da dire su questa domanda.
09:10
There's a lot of things to say about this question.
229
550500
2416
Prima di tutto, tradurre il Web.
09:12
First of all, translating the web.
230
552940
1656
Oggi il Web si divide in molte lingue diverse.
09:14
Right now, the web is partitioned into multiple languages.
231
554620
2796
Una larga parte è in Inglese.
09:17
A large fraction of it is in English.
232
557440
1816
Se non sapete l'Inglese, non potete accedervi.
09:19
If you don't know English, you can't access it.
233
559280
2216
Ma una larga parte è in altre lingue,
09:21
But there's large fractions in other different languages,
234
561520
2696
e se non sapete queste lingue, non potete avere accesso.
09:24
and if you don't know them, you can't access it.
235
564240
2256
Vorrei quindi tradurre tutto il Web, o almeno la maggior parte del Web,
09:26
So I would like to translate all of the web,
236
566520
2096
09:28
or at least most of it, into every major language.
237
568640
2376
in tutte le principali lingue.
Quindi questo è quello che vorrei fare.
09:31
That's what I would like to do.
238
571040
1496
09:32
Now, some of you may say, why can't we use computers to translate?
239
572560
4476
Qualcuno di voi potrebbe dire, perché non possiamo usare i computer per tradurlo?
Perché non possiamo usare la traduzione automatica?
09:37
Machine translation is starting to translate
240
577060
2096
La traduzione automatica odierna sta cominciando a tradurre alcune frasi qua e là.
09:39
some sentences here and there.
241
579180
1456
Perché non possiamo usarla per tradurre tutto il Web?
09:40
Why can't we use it to translate the web?
242
580660
1976
Il problema è che non ancora abbastanza accurata
09:42
The problem with that is it's not yet good enough
243
582660
2336
e probabilmente non lo sarà per il prossimi 15 o 20 anni.
09:45
and it probably won't be for the next 15 to 20 years.
244
585020
2496
Fa molti errori.
09:47
It makes a lot of mistakes. Even when it doesn't,
245
587540
2336
Anche quando non fa errori,
09:49
since it makes so many mistakes, you don't know whether to trust it or not.
246
589900
3576
visto che fa così tanti errori, non sai mai se fidarti o meno.
Fatemi fare un esempio
09:53
So let me show you an example
247
593500
1416
09:54
of something that was translated with a machine.
248
594940
2256
di una cosa che è stata tradotta con un computer.
In realtà è un post in un forum.
09:57
Actually, it was a forum post.
249
597220
1456
09:58
It was somebody who was trying to ask a question about JavaScript.
250
598700
3176
È qualcuno che stava cercando di chiedere una cosa su JavaScript.
10:01
It was translated from Japanese into English.
251
601900
2616
È stato tradotto dal Giapponese all'Inglese.
10:04
So I'll just let you read.
252
604540
1776
Vi lascio leggere.
10:06
This person starts apologizing
253
606340
1776
Questa persona comincia a scusarsi
10:08
for the fact that it's translated with a computer.
254
608140
2456
per il fatto che è tradotto con un computer.
10:10
So the next sentence is going to be the preamble to the question.
255
610620
3776
La frase successiva sarà il preambolo alla domanda.
Sta solo spiegando qualcosa.
10:14
So he's just explaining something.
256
614420
1656
Ricordatevi, è una domanda su JavaScript.
10:16
Remember, it's a question about JavaScript.
257
616100
2056
10:18
[At often, the goat-time install a error is vomit.]
258
618180
2616
(Testo: Spesso, il tempo-capra installa un errore è vomito).
10:20
(Laughter)
259
620820
5096
(Risate)
10:25
Then comes the first part of the question.
260
625940
3536
Poi arriva la prima parte della domanda.
10:29
[How many times like the wind, a pole, and the dragon?]
261
629500
2936
(Testo: Quante volte come il vento, un palo, e il drago?)
10:32
(Laughter)
262
632460
4656
(Risate)
Poi arriva la mia parte preferita della domanda.
10:37
Then comes my favorite part of the question.
263
637140
2056
10:39
[This insult to father's stones?]
264
639220
1936
(Testo: Questo insulto alle pietre del padre?)
10:41
(Laughter)
265
641180
3856
(Risate)
E poi arriva la fine, che è il mio pezzo preferito.
10:45
And then comes the ending,
266
645060
1296
10:46
which is my favorite part of the whole thing.
267
646380
2136
(Testo: Per favore perdonami per la tua stupidità. Ci sono molti grazie.)
10:48
[Please apologize for your stupidity. There are a many thank you.]
268
648540
3136
10:51
(Laughter)
269
651700
2176
(Risate)
10:53
OK, so computer translation, not yet good enough.
270
653900
2936
Ok, quindi la traduzione automatica, non è ancora abbastanza buona.
Tornando alla domanda.
10:56
So back to the question.
271
656860
1256
Abbiamo bisogno di persone che traducano tutto il Web.
10:58
So we need people to translate the whole web.
272
658140
2976
La prossima domanda che potreste farmi è,
11:01
So now the next question you may have is,
273
661140
1976
perché non si possono semplicemente pagare le persone per farlo?
11:03
well, why can't we just pay people to do this?
274
663140
2176
Potremmo pagare traduttori professionisti per tradurre tutto il Web.
11:05
We could pay professional translators to translate the whole web.
275
665340
3096
Potremmo farlo.
11:08
We could do that.
276
668460
1256
11:09
Unfortunately, it would be extremely expensive.
277
669740
2216
Sfortunatamente, sarebbe estremamente costoso.
11:11
For example, translating a tiny fraction of the whole web, Wikipedia,
278
671980
3256
Per esempio la traduzione di una piccolissima frazione del Web, Wikipedia,
in un'altra lingua, lo Spagnolo.
11:15
into one other language, Spanish.
279
675260
2496
11:17
OK? Wikipedia exists in Spanish,
280
677780
1976
Wikipedia esiste in Spagnolo,
11:19
but it's very small compared to the size of English.
281
679780
2456
ma è molto piccola rispetto all'Inglese.
È circa il 20% di quella inglese.
11:22
It's about 20 percent of the size of English.
282
682260
2176
Se volessimo tradurre il restante 80% in Spagnolo,
11:24
If we wanted to translate the other 80 percent into Spanish,
283
684460
2856
costerebbe almeno 50 milioni di dollari --
11:27
it would cost at least 50 million dollars --
284
687340
2136
e questo anche al costo del paese più competitivo che ci sia.
11:29
and this is even at the most exploited, outsourcing country out there.
285
689500
3656
Quindi sarebbe molto costoso.
11:33
So it would be very expensive.
286
693180
1456
Quello che vogliamo fare è portare 100 milioni di persone
11:34
So what we want to do is, we want to get 100 million people
287
694660
2762
a tradurre il Web in tutte le principali lingue
11:37
translating the web into every major language for free.
288
697446
2590
gratuitamente.
Se questo è quello che volete fare,
11:40
If this is what you want to do, you quickly realize
289
700060
2416
vi accorgete rapidamente che andrete incontro a due ostacoli,
11:42
you're going to run into two big hurdles, two big obstacles.
290
702500
2936
due grossi ostacoli.
11:45
The first one is a lack of bilinguals.
291
705460
3296
Il primo è la carenza di persone bilingui.
11:48
So I don't even know
292
708780
2176
Non so neanche
11:50
if there exists 100 million people out there using the web
293
710980
2736
se esistano 100 milioni di persone là fuori che usano il Web
11:53
who are bilingual enough to help us translate.
294
713740
2296
abbastanza bilingui da aiutarci a tradurre.
È un grosso problema.
11:56
That's a big problem.
295
716060
1216
11:57
The other problem you're going to run into is a lack of motivation.
296
717300
3176
L'altro problema con cui vi scontrerete è la mancanza di motivazione.
Come riusciremo a motivare le persone
12:00
How are we going to motivate people to actually translate the web for free?
297
720500
3536
a tradurre veramente il Web gratuitamente?
Normalmente, si pagano persone per farlo.
12:04
Normally, you have to pay people to do this.
298
724060
2296
12:06
So how are we going to motivate them to do it for free?
299
726380
2616
Come faremo a motivarle per farlo gratuitamente?
Quando abbiamo cominciato a pensarci, ci siamo bloccati a causa di queste due cose.
12:09
When we were starting to think about this, we were blocked by these two things.
300
729020
3736
Ma poi ci siamo resi conto che in realtà c'è un modo
12:12
But then we realized, there's a way
301
732780
1696
per risolvere entrambi i problemi con la stessa soluzione.
12:14
to solve both these problems with the same solution.
302
734500
2456
C'è un modo per prendere due piccioni con una fava.
12:16
To kill two birds with one stone.
303
736980
1616
Ed è trasformare la traduzione di una lingua
12:18
And that is to transform language translation
304
738620
2136
12:20
into something that millions of people want to do
305
740780
2816
in qualcosa che milioni di persone vogliono fare,
12:23
and that also helps with the problem of lack of bilinguals,
306
743620
3136
e che risolve anche il problema della carenza di bilingui,
12:26
and that is language education.
307
746780
2376
ed è l'apprendimento della lingua.
12:29
So it turns out that today,
308
749180
1976
Abbiamo scoperto che oggi
12:31
there are over 1.2 billion people learning a foreign language.
309
751180
3400
ci sono più di 1,2 miliardi di persone che imparano una lingua straniera.
La gente vuole veramente imparare una lingua straniera.
12:35
People really want to learn a foreign language.
310
755300
2216
E non solo perché sono costrette a farlo a scuola.
12:37
And it's not just because they're being forced to do so in school.
311
757540
3136
Per esempio, solo negli Stati Uniti,
12:40
In the US alone, there are over five million people
312
760700
2416
ci sono più di cinque milioni di persone che hanno pagato più di 500$
12:43
who have paid over $500 for software to learn a new language.
313
763140
2896
in software per imparare una lingua.
La gente vuole quindi davvero imparare una nuova lingua.
12:46
So people really want to learn a new language.
314
766060
2176
Quindi quello su cui abbiamo lavorato l'ultimo anno e mezzo è un nuovo sito web --
12:48
So what we've been working on for the last year and a half
315
768260
2736
si chiama Duolingo --
12:51
is a new website -- it's called Duolingo --
316
771020
2056
dove l'idea di base è che la gente impara una nuova lingua gratuitamente
12:53
where the basic idea is people learn a new language for free
317
773100
2856
12:55
while simultaneously translating the web.
318
775980
2056
mentre contemporaneamente traduce il Web.
E quindi sostanzialmente si impara facendo.
12:58
And so basically, they're learning by doing.
319
778060
2536
Funziona in questo modo,
13:00
So the way this works
320
780620
1216
13:01
is whenever you're a just a beginner, we give you very simple sentences.
321
781860
3416
se siete principianti, vi diamo delle frasi molto, molto semplici.
Ovviamente nel Web ci sono tantissime frasi semplici.
13:05
There's a lot of very simple sentences on the web.
322
785300
2376
Vi diamo frasi molto, molto semplici
13:07
We give you very simple sentences along with what each word means.
323
787700
3216
insieme al significato di ciascuna parola.
13:10
And as you translate them
324
790940
1336
E mentre le traducete e vedete come le traducono altre persone,
13:12
and as you see how other people translate them,
325
792300
2216
cominciate a imparare la lingua.
13:14
you start learning the language.
326
794540
1576
E man mano che migliorate
13:16
And as you get more advanced,
327
796140
1416
13:17
we give you more complex sentences to translate.
328
797580
2256
vi diamo frasi sempre più complesse da tradurre.
13:19
But at all times, you're learning by doing.
329
799860
2016
Ma in ogni momento, imparate facendo.
13:21
Now, the crazy thing about this method is that it actually really works.
330
801900
3696
La cosa pazzesca di questo metodo
è che funziona veramente.
13:25
People are really learning a language.
331
805620
1856
Prima di tutto, la gente impara veramente una lingua.
13:27
We're mostly done building it and now we're testing it.
332
807500
2616
Abbiamo quasi finito di costruirlo e lo stiamo testando.
La gente può veramente impararci una lingua.
13:30
People really can learn a language with it.
333
810140
2056
E la imparano bene quanto potrebbero fare con il miglior software di lingue.
13:32
And they learn it about as well as the leading language learning software.
334
812220
3496
La gente impara quindi veramente una lingua.
13:35
So people really do learn a language.
335
815740
1816
E non solo imparano,
13:37
And not only do they learn it as well, but actually it's more interesting.
336
817580
3496
ma la cosa è ancora più interessante.
Perché con Duolingo, la gente impara con contenuti reali.
13:41
Because with Duolingo, people are learning with real content.
337
821100
2896
Contrariamente all'apprendimento con frasi precostruite,
13:44
As opposed to learning with made-up sentences,
338
824020
2176
la gente impara con contenuti reali, il che è realmente interessante.
13:46
people are learning with real content, which is inherently interesting.
339
826220
3336
Quindi la gente impara veramente una lingua.
13:49
So people really do learn a language.
340
829580
1816
Ma la cosa ancora più sorprendente
13:51
But perhaps more surprisingly,
341
831420
1616
è che le traduzioni che riceviamo dalla gente che usa il sito,
13:53
the translations that we get from people using the site,
342
833060
2736
13:55
even though they're just beginners,
343
835820
1776
anche se sono solo principianti,
13:57
the translations that we get
344
837620
1376
le traduzioni che riceviamo sono accurate quanto quelle di traduttori professionisti,
13:59
are as accurate as those of professional language translators,
345
839020
2936
il che è veramente sorprendente.
14:01
which is very surprising.
346
841980
1216
Lasciate che vi mostri un esempio.
14:03
So let me show you one example.
347
843220
1536
14:04
This is a sentence that was translated from German into English.
348
844780
3016
Questa è una frase tradotta dal Tedesco all'Inglese.
In alto c'è il Tedesco.
14:07
The top is the German. The middle is an English translation
349
847820
2776
In mezzo la traduzione in Inglese
14:10
that was done by a professional translator
350
850620
2256
fatta da un traduttore inglese professionista
14:12
who we paid 20 cents a word for this translation.
351
852900
2376
che abbiamo pagato 20 centesimi a parola per la traduzione.
E in basso la traduzione degli utenti di Duolingo,
14:15
And the bottom is a translation by users of Duolingo,
352
855300
2696
nessuno dei quali sapeva il Tedesco
14:18
none of whom knew any German before they started using the site.
353
858020
3736
prima di iniziare a usare il sito.
14:21
If you can see, it's pretty much perfect.
354
861780
1976
Potete vedere, è praticamente perfetta.
14:23
Of course, we play a trick here
355
863780
1536
Ora ovviamente c'è un trucco qui
14:25
to make the translations as good as professional language translators.
356
865340
3336
per rendere le traduzioni buone quanto quelle di traduttori professionisti.
Combiniamo le traduzioni di più principianti
14:28
We combine the translations of multiple beginners
357
868700
2336
per ottenere la qualità di un singolo traduttore professionista.
14:31
to get the quality of a single professional translator.
358
871060
2896
14:33
Now, even though we're combining the translations,
359
873980
4536
Anche se stiamo combinando le traduzioni,
14:38
the site actually can translate pretty fast.
360
878540
2776
il sito in realtà può tradurre abbastanza rapidamente.
Lasciate che vi mostri,
14:41
So let me show you,
361
881340
1216
14:42
this is our estimates of how fast we could translate Wikipedia
362
882580
2936
questa è la nostra stima sulla velocità a cui potremmo tradurre Wikipedia
dall'Inglese allo Spagnolo.
14:45
from English into Spanish.
363
885540
1296
14:46
Remember, this is 50 million dollars' worth of value.
364
886860
2976
Ricordatevi, un costo di 50 milioni di dollari.
14:49
So if we wanted to translate Wikipedia into Spanish,
365
889860
2456
Quindi se volessimo tradurre Wikipedia in Spagnolo,
potremmo farlo in cinque settimane con 100 000 utenti attivi.
14:52
we could do it in five weeks with 100,000 active users.
366
892340
2696
E potremmo farlo in circa 80 ore con un milione di utenti attivi.
14:55
And we could do it in about 80 hours with a million active users.
367
895060
3056
Visto che tutti i progetti su cui ha lavorato il mio gruppo fin'ora hanno avuto milioni di utenti,
14:58
Since all the projects my group has worked on so far
368
898140
2456
15:00
have gotten millions of users,
369
900620
1456
siamo fiduciosi che saremo in grado di tradurre
15:02
we're hopeful that we'll be able to translate extremely fast.
370
902100
2896
molto rapidamente con questo progetto.
La cosa che più mi emoziona di Duolingo
15:05
Now, the thing that I'm most excited about with Duolingo
371
905020
2976
è che credo fornisca un corretto modello di business per l'apprendimento delle lingue.
15:08
is I think this provides a fair business model for language education.
372
908020
3736
Quindi ecco il punto:
15:11
So here's the thing:
373
911780
1216
Il modello di business corrente per l'apprendimento delle lingue
15:13
The current business model for language education
374
913020
2336
è che gli studenti paghino,
15:15
is the student pays,
375
915380
1376
15:16
and in particular, the student pays Rosetta Stone 500 dollars.
376
916780
3056
e in particolare, lo studente paga 500 dollari per RosettaStone.
(Risate)
15:19
(Laughter)
377
919860
1816
Questo è il modello di business corrente.
15:21
That's the current business model.
378
921700
1656
Il problema con questo modello di business
15:23
The problem with this business model
379
923380
1736
è che il 95% della popolazione mondiale non ha 500 dollari.
15:25
is that 95 percent of the world's population doesn't have 500 dollars.
380
925140
3296
Quindi è estremamente ingiusto nei confronti dei poveri.
15:28
So it's extremely unfair towards the poor.
381
928460
2776
È completamente sbilanciato a favore dei ricchi.
15:31
This is totally biased towards the rich.
382
931260
1936
Invece guardate, in Duolingo
15:33
Now, see, in Duolingo,
383
933220
1616
15:34
because while you learn, you're actually creating value,
384
934860
3656
siccome mentre imparate
di fatto create valore, state traducendo testi --
15:38
you're translating stuff --
385
938540
1336
15:39
which, for example, we could charge somebody for translations,
386
939900
2936
che per esempio, potrebbe essere assegnata a qualcuno per la traduzione.
15:42
so this is how we could monetize this.
387
942860
1856
Quindi ecco come potremmo monetizzare.
15:44
Since people are creating value while they're learning,
388
944740
2616
Visto che la gente crea valore mentre impara,
non deve pagare con denaro, bensì con il proprio tempo.
15:47
they don't have to pay with their money, they pay with their time.
389
947380
3096
Ma la magia qui è che pagano con il loro tempo,
15:50
But the magical thing here
390
950500
1923
15:52
is that is time that would have had to have been spent anyways
391
952447
2996
ma quello è tempo che avrebbero comunque dedicato
ad imparare la lingua.
15:55
learning the language.
392
955467
1209
15:56
So the nice thing about Duolingo
393
956700
1576
La cosa bella di Duolingo è che credo fornisca un modello di business equo --
15:58
is, I think, it provides a fair business model --
394
958300
2336
che non discrimina le persone povere.
16:00
one that doesn't discriminate against poor people.
395
960660
2376
Ecco qua il sito. Grazie.
16:03
So here's the site. Thank you.
396
963060
1456
(Applausi)
16:04
(Applause)
397
964540
7000
Ecco qua il sito.
16:13
We haven't yet launched,
398
973060
2416
Non l'abbiamo ancora lanciato,
16:15
but if you go there, you can sign up to be part of our private beta,
399
975500
3296
ma se volete, potete iscrivervi per fare parte della versione beta,
16:18
which is probably going to start in three or four weeks.
400
978820
2656
che partirà tra 3 o 4 settimane.
Non abbiamo ancora lanciato Duolingo.
16:21
We haven't yet launched it.
401
981500
1336
16:22
By the way, I'm the one talking here,
402
982860
1816
A proposito, io sono quello che ne parla,
16:24
but Duolingo is the work of a really awesome team,
403
984700
2376
ma in realtà Duolingo è il lavoro di un gruppo fantastico, alcuni sono qui.
16:27
some of whom are here. So thank you.
404
987100
1736
Quindi grazie.
16:28
(Applause)
405
988860
5240
(Applausi)
A proposito di questo sito web

Questo sito vi presenterà i video di YouTube utili per l'apprendimento dell'inglese. Vedrete lezioni di inglese tenute da insegnanti di alto livello provenienti da tutto il mondo. Fate doppio clic sui sottotitoli in inglese visualizzati su ogni pagina video per riprodurre il video da lì. I sottotitoli scorrono in sincronia con la riproduzione del video. Se avete commenti o richieste, contattateci tramite questo modulo di contatto.

https://forms.gle/WvT1wiN1qDtmnspy7