Inside OKCupid: The math of online dating - Christian Rudder

Nei meandri di OKCupid: La matematica degli incontri online - Christian Rudder

1,237,397 views

2013-02-13 ・ TED-Ed


New videos

Inside OKCupid: The math of online dating - Christian Rudder

Nei meandri di OKCupid: La matematica degli incontri online - Christian Rudder

1,237,397 views ・ 2013-02-13

TED-Ed


Fare doppio clic sui sottotitoli in inglese per riprodurre il video.

00:00
Translator: Andrea McDonough Reviewer: Bedirhan Cinar
0
0
7000
Traduttore: Shqiponja Hoxha Revisore: Anna Cristiana Minoli
00:17
Hello, my name is Christian Rudder,
1
17903
1714
Ciao mi chiamo Christian Rudder
00:19
and I was one of the founders of OkCupid.
2
19641
2209
e sono uno dei fondatori di OK Cupid.
00:21
It's now one of the biggest dating sites in the United States.
3
21874
2918
È uno dei maggiori siti di incontri del momento negli Stai Uniti.
00:24
Like most everyone at the site, I was a math major,
4
24816
2391
Come quasi tutti al sito,
ero specializzato in matematica, e come potete immaginare
00:27
As you may expect, we're known for the analytic approach we take to love.
5
27231
3440
siamo conosciuti per l'approccio analitico
che abbiamo dato all'amore.
Noi lo chiamiamo il nostro algoritmo di compatibilità.
00:30
We call it our matching algorithm.
6
30695
1638
Sostanzialmente, l'algoritmo di compatibilità di OK Cupid
00:32
Basically, OkCupid's matching algorithm helps us decide
7
32357
2588
ci aiuta a decidere se due persone dovrebbero o meno incontrarsi.
00:34
whether two people should go on a date.
8
34969
1876
00:36
We built our entire business around it.
9
36869
1872
Ci abbiamo costruito intorno un intero business.
00:38
Now, algorithm is a fancy word,
10
38765
1960
L'algoritmo è una bella parola,
00:40
and people like to drop it like it's this big thing.
11
40749
2485
ma alla gente piace considerarlo una grande cosa,
00:43
But really, an algorithm is just a systematic,
12
43258
2288
ma, sul serio, un algoritmo è solo un modo sistematico
00:45
step-by-step way to solve a problem.
13
45570
2223
e progressivo di risolvere un problema.
00:47
It doesn't have to be fancy at all.
14
47817
2177
Non deve essere per nulla fantastico.
In questa lezione, spiegherò
00:50
Here in this lesson,
15
50018
1151
00:51
I'm going to explain how we arrived at our particular algorithm,
16
51193
3008
come arriviamo al nostro algoritmo specifico
così potrete vedere come funziona.
00:54
so you can see how it's done.
17
54225
1411
00:55
Now, why are algorithms even important?
18
55660
1934
Allora, perché gli algoritmi sono comunque importanti?
00:57
Why does this lesson even exist?
19
57618
1580
Perché questa lezione esiste?
00:59
Well, notice one very significant phrase I used above:
20
59222
3420
Notate una frase molto importante che ho utilizzato in precedenza:
01:02
they are a step-by-step way to solve a problem,
21
62666
2339
sono metodi progressivi di risolvere un problema
01:05
and as you probably know, computers excel at step-by-step processes.
22
65029
3418
e, come probabilmente sapete,
i computer eccellono nei processi passo dopo passo.
01:08
A computer without an algorithm
23
68471
1589
Un computer senza algoritmo
è sostanzialmente un fermacarte molto costoso.
01:10
is basically an expensive paperweight.
24
70084
2724
01:12
And since computers are such a pervasive part of everyday life,
25
72832
2989
ed essendo i computer così diffusi nella vita quotidiana,
01:15
algorithms are everywhere.
26
75845
1547
gli algoritmi sono ovunque.
01:18
The math behind OkCupid's matching algorithm is surprisingly simple.
27
78590
3197
La matematica dietro all'algoritmo di compatibilità di Ok Cupid
è sorprendentemente semplice.
01:21
It's just some addition, multiplication, a little bit of square roots.
28
81811
4002
Solo alcune addizioni,
moltiplicazioni,
qualche radice quadrata.
01:25
The tricky part in designing it
29
85837
1690
La parte difficile della progettazione, quindi,
01:27
was figuring out how to take something mysterious,
30
87551
2565
è capire come prendere qualcosa di misterioso,
01:30
human attraction,
31
90140
1150
l'attrazione umana,
01:31
and break it into components that a computer can work with.
32
91314
2784
e dividerla in componenti con cui un computer può lavorare.
La prima cosa di cui avevamo bisogno per confrontare le persone sono i dati,
01:34
The first thing we needed to match people up was data,
33
94122
2553
01:36
something for the algorithm to work with.
34
96699
1992
qualcosa su cui far lavorare l'algoritmo.
01:38
The best way to get data quickly from people is to just ask for it.
35
98715
3158
Il miglior modo per ricevere dati dalle perosne
è chiederli.
01:41
So we decided that OkCupid should ask users questions,
36
101897
2727
Quindi abbiamo deciso che OK Cupid avrebbe fatto domande agli utenti,
01:44
stuff like, "Do you want to have kids one day?"
37
104648
2357
cose come, "Vorresti avere figli un giorno?"
o "Con quale frequenza ti lavi i denti?",
01:47
"How often do you brush your teeth?"
38
107029
1758
01:48
"Do you like scary movies?"
39
108811
1392
"Ti piacciono i film dell'orrore?"
01:50
And big stuff like, "Do you believe in God?"
40
110675
2077
e cose importanti come "Credi in Dio?"
01:53
Now, a lot of the questions are good for matching like with like,
41
113843
3064
Molte domande sono utili
per abbinare le persone simili,
01:56
that is, when both people answer the same way.
42
116931
2156
questo succede quando entrambi rispondono allo stesso modo.
01:59
For example, two people who are both into scary movies
43
119111
2548
Ad esempio, due persone a cui piacciono gli horror
02:01
are probably a better match than one person who is and one who isn't.
44
121683
3321
probabilmente sono più compatibili
di una a cui piacciono
e una a cui non piacciono.
02:05
But what about a question like,
45
125028
1493
E invece nel caso di domande come,
02:06
"Do you like to be the center of attention?"
46
126545
2062
"Ti piace essere al centro dell'attenzione?"
02:08
If both people in a relationship are saying yes to this,
47
128631
2628
Se due persone che stanno insieme rispondono di si,
avranno grossi problemi.
02:11
they're going to have massive problems.
48
131283
2093
02:13
We realized this early on,
49
133400
1245
L'abbiamo capito subito,
02:14
and so we decided we needed a bit more data from each question.
50
134669
3269
così abbiamo deciso che avevamo bisogno
di qualche dato in più da ogni domanda.
02:17
We had to ask people to specify not only their own answer,
51
137962
2763
Dovevamo chiedere alle persone non solo la loro risposta
02:20
but the answer they wanted from someone else.
52
140749
2265
ma anche che volevano da qualcun altro.
02:23
That worked really well.
53
143038
1501
Ha funzionato molto bene,
02:24
But we needed one more dimension.
54
144563
1604
ma ci serviva un'altra dimensione.
02:26
Some questions tell you more about a person than others.
55
146191
2643
Alcune risposte ci dicono di più rispetto ad altre.
02:28
For example, a question about politics, something like,
56
148858
3395
Ad esempio una domanda sulla politica, come,
"Cosa è peggio: bruciare un libro o una bandiera?"
02:32
"Which is worse: book burning or flag burning?"
57
152277
2288
02:34
might reveal more about someone than their taste in movies.
58
154589
2810
potrebbe rivelare di più rispetto alle preferenze sui film.
02:37
And it doesn't make sense to weigh all things equally,
59
157423
2619
E non ha senso dare a tutto lo stesso peso,
così abbiamo aggiunto un ultimo punto.
02:40
so we added one final data point.
60
160066
1596
02:41
For everything that OkCupid asks you,
61
161686
2024
Per ogni cosa che OK Cupid vi chiede,
02:43
you have a chance to tell us the role it plays in your life.
62
163734
2829
potete dirci
il ruolo che ha nella vostra vita,
02:46
And this ranges from irrelevant to mandatory.
63
166587
2319
e i campi variano dall'irrilevante al fondamentale.
02:49
So now, for every question, we have three things for our algorithm:
64
169446
3222
Quindi, per ogni domanda,
abbiamo 3 elementi per il nostro algoritmo:
02:52
first, your answer;
65
172692
1352
primo, la vostra risposta;
02:54
second, how you want someone else -- your potential match -- to answer;
66
174617
4140
secondo, come vorreste che l'altro,
il vostro potenziale partner,
rispondesse;
02:58
and third, how important the question is to you at all.
67
178781
2788
e terzo, quanto questa risposta è importante per voi.
03:02
With all this information,
68
182710
1252
Con tutte queste informazioni,
03:03
OkCupid can figure out how well two people will get along.
69
183986
3118
OK Cupid può scoprire quanto due persone andranno d'accordo.
03:07
The algorithm crunches the numbers and gives us a result.
70
187128
3006
L'algoritmo elabora i numeri e ci dà un risultato.
Un esempio pratico.
03:10
As a practical example,
71
190158
1152
03:11
let's look at how we'd match you with another person.
72
191334
2525
vediamo come vi abbineremmo a un'altra persona,
03:13
Let's call him "B."
73
193883
1189
chiamiamola "B".
La vostra affinità con B è basata
03:16
Your match percentage with B is based on questions you've both answered.
74
196023
3482
sulle domande a cui entrambi avete risposto.
03:19
Let's call that set of common questions "s."
75
199529
2425
Chiamiamo quel gruppo di domande in comune "s".
Per fare un semplice esempio, useremo un piccolo gruppo "s"
03:22
As a very simple example, we use a small set "s"
76
202559
2349
03:24
with just two questions in common,
77
204932
1641
con solo 2 domande in comune
03:26
and compute a match from that.
78
206597
1828
e da li calcoleremo l'affinità.
03:28
Here are our two example questions.
79
208449
1671
Ecco due domande campione.
03:30
The first one, let's say, is, "How messy are you?"
80
210144
2381
La prima, diciamo, è "Quanto sei disordinato?"
03:32
And the answer possibilities are:
81
212549
2096
e le possibili risposte sono
03:34
very messy, average and very organized.
82
214669
3361
molto disordinato,
nella media,
molto organizzato.
03:38
And let's say you answered "very organized,"
83
218054
2060
Diciamo che rispondete "molto organizzato",
e vorreste che l'altro risponda "molto organizzato"
03:40
and you'd like someone else to answer "very organized,"
84
220138
2760
03:42
and the question is very important to you.
85
222922
2256
e la risposta per voi è molto importante.
03:45
Basically, you're a neat freak.
86
225202
1492
Siete sostanzialmente dei maniaci della pulizia.
03:46
You're neat, you want someone else to be neat, and that's it.
87
226718
2868
Siete puliti,
volete che l'altro sia pulito,
tutto qui.
03:49
And let's say B is a little bit different.
88
229610
2015
Diciamo che B è leggermente diverso.
03:51
He answered "very organized" for himself,
89
231649
2039
Ha risposto di essere molto organizzato
03:53
but "average" is OK with him as an answer from someone else,
90
233712
3007
ma per lui nella media va bene lo stesso
come risposta dell'altro
03:56
and the question is only a little important to him.
91
236743
2402
e la domanda per lui non è molto importante.
Vediamo la seconda domanda,
03:59
Let's look at the second question, from our previous example:
92
239169
2893
è di un nostro esempio precedente:
"Ti piace essere al centro dell'attenzione?"
04:02
"Do you like to be the center of attention?"
93
242086
2056
Le risposte sono solo si o no.
04:04
The answers are "yes" and "no."
94
244166
1514
04:05
You've answered "no," you want someone else to answer "no,"
95
245704
2995
Voi avete risposto di "no",
volete che l'altro risponda "no"
04:08
and the question is only a little important to you.
96
248723
2391
e la domanda per voi non è molto importante.
B ha risposto "sì",
04:11
Now B, he's answered "yes."
97
251138
1621
04:12
He wants someone else to answer "no,"
98
252783
1776
e vuole che l'altro risponda "no",
04:14
because he wants the spotlight on him,
99
254583
2274
perché vuole i riflettori puntati su di lui,
04:16
and the question is somewhat important to him.
100
256881
2430
e la domanda per lui è abbastanza importante.
04:19
So, let's try to compute all of this.
101
259335
1999
Adesso, proviamo ad elaborare tutto questo.
04:21
Our first step is, since we use computers to do this,
102
261972
2503
Il primo passo è,
siccome usiamo i computer
04:24
we need to assign numerical values
103
264499
1867
dobbiamo assegnare dei valori numerici
04:26
to ideas like "somewhat important" and "very important,"
104
266390
2627
alle idee come, "abbastanza importante" e "molto importante"
04:29
because computers need everything in numbers.
105
269041
2211
perché i computer hanno bisogno di numeri.
04:31
We at OkCupid decided on the following scale:
106
271276
2403
Noi di OK Cupid abbiamo deciso di dare i seguenti valori:
04:33
"Irrelevant" is worth 0.
107
273703
1946
irrilevante corrisponde a 0
non molto importante a 1,
04:36
"A little important" is worth 1.
108
276173
1889
04:38
"Somewhat important" is worth 10.
109
278538
1809
abbastanza importante vale 10,
04:40
"Very important" is 50.
110
280831
1754
molto importante è uguale a 50,
04:42
And "absolutely mandatory" is 250.
111
282609
3612
e fondamentale è uguale a 250.
04:46
Next, the algorithm makes two simple calculations.
112
286245
2631
In seguito, l'algoritmo fa due semplici calcoli.
04:48
The first is: How much did B's answers satisfy you?
113
288900
3246
Primo, quanto siete soddisfatti della risposta di B,
cioè, quanti punti ha segnato B sulla vostra graduatoria?
04:52
That is, how many possible points did B score on your scale?
114
292170
3793
04:55
Well, you indicated that B's answer to the first question,
115
295987
3212
Voi indicate che la risposta di B
alla prima domanda quella sul disordine
04:59
about messiness,
116
299223
1166
è molto importante per voi.
05:00
was very important to you.
117
300413
1350
05:01
It's worth 50 points and B got that right.
118
301787
2230
Vale 50 punti e B li ha guadagnati.
05:04
The second question is worth only 1,
119
304375
1737
La seconda domanda vale solo 1
perché avete detto che non è molto importante,
05:06
because you said it was only a little important.
120
306136
2278
e B ha risposto male.
05:08
B got that wrong,
121
308438
1197
05:09
so B's answers were 50 out of 51 possible points.
122
309659
2782
Quindi B ha segnato 50 punti su 51.
05:12
That's 98% satisfactory. Pretty good.
123
312465
2608
È soddisfacente al 98%.
Abbastanza buono.
05:15
The second question the algorithm looks at is: How much did you satisfy B?
124
315097
3949
La seconda domanda dell'algoritmo guarda
quanto B è soddisfatto di voi.
Allora, B ha dato 1 punto alla vostra risposta
05:19
Well, B placed 1 point on your answer to the messiness question
125
319070
3259
sulla domanda sul disordine
05:22
and 10 on your answer to the second.
126
322353
1953
e 10 alla vostra seconda risposta.
05:24
Of those 11, that's 1 plus 10, you earned 10 --
127
324745
3387
Di questi 11, ossia 1 più 10,
ne avete guadagnati 10,
05:28
you guys satisfied each other on the second question.
128
328156
2595
siete soddisfatti l'uno dell'altro sulla seconda risposta.
05:30
So your answers were 10 out of 11 equals 91 percent satisfactory to B.
129
330775
4242
Quindi le vostre risposte valgono 10 su 11
pari al 91% di soddisfazione di B.
05:35
That's not bad.
130
335041
1151
Niente male.
05:36
The final step is to take these two match percentages
131
336216
2507
Il processo finale è prendere queste due percentuali
05:38
and get one number for the both of you.
132
338747
1866
e trovare un numero per entrambi.
05:40
To do this, the algorithm multiplies your scores,
133
340637
2611
Per fare ciò, l'algoritmo moltiplica i vostri punti
poi estrae la radice n-esima,
05:43
then takes the nth root,
134
343272
1665
05:44
where "n" is the number of questions.
135
344961
2183
dove n è il numero delle domande.
Perché s, che è il numero delle domande
05:47
Because s, which is the number of questions in this sample,
136
347168
2830
in questo caso è solo 2,
05:50
is only 2,
137
350022
1841
05:51
we have: match percentage equals the square root
138
351887
3665
abbiamo percentuali di compatibilità pari
alla radice quadrata di 98% x 91%
05:55
of 98 percent times 91 percent.
139
355576
2896
05:58
That equals 94 percent.
140
358496
1784
Cioè 94%
06:00
That 94 percent is your match percentage with B.
141
360304
3204
Questo 94% è la vostra affinità con B.
06:03
It's a mathematical expression of how happy you'd be with each other,
142
363532
3243
È un' espressione matematica
di quanto sareste felici insieme
06:06
based on what we know.
143
366799
1183
basandoci su ciò che sappiamo.
Ma perché l'algoritmo moltiplica invece di, diciamo,
06:08
Now, why does the algorithm multiply,
144
368006
1786
06:09
as opposed to, say, average the two match scores together,
145
369816
2769
fare la media dei due punteggi
06:12
and do the square-root business?
146
372609
1670
e fare la radice quadrata?
06:14
In general, this formula is called the geometric mean.
147
374303
2529
Generalmente questa formula è chiamata media geometrica,
06:16
It's a great way to combine values that have wide ranges
148
376856
2627
che è un ottimo modo per combinare valori
con ampie variazioni
06:19
and represent very different properties.
149
379507
1915
e che rappresentano proprietà differenti.
In altre parole, è perfetto per l'affinità romantica.
06:21
In other words, it's perfect for romantic matching.
150
381446
2413
06:23
You've got wide ranges and you've got tons of different data points,
151
383883
3247
Avete variazioni ampie
e tanti dati differenti,
come ho dicevo, sui film,
06:27
like I said, about movies, politics, religion -- everything.
152
387154
3438
la politica,
la religione,
su tutto.
06:30
Intuitively, too, this makes sense.
153
390616
1838
Istintivamente, tutto questo ha senso.
06:32
Two people satisfying each other 50 percent
154
392478
2775
Due persone soddisfatte al 50%
dovrebbero avere una maggior compatibilità
06:35
should be a better match than two others who satisfy 0 and 100,
155
395277
3952
rispetto ad altre due soddisfatte a 0 e 100,
06:39
because affection needs to be mutual.
156
399253
1814
perché l'affetto deve essere reciproco.
Dopo aver aggiunto una correzione per i margini di errore,
06:41
After adding a little correction for margin of error,
157
401091
2491
06:43
in the case where we have a small number of questions,
158
403606
2571
nel caso di un numero limitato di domande,
come in questo esempio,
06:46
like we do in this example,
159
406201
1317
06:47
we're good to go.
160
407542
1172
siamo pronti ad partire.
06:48
Any time OkCupid matches two people,
161
408738
1912
Ogni volta che OK Cupid abbina due persone
06:50
it goes through the steps we just outlined.
162
410674
2032
segue i passaggi appena illustrati.
06:52
First it collects data about your answers,
163
412730
2269
Prima raccoglie informazioni dalle vostre risposte,
poi confronta le vostre scelte e preferenze
06:55
then it compares your choices and preferences to other people's
164
415023
2985
con quelle di altri con semplici metodi matematici.
06:58
in simple, mathematical ways.
165
418032
1967
Questo capacità di prendere fenomeni del mondo reale
07:00
This, the ability to take real-world phenomena
166
420023
2923
07:02
and make them something a microchip can understand,
167
422970
2415
e trasformarli in qualcosa di comprensibile per un microchip
07:05
is, I think, the most important skill anyone can have these days.
168
425409
3277
è, credo,
la più grande abilità che si possa pssedere al giorno d'oggi.
07:08
Like you use sentences to tell a story to a person,
169
428710
2423
Come voi usate frasi per raccontare una storia a qualcuno,
si possono usare algoritmi per raccontare una storia ad un computer.
07:11
you use algorithms to tell a story to a computer.
170
431157
2484
Se ne imparate il linguaggio
07:14
If you learn the language, you can go out and tell your stories.
171
434349
3033
potete raccontare in giro la vostra storia.
Spero che questo vi aiuti a farlo.
07:17
I hope this will help you do that.
172
437406
1753
A proposito di questo sito web

Questo sito vi presenterà i video di YouTube utili per l'apprendimento dell'inglese. Vedrete lezioni di inglese tenute da insegnanti di alto livello provenienti da tutto il mondo. Fate doppio clic sui sottotitoli in inglese visualizzati su ogni pagina video per riprodurre il video da lì. I sottotitoli scorrono in sincronia con la riproduzione del video. Se avete commenti o richieste, contattateci tramite questo modulo di contatto.

https://forms.gle/WvT1wiN1qDtmnspy7