Inside OKCupid: The math of online dating - Christian Rudder

OKCupid : Les mathématiques des rencontres en ligne - Christian Rudder

1,238,889 views

2013-02-13 ・ TED-Ed


New videos

Inside OKCupid: The math of online dating - Christian Rudder

OKCupid : Les mathématiques des rencontres en ligne - Christian Rudder

1,238,889 views ・ 2013-02-13

TED-Ed


Veuillez double-cliquer sur les sous-titres anglais ci-dessous pour lire la vidéo.

00:00
Translator: Andrea McDonough Reviewer: Bedirhan Cinar
0
0
7000
Traducteur: Elise LECAMP Relecteur: Tatjana Jevdjic
00:17
Hello, my name is Christian Rudder,
1
17903
1714
Bonjour, je m'appelle Christian Rudder,
00:19
and I was one of the founders of OkCupid.
2
19641
2209
je suis un des fondateurs de OK Cupid.
00:21
It's now one of the biggest dating sites in the United States.
3
21874
2918
C'est désormais l'un des plus grands sites de rencontre aux États-Unis.
00:24
Like most everyone at the site, I was a math major,
4
24816
2391
Comme presque tout le monde sur le site,
j'étais doué en math et comme vous pouvez l'imaginer,
00:27
As you may expect, we're known for the analytic approach we take to love.
5
27231
3440
nous étions connus pour l'approche analytique
que nous avions de l'amour.
On appelle ça notre algorithme d'appariement.
00:30
We call it our matching algorithm.
6
30695
1638
Essentiellement, l'algorithme d'appariement d'OK Cupid
00:32
Basically, OkCupid's matching algorithm helps us decide
7
32357
2588
nous aide à décider si deux personnes peuvent sortir ensemble.
00:34
whether two people should go on a date.
8
34969
1876
00:36
We built our entire business around it.
9
36869
1872
Nous avons construit notre business dessus.
00:38
Now, algorithm is a fancy word,
10
38765
1960
Cependant, algorithme est un mot prétentieux,
00:40
and people like to drop it like it's this big thing.
11
40749
2485
les gens préfèrent le laisser tomber,
00:43
But really, an algorithm is just a systematic,
12
43258
2288
mais un algorithme est simplement une façon systématique,
00:45
step-by-step way to solve a problem.
13
45570
2223
pas à pas, de résoudre un problème.
00:47
It doesn't have to be fancy at all.
14
47817
2177
Ça n'a rien de prétentieux.
Ici, dans cette leçon, je vais vous expliquer
00:50
Here in this lesson,
15
50018
1151
00:51
I'm going to explain how we arrived at our particular algorithm,
16
51193
3008
comment on en est arrivé à notre algorithme à nous
pour que vous voyez comment ça marche.
00:54
so you can see how it's done.
17
54225
1411
00:55
Now, why are algorithms even important?
18
55660
1934
Maintenant, pourquoi est-ce que les algorithmes sont importants ?
00:57
Why does this lesson even exist?
19
57618
1580
Pourquoi est-ce que cette leçon existe ?
00:59
Well, notice one very significant phrase I used above:
20
59222
3420
Eh bien, relisez cette phrase importante que je viens de dire :
01:02
they are a step-by-step way to solve a problem,
21
62666
2339
c'est une façon de résoudre un problème pas à pas
01:05
and as you probably know, computers excel at step-by-step processes.
22
65029
3418
et, comme vous le savez probablement,
les ordinateurs excellent dans les processus pas à pas.
01:08
A computer without an algorithm
23
68471
1589
Un ordinateur sans algorithme
est simplement un couteux presse-papiers.
01:10
is basically an expensive paperweight.
24
70084
2724
01:12
And since computers are such a pervasive part of everyday life,
25
72832
2989
Depuis que les ordinateurs sont omniprésents dans notre vie quotidienne,
01:15
algorithms are everywhere.
26
75845
1547
les algorithmes sont partout.
01:18
The math behind OkCupid's matching algorithm is surprisingly simple.
27
78590
3197
Les mathématiques derrière l'algorithme d'appariement d'OK Cupid
sont étonnamment simples.
01:21
It's just some addition, multiplication, a little bit of square roots.
28
81811
4002
Ce sont juste quelques additions,
multiplications
et quelques racines carrées.
01:25
The tricky part in designing it
29
85837
1690
La difficulté lors de la conception, cependant,
01:27
was figuring out how to take something mysterious,
30
87551
2565
était de comprendre comment prendre quelque chose de mystérieux,
01:30
human attraction,
31
90140
1150
l'attirance humaine,
01:31
and break it into components that a computer can work with.
32
91314
2784
et la décomposer en éléments avec lesquels un ordinateur peut travailler.
La première chose dont nous avons besoin pour faire correspondre des gens sont des données,
01:34
The first thing we needed to match people up was data,
33
94122
2553
01:36
something for the algorithm to work with.
34
96699
1992
ce sur quoi l'algorithme puisse travailler.
01:38
The best way to get data quickly from people is to just ask for it.
35
98715
3158
La meilleure façon d'avoir rapidement des données des gens
est tout simplement de les demander.
01:41
So we decided that OkCupid should ask users questions,
36
101897
2727
Donc nous avons décidé qu'OK Cupid devait poser des questions aux utilisateurs :
01:44
stuff like, "Do you want to have kids one day?"
37
104648
2357
« Est-ce que vous voulez des enfants ? »,
« À quelle fréquence vous lavez vous les dents ? »,
01:47
"How often do you brush your teeth?"
38
107029
1758
01:48
"Do you like scary movies?"
39
108811
1392
« Est-ce que vous aimez les films d'horreur ? »
01:50
And big stuff like, "Do you believe in God?"
40
110675
2077
et des trucs importants comme « Est-ce que vous croyez en Dieu ? »
01:53
Now, a lot of the questions are good for matching like with like,
41
113843
3064
Certes, beaucoup de questions sont bonnes
pour faire correspondre ce qui est comparable,
01:56
that is, when both people answer the same way.
42
116931
2156
quand deux personnes répondent de la même manière.
01:59
For example, two people who are both into scary movies
43
119111
2548
Par exemple, deux personnes qui aiment bien les films d'horreur
02:01
are probably a better match than one person who is and one who isn't.
44
121683
3321
se correspondent probablement mieux
qu'une personne qui les aime
et une qui ne les aime pas.
02:05
But what about a question like,
45
125028
1493
Mais qu'en est-il d'une question comme,
02:06
"Do you like to be the center of attention?"
46
126545
2062
« Aimez-vous être le centre de l'attention ? »
02:08
If both people in a relationship are saying yes to this,
47
128631
2628
Si les deux personnes d'un couple répondent oui,
alors il va y avoir de gros problèmes.
02:11
they're going to have massive problems.
48
131283
2093
02:13
We realized this early on,
49
133400
1245
Nous avons compris ça rapidement
02:14
and so we decided we needed a bit more data from each question.
50
134669
3269
et nous avons décidé que nous avions besoin
d'un peu plus d'information pour chaque question.
02:17
We had to ask people to specify not only their own answer,
51
137962
2763
Nous devions demander aux personnes de donner non seulement leur réponse,
02:20
but the answer they wanted from someone else.
52
140749
2265
mais également la réponse qu'ils attendaient de l'autre.
02:23
That worked really well.
53
143038
1501
Ça a vraiment bien marché,
02:24
But we needed one more dimension.
54
144563
1604
mais nous avions besoin d'une dimension supplémentaire.
02:26
Some questions tell you more about a person than others.
55
146191
2643
Certaines questions nous en disent plus sur une personne que d'autres.
02:28
For example, a question about politics, something like,
56
148858
3395
Par exemple, une question sur la politique, quelque chose comme,
« Qu'est-ce qui est pire : brûler un livre ou brûler un drapeau ? »
02:32
"Which is worse: book burning or flag burning?"
57
152277
2288
02:34
might reveal more about someone than their taste in movies.
58
154589
2810
pourrait en révéler plus sur quelqu'un que ses goûts cinématographiques.
02:37
And it doesn't make sense to weigh all things equally,
59
157423
2619
Et ça n'a pas beaucoup de sens de donner le même poids à toutes ces choses,
nous avons donc ajouté une dernière donnée.
02:40
so we added one final data point.
60
160066
1596
02:41
For everything that OkCupid asks you,
61
161686
2024
Pour chaque question qu'OK Cupid vous pose,
02:43
you have a chance to tell us the role it plays in your life.
62
163734
2829
vous avez la possibilité de nous dire
le rôle qu'elle joue dans votre vie,
02:46
And this ranges from irrelevant to mandatory.
63
166587
2319
ça va de non significatif à obligatoire.
02:49
So now, for every question, we have three things for our algorithm:
64
169446
3222
Donc, pour chaque question,
nous avons trois choses pour notre algorithme :
02:52
first, your answer;
65
172692
1352
premièrement, votre réponse ;
02:54
second, how you want someone else -- your potential match -- to answer;
66
174617
4140
deuxièmement, comment vous souhaitez que quelqu'un,
votre partenaire potentiel,
réponde
02:58
and third, how important the question is to you at all.
67
178781
2788
et troisièmement, quelle est l'importance de cette question pour vous.
03:02
With all this information,
68
182710
1252
Avec toutes ces informations,
03:03
OkCupid can figure out how well two people will get along.
69
183986
3118
OK Cupid peut déterminer comment deux personnes s'entendront.
03:07
The algorithm crunches the numbers and gives us a result.
70
187128
3006
L'algorithme mouline les chiffres et nous donne un résultat.
Comme exemple pratique,
03:10
As a practical example,
71
190158
1152
03:11
let's look at how we'd match you with another person.
72
191334
2525
regardons comment on vous fait correspondre à quelqu'un,
03:13
Let's call him "B."
73
193883
1189
que nous appelerons "B".
Votre taux de correspondance avec B est fondé sur
03:16
Your match percentage with B is based on questions you've both answered.
74
196023
3482
les questions auxquelles vous avez répondu tous les deux.
03:19
Let's call that set of common questions "s."
75
199529
2425
Appelons la série de questions communes "s".
Comme c'est un exemple très simple, utilisons une petite série "s"
03:22
As a very simple example, we use a small set "s"
76
202559
2349
03:24
with just two questions in common,
77
204932
1641
avec seulement deux questions en commun
03:26
and compute a match from that.
78
206597
1828
et calculons la correspondance.
03:28
Here are our two example questions.
79
208449
1671
Voici nos deux exemples de questions.
03:30
The first one, let's say, is, "How messy are you?"
80
210144
2381
La première, disons, « Êtes-vous bordélique ? »,
03:32
And the answer possibilities are:
81
212549
2096
les réponses possibles sont
03:34
very messy, average and very organized.
82
214669
3361
beaucoup,
moyennement
et très organisé.
03:38
And let's say you answered "very organized,"
83
218054
2060
Disons que vous répondiez « très organisé »,
et que vous souhaitez que l'autre réponde « très organisé »,
03:40
and you'd like someone else to answer "very organized,"
84
220138
2760
03:42
and the question is very important to you.
85
222922
2256
et que cette question est très importante pour vous.
03:45
Basically, you're a neat freak.
86
225202
1492
Fondamentalement vous êtes un maniaque de la propreté.
03:46
You're neat, you want someone else to be neat, and that's it.
87
226718
2868
Vous êtes propre,
vous voulez que l'autre soit propre
et c'est comme ça.
03:49
And let's say B is a little bit different.
88
229610
2015
Supposons que B soit un peu différent.
03:51
He answered "very organized" for himself,
89
231649
2039
Il a répondu très organisé pour lui-même,
03:53
but "average" is OK with him as an answer from someone else,
90
233712
3007
mais moyennement est correct pour lui
comme réponse de l'autre,
03:56
and the question is only a little important to him.
91
236743
2402
et la question n'a pas d'importance pour lui.
Regardons la seconde question,
03:59
Let's look at the second question, from our previous example:
92
239169
2893
c'est l'une de notre exemple précédent :
« Aimez-vous être le centre de l'attention ? »
04:02
"Do you like to be the center of attention?"
93
242086
2056
Les réponses sont uniquement oui et non.
04:04
The answers are "yes" and "no."
94
244166
1514
04:05
You've answered "no," you want someone else to answer "no,"
95
245704
2995
Donc vous avez répondu « Non »,
vous attendez comme réponse de l'autre « non »,
04:08
and the question is only a little important to you.
96
248723
2391
et la question est faiblement importante pour vous.
Maintenant B a répondu « Oui »,
04:11
Now B, he's answered "yes."
97
251138
1621
04:12
He wants someone else to answer "no,"
98
252783
1776
il attend quelqu'un qui réponde « Non »,
04:14
because he wants the spotlight on him,
99
254583
2274
parce qu'il veut la lumière pour lui
04:16
and the question is somewhat important to him.
100
256881
2430
et la question est plutôt importante pour lui.
04:19
So, let's try to compute all of this.
101
259335
1999
Essayons de calculer tout ça.
04:21
Our first step is, since we use computers to do this,
102
261972
2503
Notre première étape est,
comme nous utilisons des ordinateurs,
04:24
we need to assign numerical values
103
264499
1867
nous devons assigner des valeurs numériques
04:26
to ideas like "somewhat important" and "very important,"
104
266390
2627
aux idées comme « plutôt important » et « très important »
04:29
because computers need everything in numbers.
105
269041
2211
parce que les ordinateurs ont besoin que tout soit chiffré.
04:31
We at OkCupid decided on the following scale:
106
271276
2403
Nous, à OK Cupid, avons choisi l'échelle suivante :
04:33
"Irrelevant" is worth 0.
107
273703
1946
non significatif vaut 0,
un peu important vaut 1,
04:36
"A little important" is worth 1.
108
276173
1889
04:38
"Somewhat important" is worth 10.
109
278538
1809
plutôt important vaut 10,
04:40
"Very important" is 50.
110
280831
1754
très important est 50
04:42
And "absolutely mandatory" is 250.
111
282609
3612
et obligatoire vaut 250.
04:46
Next, the algorithm makes two simple calculations.
112
286245
2631
Ensuite, l'algorithme fait deux calculs simples.
04:48
The first is: How much did B's answers satisfy you?
113
288900
3246
Le premier est « à quel niveau les réponses de B sont satisfaisantes pour vous »,
ce qui revient « à combien de points a B sur votre échelle ? »
04:52
That is, how many possible points did B score on your scale?
114
292170
3793
04:55
Well, you indicated that B's answer to the first question,
115
295987
3212
Vous avez indiqué que la réponse de B
à la première question à propos du rangement
04:59
about messiness,
116
299223
1166
était très importante pour vous.
05:00
was very important to you.
117
300413
1350
05:01
It's worth 50 points and B got that right.
118
301787
2230
Ça vaut 50 points et B les as eus.
05:04
The second question is worth only 1,
119
304375
1737
La seconde question vaut seulement 1
parce que vous avez répondu que c'était seulement un peu important
05:06
because you said it was only a little important.
120
306136
2278
et B avait répondu faux.
05:08
B got that wrong,
121
308438
1197
05:09
so B's answers were 50 out of 51 possible points.
122
309659
2782
Donc les réponses de B valent 50 points sur 51.
05:12
That's 98% satisfactory. Pretty good.
123
312465
2608
C'est 98% de satisfaction.
C'est vraiment bon.
05:15
The second question the algorithm looks at is: How much did you satisfy B?
124
315097
3949
La seconde question que regarde l'algorithme
est à quel niveau vous satisfaites B.
B a placé un point sur votre réponse
05:19
Well, B placed 1 point on your answer to the messiness question
125
319070
3259
à la question sur le rangement
05:22
and 10 on your answer to the second.
126
322353
1953
et 10 à votre réponse à la seconde.
05:24
Of those 11, that's 1 plus 10, you earned 10 --
127
324745
3387
Sur ces 11 points, c'est 1 plus 10,
vous gagnez 10,
05:28
you guys satisfied each other on the second question.
128
328156
2595
vous correspondez l'un à l'autre pour la seconde question.
05:30
So your answers were 10 out of 11 equals 91 percent satisfactory to B.
129
330775
4242
Donc vos réponses donnent 10 sur 11
ce qui vaut 91% de satisfaction pour B.
05:35
That's not bad.
130
335041
1151
Ce n'est pas mal.
05:36
The final step is to take these two match percentages
131
336216
2507
L'étape finale est de prendre les deux pourcentages de correspondances
05:38
and get one number for the both of you.
132
338747
1866
et d'obtenir un chiffre pour vous deux.
05:40
To do this, the algorithm multiplies your scores,
133
340637
2611
Pour faire ça, l'algorithme multiplie vos résultats
et prend la racine n-ième,
05:43
then takes the nth root,
134
343272
1665
05:44
where "n" is the number of questions.
135
344961
2183
où n est le nombre de questions.
Parce que s, le nombre de questions,
05:47
Because s, which is the number of questions in this sample,
136
347168
2830
dans cet exemple, est seulement 2
05:50
is only 2,
137
350022
1841
05:51
we have: match percentage equals the square root
138
351887
3665
nous avons : le pourcentage d'appariement est égal
à la racine carrée de 98% fois 91%.
05:55
of 98 percent times 91 percent.
139
355576
2896
05:58
That equals 94 percent.
140
358496
1784
Qui est égal à 94%.
06:00
That 94 percent is your match percentage with B.
141
360304
3204
Ce 94% est votre taux d'appariement avec B.
06:03
It's a mathematical expression of how happy you'd be with each other,
142
363532
3243
C'est l'expression mathématique
de comment vous seriez heureux l'un avec l'autre
06:06
based on what we know.
143
366799
1183
fondé sur ce que nous savons.
Maintenant, pourquoi est-ce que l'algorithme multiplie au lieu de
06:08
Now, why does the algorithm multiply,
144
368006
1786
06:09
as opposed to, say, average the two match scores together,
145
369816
2769
faire la moyenne des deux taux de correspondances ensemble
06:12
and do the square-root business?
146
372609
1670
puis prend la racine carrée ?
06:14
In general, this formula is called the geometric mean.
147
374303
2529
En général, cette formule est appelée la moyenne géométrique,
06:16
It's a great way to combine values that have wide ranges
148
376856
2627
c'est une bonne façon de combiner des valeurs
qui ont de grandes variations
06:19
and represent very different properties.
149
379507
1915
et présentent des propriétés très différentes.
En d'autres mots, c'est parfait pour un appariement sentimental.
06:21
In other words, it's perfect for romantic matching.
150
381446
2413
06:23
You've got wide ranges and you've got tons of different data points,
151
383883
3247
On a de grandes plages de valeurs
et des quantités de valeurs différentes,
comme je l'ai dit, au sujet des films,
06:27
like I said, about movies, politics, religion -- everything.
152
387154
3438
de la politique,
de la religion,
de tout.
06:30
Intuitively, too, this makes sense.
153
390616
1838
Intuitivement, aussi, ça a du sens.
06:32
Two people satisfying each other 50 percent
154
392478
2775
Deux personnes qui se correspondent chacune à 50%
devraient être une meilleure combinaison
06:35
should be a better match than two others who satisfy 0 and 100,
155
395277
3952
que deux autres qui se correspondent à 0 et 100,
06:39
because affection needs to be mutual.
156
399253
1814
parce que l'affection doit être mutuelle.
Après avoir ajouté une petite correction pour la marge d'erreur
06:41
After adding a little correction for margin of error,
157
401091
2491
06:43
in the case where we have a small number of questions,
158
403606
2571
dans le cas où on a très peu de questions,
comme dans l'exemple,
06:46
like we do in this example,
159
406201
1317
06:47
we're good to go.
160
407542
1172
on est prêt.
06:48
Any time OkCupid matches two people,
161
408738
1912
À chaque fois qu'OK Cupid associe deux personnes,
06:50
it goes through the steps we just outlined.
162
410674
2032
on passe par les étapes qu'on vient de montrer.
06:52
First it collects data about your answers,
163
412730
2269
En premier on collecte les données liées aux questions,
puis on compare les choix et les préférences
06:55
then it compares your choices and preferences to other people's
164
415023
2985
pour les autres personnes d'une façon mathématique, simple.
06:58
in simple, mathematical ways.
165
418032
1967
Ça, cette capacité à prendre des phénomènes réels
07:00
This, the ability to take real-world phenomena
166
420023
2923
07:02
and make them something a microchip can understand,
167
422970
2415
et à les transformer en quelque chose qu'un microprocesseur puisse comprendre,
07:05
is, I think, the most important skill anyone can have these days.
168
425409
3277
est, je pense,
la plus importante compétence que quelqu'un puisse avoir actuellement.
07:08
Like you use sentences to tell a story to a person,
169
428710
2423
De la même façon que vous utilisez des phrases pour raconter une histoire à une personne,
vous utilisez des algorithmes pour raconter une histoire à un ordinateur.
07:11
you use algorithms to tell a story to a computer.
170
431157
2484
Si vous apprenez la langue,
07:14
If you learn the language, you can go out and tell your stories.
171
434349
3033
vous pouvez sortir et raconter des histoires.
J'espère que ça vous aidera à le faire.
07:17
I hope this will help you do that.
172
437406
1753
À propos de ce site Web

Ce site vous présentera des vidéos YouTube utiles pour apprendre l'anglais. Vous verrez des leçons d'anglais dispensées par des professeurs de premier ordre du monde entier. Double-cliquez sur les sous-titres anglais affichés sur chaque page de vidéo pour lire la vidéo à partir de là. Les sous-titres défilent en synchronisation avec la lecture de la vidéo. Si vous avez des commentaires ou des demandes, veuillez nous contacter en utilisant ce formulaire de contact.

https://forms.gle/WvT1wiN1qDtmnspy7