Inside OKCupid: The math of online dating - Christian Rudder

OKCupid por dentro: Las matemáticas de las citas en línea - Christian Rudder

1,237,397 views

2013-02-13 ・ TED-Ed


New videos

Inside OKCupid: The math of online dating - Christian Rudder

OKCupid por dentro: Las matemáticas de las citas en línea - Christian Rudder

1,237,397 views ・ 2013-02-13

TED-Ed


Haga doble clic en los subtítulos en inglés para reproducir el vídeo.

00:00
Translator: Andrea McDonough Reviewer: Bedirhan Cinar
0
0
7000
Traductor: Emma Gon Revisor: Sebastian Betti
00:17
Hello, my name is Christian Rudder,
1
17903
1714
Hola, soy Christian Rudder
00:19
and I was one of the founders of OkCupid.
2
19641
2209
y fui uno de los fundadores de OK Cupid.
00:21
It's now one of the biggest dating sites in the United States.
3
21874
2918
Hoy es uno de los sitios de citas más grande de Estados Unidos.
00:24
Like most everyone at the site, I was a math major,
4
24816
2391
Como casi todos en el sitio,
tenía un título en matemáticas y, como era de esperar,
00:27
As you may expect, we're known for the analytic approach we take to love.
5
27231
3440
éramos conocidos por el enfoque analítico
que tenemos del amor.
Le llamamos el algoritmo de compatibilidad.
00:30
We call it our matching algorithm.
6
30695
1638
En esencia el algoritmo de compatibilidad de OK Cupid
00:32
Basically, OkCupid's matching algorithm helps us decide
7
32357
2588
nos ayuda a decidir si dos personas debieran tener una cita.
00:34
whether two people should go on a date.
8
34969
1876
00:36
We built our entire business around it.
9
36869
1872
Sobre esa base construimos todo nuestro negocio.
00:38
Now, algorithm is a fancy word,
10
38765
1960
Ahora, algoritmo es una palabra pomposa
00:40
and people like to drop it like it's this big thing.
11
40749
2485
y la gente tiende a ignorarla por ampulosa,
00:43
But really, an algorithm is just a systematic,
12
43258
2288
pero en realidad, un algoritmo es solo una forma sistemática
00:45
step-by-step way to solve a problem.
13
45570
2223
de resolver problemas paso a paso.
00:47
It doesn't have to be fancy at all.
14
47817
2177
No tiene que ser nada pomposo.
Aquí en esta lección, explicaré
00:50
Here in this lesson,
15
50018
1151
00:51
I'm going to explain how we arrived at our particular algorithm,
16
51193
3008
cómo concebimos nuestro algoritmo,
así lo podrás entender.
00:54
so you can see how it's done.
17
54225
1411
00:55
Now, why are algorithms even important?
18
55660
1934
Ahora, ¿por qué son importantes los algoritmos?
00:57
Why does this lesson even exist?
19
57618
1580
¿Para qué existe esta lección?
00:59
Well, notice one very significant phrase I used above:
20
59222
3420
Bueno, nota una frase muy significativa que usé arriba:
01:02
they are a step-by-step way to solve a problem,
21
62666
2339
una forma de resolver problemas paso a paso,
01:05
and as you probably know, computers excel at step-by-step processes.
22
65029
3418
y como probablemente sepas,
las computadoras se lucen en los procesos paso a paso.
01:08
A computer without an algorithm
23
68471
1589
Una computadora sin un algoritmo
es en esencia un pisapapeles caro.
01:10
is basically an expensive paperweight.
24
70084
2724
01:12
And since computers are such a pervasive part of everyday life,
25
72832
2989
Y dado que las computadoras son una parte tan dominante de la vida cotidiana,
01:15
algorithms are everywhere.
26
75845
1547
los algoritmos están dondequiera.
01:18
The math behind OkCupid's matching algorithm is surprisingly simple.
27
78590
3197
La matemática subyacente al algoritmo de compatibilidad de OK Cupid
es sorprendentemente sencilla.
01:21
It's just some addition, multiplication, a little bit of square roots.
28
81811
4002
Son solo unas sumas,
multiplicaciones,
y unas cuantas raíces cuadradas.
01:25
The tricky part in designing it
29
85837
1690
Aunque el truco de diseño estaba
01:27
was figuring out how to take something mysterious,
30
87551
2565
en averiguar cómo tomar algo tan misterioso,
01:30
human attraction,
31
90140
1150
como la atracción humana,
01:31
and break it into components that a computer can work with.
32
91314
2784
y separarlo en sus componentes para que una computadora pueda trabajar con ellos.
Bueno, lo primero que necesitamos para aparejar personas son datos,
01:34
The first thing we needed to match people up was data,
33
94122
2553
01:36
something for the algorithm to work with.
34
96699
1992
algo que el algoritmo necesita.
01:38
The best way to get data quickly from people is to just ask for it.
35
98715
3158
El mejor modo de conseguir datos de la gente
es simplemente preguntando.
01:41
So we decided that OkCupid should ask users questions,
36
101897
2727
Así, decidimos que OK Cupid debería preguntar a los usuarios
01:44
stuff like, "Do you want to have kids one day?"
37
104648
2357
cosas como, "¿quieres tener hijos algún día?"
y "¿con qué frecuencia te cepillas los dientes?",
01:47
"How often do you brush your teeth?"
38
107029
1758
01:48
"Do you like scary movies?"
39
108811
1392
"¿te gustan las películas de terror?",
01:50
And big stuff like, "Do you believe in God?"
40
110675
2077
y grandes temas como: "¿Crees en Dios?"
01:53
Now, a lot of the questions are good for matching like with like,
41
113843
3064
Ahora, muchas de las preguntas son buenas
para aparear entre iguales,
01:56
that is, when both people answer the same way.
42
116931
2156
es decir cuando ambas personas contestan igual.
01:59
For example, two people who are both into scary movies
43
119111
2548
Por ejemplo, dos personas a las que les gustan las películas de terror
02:01
are probably a better match than one person who is and one who isn't.
44
121683
3321
probablemente hacen mejor pareja
que una persona que le gusta
y otra que no.
02:05
But what about a question like,
45
125028
1493
Pero qué pasa con una pregunta como,
02:06
"Do you like to be the center of attention?"
46
126545
2062
"¿te gusta ser el centro de atención?"
02:08
If both people in a relationship are saying yes to this,
47
128631
2628
Si ambos en una relación dicen que sí,
entonces tendremos problemas grandes.
02:11
they're going to have massive problems.
48
131283
2093
02:13
We realized this early on,
49
133400
1245
Pronto nos dimos cuenta de esto,
02:14
and so we decided we needed a bit more data from each question.
50
134669
3269
así que decidimos que necesitábamos
un poco más de datos para cada pregunta.
02:17
We had to ask people to specify not only their own answer,
51
137962
2763
Teníamos que pedir que especificaran no solo su propia respuesta,
02:20
but the answer they wanted from someone else.
52
140749
2265
sino la respuesta que querían del otro.
02:23
That worked really well.
53
143038
1501
Eso funcionó muy bien,
02:24
But we needed one more dimension.
54
144563
1604
pero necesitamos una dimensión más.
02:26
Some questions tell you more about a person than others.
55
146191
2643
Algunas preguntas dicen más de una persona que otras.
02:28
For example, a question about politics, something like,
56
148858
3395
Por ejemplo, una pregunta de política, algo como,
"¿qué es peor: quemar un libro o una bandera?",
02:32
"Which is worse: book burning or flag burning?"
57
152277
2288
02:34
might reveal more about someone than their taste in movies.
58
154589
2810
puede revelar más de alguien que su gusto fílmico.
02:37
And it doesn't make sense to weigh all things equally,
59
157423
2619
Y no tiene sentido ponderar todo por igual,
así que sumamos un punto final de datos.
02:40
so we added one final data point.
60
160066
1596
02:41
For everything that OkCupid asks you,
61
161686
2024
Por cada cosa que pregunta OK Cupid,
02:43
you have a chance to tell us the role it plays in your life.
62
163734
2829
tienen una oportunidad de decirnos
el rol que juega en sus vidas,
02:46
And this ranges from irrelevant to mandatory.
63
166587
2319
y esto varía desde lo irrelevante a lo obligatorio.
02:49
So now, for every question, we have three things for our algorithm:
64
169446
3222
Ahora pues, por cada pregunta,
tenemos tres cosas para nuestro algoritmo:
02:52
first, your answer;
65
172692
1352
primero, tu respuesta;
02:54
second, how you want someone else -- your potential match -- to answer;
66
174617
4140
segundo, cómo quieres que el otro,
tu pareja potencial,
responda;
02:58
and third, how important the question is to you at all.
67
178781
2788
y tercero, qué tan importante es la pregunta para ti.
03:02
With all this information,
68
182710
1252
Con toda esta información,
03:03
OkCupid can figure out how well two people will get along.
69
183986
3118
OO Cupid puede averiguar qué tan bien se llevarán dos personas.
03:07
The algorithm crunches the numbers and gives us a result.
70
187128
3006
El algoritmo desmenuza los números y les da un resultado.
Como un ejemplo práctico,
03:10
As a practical example,
71
190158
1152
03:11
let's look at how we'd match you with another person.
72
191334
2525
veamos cómo te apareamos con otra persona,
03:13
Let's call him "B."
73
193883
1189
que llamaremos "B".
Tu porcentaje de compatibilidad con B se basa en
03:16
Your match percentage with B is based on questions you've both answered.
74
196023
3482
preguntas que ambos respondieron.
03:19
Let's call that set of common questions "s."
75
199529
2425
Que llamaremos el conjunto de preguntas comunes, "s".
Como un ejemplo muy sencillo, usaremos un conjunto pequeño "s"
03:22
As a very simple example, we use a small set "s"
76
202559
2349
03:24
with just two questions in common,
77
204932
1641
con solo dos preguntas en común
03:26
and compute a match from that.
78
206597
1828
y calcularemos de eso, una pareja.
03:28
Here are our two example questions.
79
208449
1671
He aquí nuestros dos preguntas ejemplo.
03:30
The first one, let's say, is, "How messy are you?"
80
210144
2381
La primera, digamos, "¿qué tan desordenado eres?"
03:32
And the answer possibilities are:
81
212549
2096
y las posibles respuestas son:
03:34
very messy, average and very organized.
82
214669
3361
muy desordenado,
promedio
y muy ordenado.
03:38
And let's say you answered "very organized,"
83
218054
2060
Digamos que contestas "muy ordenado",
y quisieras a alguien que conteste, "muy ordenado",
03:40
and you'd like someone else to answer "very organized,"
84
220138
2760
03:42
and the question is very important to you.
85
222922
2256
y la preguntas es muy importante para ti.
03:45
Basically, you're a neat freak.
86
225202
1492
En suma tienes manía por el orden.
03:46
You're neat, you want someone else to be neat, and that's it.
87
226718
2868
Eres ordenada,
quieres a alguien ordenado,
sin más.
03:49
And let's say B is a little bit different.
88
229610
2015
Digamos que B es un poquito diferente.
03:51
He answered "very organized" for himself,
89
231649
2039
Responde que es muy ordenado consigo mismo
03:53
but "average" is OK with him as an answer from someone else,
90
233712
3007
pero promedio le parece bien
como respuesta del otro.
03:56
and the question is only a little important to him.
91
236743
2402
Y la pregunta le es poco relevante.
Miremos la segunda pregunta,
03:59
Let's look at the second question, from our previous example:
92
239169
2893
es la del ejemplo anterior:
"¿te gusta ser el centro de atención?"
04:02
"Do you like to be the center of attention?"
93
242086
2056
Las respuestas son sí y no.
04:04
The answers are "yes" and "no."
94
244166
1514
04:05
You've answered "no," you want someone else to answer "no,"
95
245704
2995
Ahora si contestas "no",
cómo quieres que sea el "no" del otro.
04:08
and the question is only a little important to you.
96
248723
2391
Y la pregunta tiene poca relevancia para ti.
Ahora B, contesta "sí",
04:11
Now B, he's answered "yes."
97
251138
1621
04:12
He wants someone else to answer "no,"
98
252783
1776
quiere a alguien que conteste "no",
04:14
because he wants the spotlight on him,
99
254583
2274
porque quiere destacarse,
04:16
and the question is somewhat important to him.
100
256881
2430
y la pregunta le es relevante.
04:19
So, let's try to compute all of this.
101
259335
1999
Intentemos calcular todo esto.
04:21
Our first step is, since we use computers to do this,
102
261972
2503
Nuestro primer paso es,
dado que usamos computadoras,
04:24
we need to assign numerical values
103
264499
1867
necesitamos asignar valores numéricos
04:26
to ideas like "somewhat important" and "very important,"
104
266390
2627
a ideas como "algo importante" y "muy importante"
04:29
because computers need everything in numbers.
105
269041
2211
porque las computadoras necesitan todo en números.
04:31
We at OkCupid decided on the following scale:
106
271276
2403
Nosotros en OK Cupid elegimos la siguiente escala:
04:33
"Irrelevant" is worth 0.
107
273703
1946
irrelevante equivale a 0,
un poco importante equivale a 1,
04:36
"A little important" is worth 1.
108
276173
1889
04:38
"Somewhat important" is worth 10.
109
278538
1809
algo importante equivale a 10,
04:40
"Very important" is 50.
110
280831
1754
muy importante equivale a 50,
04:42
And "absolutely mandatory" is 250.
111
282609
3612
y es absolutamente obligatorio a 250.
04:46
Next, the algorithm makes two simple calculations.
112
286245
2631
Siguiente paso, el algoritmo hace dos simples cálculos.
04:48
The first is: How much did B's answers satisfy you?
113
288900
3246
El primero es qué tanto te gustaron las respuestas de B,
esto es, ¿cuántos puntos posibles obtuvo B en tu escala?
04:52
That is, how many possible points did B score on your scale?
114
292170
3793
04:55
Well, you indicated that B's answer to the first question,
115
295987
3212
Bueno, tú indicaste que la respuesta de B
a la primera pregunta sobre el desorden
04:59
about messiness,
116
299223
1166
era muy importante para ti.
05:00
was very important to you.
117
300413
1350
05:01
It's worth 50 points and B got that right.
118
301787
2230
Lo que equivale a 50 puntos y B acertó.
05:04
The second question is worth only 1,
119
304375
1737
La segunda pregunta equivale solo a 1
porque dijiste que era solo poco relevante,
05:06
because you said it was only a little important.
120
306136
2278
y B la tiene mal.
05:08
B got that wrong,
121
308438
1197
05:09
so B's answers were 50 out of 51 possible points.
122
309659
2782
Así, las respuestas de B fueron 50 de 51 puntos posibles.
05:12
That's 98% satisfactory. Pretty good.
123
312465
2608
Esto es 98 % satisfactorio,
lo cual es bastante bueno.
05:15
The second question the algorithm looks at is: How much did you satisfy B?
124
315097
3949
Y la segunda pregunta del algoritmo ve
qué tanto le satisfaces a B.
Bueno, B te dio 1 punto en tu respuesta
05:19
Well, B placed 1 point on your answer to the messiness question
125
319070
3259
a la pregunta del desorden
05:22
and 10 on your answer to the second.
126
322353
1953
y 10 en la respuesta a la segunda.
05:24
Of those 11, that's 1 plus 10, you earned 10 --
127
324745
3387
De esos 11, es decir 1 más 10,
te ganaste 10,
05:28
you guys satisfied each other on the second question.
128
328156
2595
de la segunda pregunta ambos están satisfechos entre sí.
05:30
So your answers were 10 out of 11 equals 91 percent satisfactory to B.
129
330775
4242
Entonces sus respuestas fueron 10 de 11
que equivale al 91% de satisfacción para B.
05:35
That's not bad.
130
335041
1151
No está mal.
05:36
The final step is to take these two match percentages
131
336216
2507
El paso final es tomar estos dos porcentajes de compatibilidad
05:38
and get one number for the both of you.
132
338747
1866
y obtener un número para ambos.
05:40
To do this, the algorithm multiplies your scores,
133
340637
2611
Para hacer esto, el algoritmo multiplica sus resultados,
hace la raíz de n,
05:43
then takes the nth root,
134
343272
1665
05:44
where "n" is the number of questions.
135
344961
2183
donde n es el número de preguntas.
Dado que s, es el número de preguntas,
05:47
Because s, which is the number of questions in this sample,
136
347168
2830
en este ejemplo, es solamente 2,
05:50
is only 2,
137
350022
1841
05:51
we have: match percentage equals the square root
138
351887
3665
tenemos porcentajes de compatibilidad que equivalen
a la raíz cuadrada de 98 % por 91 %,
05:55
of 98 percent times 91 percent.
139
355576
2896
05:58
That equals 94 percent.
140
358496
1784
que equivale a 94 %.
06:00
That 94 percent is your match percentage with B.
141
360304
3204
Este 94 % es tu porcentaje de compatibilidad con B.
06:03
It's a mathematical expression of how happy you'd be with each other,
142
363532
3243
Es una expresión matemática
de qué tan feliz serían entre sí
06:06
based on what we know.
143
366799
1183
con base a lo que sabemos.
Ahora bien, ¿por qué el algoritmo se multiplica opuesto a, digamos,
06:08
Now, why does the algorithm multiply,
144
368006
1786
06:09
as opposed to, say, average the two match scores together,
145
369816
2769
el promedio de los dos resultados de compatibilidad juntos
06:12
and do the square-root business?
146
372609
1670
y por qué la raíz cuadrada?
06:14
In general, this formula is called the geometric mean.
147
374303
2529
En general, esta fórmula se llama media geométrica,
06:16
It's a great way to combine values that have wide ranges
148
376856
2627
que es un gran camino para combinar valores
que tienen rangos amplios
06:19
and represent very different properties.
149
379507
1915
y representan propiedades muy diferentes.
Es decir, es perfecto para relaciones románticas.
06:21
In other words, it's perfect for romantic matching.
150
381446
2413
06:23
You've got wide ranges and you've got tons of different data points,
151
383883
3247
Tenemos rangos amplios
y tenemos toneladas de datos diferentes,
como dije, de películas,
06:27
like I said, about movies, politics, religion -- everything.
152
387154
3438
de política,
de religión,
de todo.
06:30
Intuitively, too, this makes sense.
153
390616
1838
Intuitivamente, a su vez, tiene sentido.
06:32
Two people satisfying each other 50 percent
154
392478
2775
Dos personas que se satisfecen en 50 % a la otra
debieran ser una mejor pareja
06:35
should be a better match than two others who satisfy 0 and 100,
155
395277
3952
que otros dos que se satisfacen entre 0 y 100,
06:39
because affection needs to be mutual.
156
399253
1814
porque el afecto necesita ser mutuo.
Pero sumando una pequeña corrección de margen de error,
06:41
After adding a little correction for margin of error,
157
401091
2491
06:43
in the case where we have a small number of questions,
158
403606
2571
en el caso que haya una pequeña cantidad de preguntas,
como hicimos en este ejemplo,
06:46
like we do in this example,
159
406201
1317
06:47
we're good to go.
160
407542
1172
estamos listos para salir.
06:48
Any time OkCupid matches two people,
161
408738
1912
Cada vez que OK Cupid junta a dos personas,
06:50
it goes through the steps we just outlined.
162
410674
2032
prosigue con los pasos que acabamos de esbozar.
06:52
First it collects data about your answers,
163
412730
2269
Primero se recolectan los datos de sus respuestas,
luego se comparan sus elecciones y preferencias
06:55
then it compares your choices and preferences to other people's
164
415023
2985
con las de otros en modo simple y matemático.
06:58
in simple, mathematical ways.
165
418032
1967
Esto, la habilidad de tomar fenómenos del mundo real
07:00
This, the ability to take real-world phenomena
166
420023
2923
07:02
and make them something a microchip can understand,
167
422970
2415
y hacer que un microchip los pueda entender,
07:05
is, I think, the most important skill anyone can have these days.
168
425409
3277
es, creo,
la destreza más importante que uno puede tener en la actualidad.
07:08
Like you use sentences to tell a story to a person,
169
428710
2423
Así como usas oraciones para contar una historia a una persona,
usas algoritmos para contar una historia a una computadora.
07:11
you use algorithms to tell a story to a computer.
170
431157
2484
Si aprendes el lenguaje,
07:14
If you learn the language, you can go out and tell your stories.
171
434349
3033
puedes salir y contar tus historias.
Espero que esto te sirva para hacerlo.
07:17
I hope this will help you do that.
172
437406
1753
Acerca de este sitio web

Este sitio le presentará vídeos de YouTube útiles para aprender inglés. Verá lecciones de inglés impartidas por profesores de primera categoría de todo el mundo. Haz doble clic en los subtítulos en inglés que aparecen en cada página de vídeo para reproducir el vídeo desde allí. Los subtítulos se desplazan en sincronía con la reproducción del vídeo. Si tiene algún comentario o petición, póngase en contacto con nosotros mediante este formulario de contacto.

https://forms.gle/WvT1wiN1qDtmnspy7