Inside OKCupid: The math of online dating - Christian Rudder

1,238,192 views ・ 2013-02-13

TED-Ed


אנא לחץ פעמיים על הכתוביות באנגלית למטה כדי להפעיל את הסרטון.

00:00
Translator: Andrea McDonough Reviewer: Bedirhan Cinar
0
0
7000
תרגום: Ido Dekkers עריכה: Sigal Tifferet
00:17
Hello, my name is Christian Rudder,
1
17903
1714
שלום, שמי כריסטיאן רודר,
00:19
and I was one of the founders of OkCupid.
2
19641
2209
ואני הייתי אחד המקימים של OK קופידון.
00:21
It's now one of the biggest dating sites in the United States.
3
21874
2918
כרגע זה אחד מאתרי ההכרויות הגדולים ביותר בארצות הברית.
00:24
Like most everyone at the site, I was a math major,
4
24816
2391
כמו כמעט כולם באתר,
הייתי בוגר מתמטיקה, וכמו שאתם יכולים לצפות,
00:27
As you may expect, we're known for the analytic approach we take to love.
5
27231
3440
אנחנו ידועים בגישה האנליטית
שיש לנו לאהבה.
אנחנו קוראים לה אלגוריתם ההתאמה שלנו.
00:30
We call it our matching algorithm.
6
30695
1638
בעיקרון אלגוריתם ההתאמה של OK קופידון
00:32
Basically, OkCupid's matching algorithm helps us decide
7
32357
2588
עוזר לנו להחליט אם שני אנשים צריכים לצאת לפגישה.
00:34
whether two people should go on a date.
8
34969
1876
00:36
We built our entire business around it.
9
36869
1872
בנינו את כל העסק סביב זה.
00:38
Now, algorithm is a fancy word,
10
38765
1960
עכשיו אלגוריתם זו מילה מפוארת,
00:40
and people like to drop it like it's this big thing.
11
40749
2485
ואנשים אוהבים להגיד אותה כאילו זה דבר גדול כזה,
00:43
But really, an algorithm is just a systematic,
12
43258
2288
אבל, למעשה, אלגוריתם הוא דרך,
00:45
step-by-step way to solve a problem.
13
45570
2223
שיטתית של שלב אחר שלב לפתור בעיה.
00:47
It doesn't have to be fancy at all.
14
47817
2177
זה לא חייב להיות מפואר בכלל.
כאן, בשיעור הזה, אני עומד להסביר
00:50
Here in this lesson,
15
50018
1151
00:51
I'm going to explain how we arrived at our particular algorithm,
16
51193
3008
איך הגענו לאלגוריתם היחודי שלנו
כך שתראו איך זה נעשה.
00:54
so you can see how it's done.
17
54225
1411
00:55
Now, why are algorithms even important?
18
55660
1934
עכשיו, למה אלגוריתמים בכלל חשובים?
00:57
Why does this lesson even exist?
19
57618
1580
למה השיעור הזה בכלל קיים?
00:59
Well, notice one very significant phrase I used above:
20
59222
3420
ובכן, שימו לב לביטוי אחד חשוב למעלה שהשתמשתי בו:
01:02
they are a step-by-step way to solve a problem,
21
62666
2339
יש דרך של שלב אחר שלב לפתור את הבעיה,
01:05
and as you probably know, computers excel at step-by-step processes.
22
65029
3418
וכמו שאתם בוודאי יודעים,
מחשבים מצטיינים בתהליכים של שלב אחר שלב.
01:08
A computer without an algorithm
23
68471
1589
מחשב בלי אלגוריתם
הוא בעיקרון משקולת נייר יקרה.
01:10
is basically an expensive paperweight.
24
70084
2724
01:12
And since computers are such a pervasive part of everyday life,
25
72832
2989
ומאחר ומחשבים הם דבר כה נפוץ בחיים היום יומיים,
01:15
algorithms are everywhere.
26
75845
1547
אלגוריתמים הם בכל מקום.
01:18
The math behind OkCupid's matching algorithm is surprisingly simple.
27
78590
3197
המתמטיקה מאחורי אלגוריתם ההתאמה של OK קופידון
היא פשוטה להפליא.
01:21
It's just some addition, multiplication, a little bit of square roots.
28
81811
4002
זה פשוט קצת חיבור,
כפל,
ומעט שורשים מרובעים.
01:25
The tricky part in designing it
29
85837
1690
החלק הקשה בלתכנן את זה, עם זאת,
01:27
was figuring out how to take something mysterious,
30
87551
2565
היה להבין איך לקחת משהו מסתורי,
01:30
human attraction,
31
90140
1150
משיכה אנושית,
01:31
and break it into components that a computer can work with.
32
91314
2784
ולפרק את זה לחלקים שמחשב יכול לעבוד איתם.
ובכן, הדבר הראשון שהיינו צריכים כדי לשדך אנשים היה מידע,
01:34
The first thing we needed to match people up was data,
33
94122
2553
01:36
something for the algorithm to work with.
34
96699
1992
משהו לאלגוריתם לעבוד עליו.
01:38
The best way to get data quickly from people is to just ask for it.
35
98715
3158
הדרך הטובה ביותר כדי להשיג מידע מאנשים במהירות
הוא פשוט לבקש אותו.
01:41
So we decided that OkCupid should ask users questions,
36
101897
2727
אז, החלטנו שOK קופידון ישאל אנשים שאלות,
01:44
stuff like, "Do you want to have kids one day?"
37
104648
2357
דברים כמו, "אתה רוצה ילדים יום אחד?"
ו "באיזו תכיפות אתה מצחצח את השיניים?",
01:47
"How often do you brush your teeth?"
38
107029
1758
01:48
"Do you like scary movies?"
39
108811
1392
"אתה אוהב סרטים מפחידים?"
01:50
And big stuff like, "Do you believe in God?"
40
110675
2077
ודברים גדולים כמו "אתה מאמין באלוהים?"
01:53
Now, a lot of the questions are good for matching like with like,
41
113843
3064
עכשיו, הרבה מהשאלות טובות
להתאמת תחומי עניין,
01:56
that is, when both people answer the same way.
42
116931
2156
זה כששני האנשים עונים אותו הדבר.
01:59
For example, two people who are both into scary movies
43
119111
2548
לדוגמה, שני אנשים שאוהבים סרטים מפחידים
02:01
are probably a better match than one person who is and one who isn't.
44
121683
3321
הם כנראה התאמה טובה יותר
מאדם אחד שאוהב
ואדם שני שלא.
02:05
But what about a question like,
45
125028
1493
אבל מה עם שאלות כמו,
02:06
"Do you like to be the center of attention?"
46
126545
2062
"אתה אוהב להיות במרכז העניינים?"
02:08
If both people in a relationship are saying yes to this,
47
128631
2628
אם שני האנשים ביחסים אומרים כן לזה,
אז הם יהיו בבעיה גדולה.
02:11
they're going to have massive problems.
48
131283
2093
02:13
We realized this early on,
49
133400
1245
הבנו את זה די בהתחלה,
02:14
and so we decided we needed a bit more data from each question.
50
134669
3269
ואז החלטנו שאנחנו צריכים
יותר מידע מכל שאלה.
02:17
We had to ask people to specify not only their own answer,
51
137962
2763
היינו צריכים לבקש מאנשים לפרט לא רק את התשובה שלהם,
02:20
but the answer they wanted from someone else.
52
140749
2265
אלא את התשובה שהם רצו מהאדם השני.
02:23
That worked really well.
53
143038
1501
זה עבד ממש טוב,
02:24
But we needed one more dimension.
54
144563
1604
אבל היינו צריכים עוד מימד.
02:26
Some questions tell you more about a person than others.
55
146191
2643
כמה מהשאלות מספרות לכם על האדם יותר מאחרות.
02:28
For example, a question about politics, something like,
56
148858
3395
לדוגמה, שאלה על פוליטיקה, משהו כמו,
"מה גרוע יותר: שריפת ספרים או שריפת דגלים?"
02:32
"Which is worse: book burning or flag burning?"
57
152277
2288
02:34
might reveal more about someone than their taste in movies.
58
154589
2810
אולי תגלה יותר על מישהו מהטעם שלהם בסרטים.
02:37
And it doesn't make sense to weigh all things equally,
59
157423
2619
וזה לא הגיוני לשקלל את כל הדברים במשקל זהה,
אז אנחנו צריכים להוסיף עוד נקודת מידע אחרונה.
02:40
so we added one final data point.
60
160066
1596
02:41
For everything that OkCupid asks you,
61
161686
2024
לכל דבר שOK קופידון שואל אתכם,
02:43
you have a chance to tell us the role it plays in your life.
62
163734
2829
יש לכם אפשרות להגיד לנו
את התפקיד שזה משחק בחייכם,
02:46
And this ranges from irrelevant to mandatory.
63
166587
2319
וזה נע מלא רלוונטי להכרחי.
02:49
So now, for every question, we have three things for our algorithm:
64
169446
3222
אז עכשיו, לכל שאלה,
יש לנו שלושה דברים לאלגוריתם שלנו:
02:52
first, your answer;
65
172692
1352
ראשית, את התשובה שלכם;
02:54
second, how you want someone else -- your potential match -- to answer;
66
174617
4140
שנית, איך הייתם רוצים שמישהו אחר,
ההתאמה הפוטנציאלית שלכם,
יענה;
02:58
and third, how important the question is to you at all.
67
178781
2788
ושלישית, כמה השאלה בכלל חשובה לכם.
03:02
With all this information,
68
182710
1252
עם כל המידע הזה,
03:03
OkCupid can figure out how well two people will get along.
69
183986
3118
OK קופידון יכול להבין כמה שני אנשים יכולים להתאים.
03:07
The algorithm crunches the numbers and gives us a result.
70
187128
3006
האלגוריתם מעבד את המספרים ונותן לנו תוצאה.
כדוגמה מעשית,
03:10
As a practical example,
71
190158
1152
03:11
let's look at how we'd match you with another person.
72
191334
2525
בואו נראה איך נתאים אתכם לאדם אחר,
03:13
Let's call him "B."
73
193883
1189
בואו נקרא לו, "ב".
התאמת האחוזים שלכם עם ב מבוססת על
03:16
Your match percentage with B is based on questions you've both answered.
74
196023
3482
שאלות ששניכם עניתם.
03:19
Let's call that set of common questions "s."
75
199529
2425
בואו נקרא לסט הזה של שאלות משותפות, "ס".
כדוגמה ממש פשוטה, נשתמש בסט קטן "ס"
03:22
As a very simple example, we use a small set "s"
76
202559
2349
03:24
with just two questions in common,
77
204932
1641
עם רק שתי שאלות משותפות
03:26
and compute a match from that.
78
206597
1828
ונחשב התאמה לפי זה.
03:28
Here are our two example questions.
79
208449
1671
הנה שתי שאלות הדוגמה שלנו.
03:30
The first one, let's say, is, "How messy are you?"
80
210144
2381
הראשונה, נגיד, היא," כמה מבולגן אתה?"
03:32
And the answer possibilities are:
81
212549
2096
והתשובות האפשריות הן
03:34
very messy, average and very organized.
82
214669
3361
מאוד מבולגן,
ממוצע,
ומאוד מסודר.
03:38
And let's say you answered "very organized,"
83
218054
2060
ובואו נגיד שעניתם "מאוד מסודר,"
והייתם רוצים מישהו אחר שענה "מאוד מסודרים,"
03:40
and you'd like someone else to answer "very organized,"
84
220138
2760
03:42
and the question is very important to you.
85
222922
2256
והשאלה היא מאוד חשובה לכם.
03:45
Basically, you're a neat freak.
86
225202
1492
בעיקרון אתם משוגעים לסדר.
03:46
You're neat, you want someone else to be neat, and that's it.
87
226718
2868
אתם מסודרים,
אתם רוצים מישהו אחר שיהיה מסודר,
וזהו זה.
03:49
And let's say B is a little bit different.
88
229610
2015
ובואו נגיד ש"ב" הוא מעט שונה.
03:51
He answered "very organized" for himself,
89
231649
2039
הוא ענה מאוד מסודר על עצמו,
03:53
but "average" is OK with him as an answer from someone else,
90
233712
3007
אבל ממוצע בסדר לו
כתשובה של מישהו אחר,
03:56
and the question is only a little important to him.
91
236743
2402
והשאלה רק מעט חשובה לו.
בואו נביט בשאלה השניה,
03:59
Let's look at the second question, from our previous example:
92
239169
2893
היא זאת מהדוגמה הקודמת שלנו:
"האם אתם אוהבים להיות מרכז העניינים?"
04:02
"Do you like to be the center of attention?"
93
242086
2056
התשובות הן רק כן ולא.
04:04
The answers are "yes" and "no."
94
244166
1514
04:05
You've answered "no," you want someone else to answer "no,"
95
245704
2995
עכשיו אתם עניתם "לא,"
ורציתם שגם השני יענה "לא,"
04:08
and the question is only a little important to you.
96
248723
2391
והשאלה היא רק מעט חשובה לכם.
עכשיו "ב", ענה "כן,"
04:11
Now B, he's answered "yes."
97
251138
1621
04:12
He wants someone else to answer "no,"
98
252783
1776
והוא רוצה שהאחר יענה "לא,"
04:14
because he wants the spotlight on him,
99
254583
2274
מפני שהוא רוצה את אור הזרקורים עליו,
04:16
and the question is somewhat important to him.
100
256881
2430
והשאלה היא מעט חשובה לו.
04:19
So, let's try to compute all of this.
101
259335
1999
אז, בואו ננסה לחשב את כל זה.
04:21
Our first step is, since we use computers to do this,
102
261972
2503
השלב הראשון שלנו הוא,
מאחר ואנחנו משתמשים במחשבים כדי לעשות את זה,
04:24
we need to assign numerical values
103
264499
1867
אנחנו צריכים לשייך ערכים מספריים
04:26
to ideas like "somewhat important" and "very important,"
104
266390
2627
לרעיונות כמו "מעט חשוב" ומאוד חשוב"
04:29
because computers need everything in numbers.
105
269041
2211
מפני שמחשבים צריכים הכל במספרים.
04:31
We at OkCupid decided on the following scale:
106
271276
2403
אנחנו ב OK קופידון החלטנו על המדד הבא:
04:33
"Irrelevant" is worth 0.
107
273703
1946
לא רלוונטי שווה 0,
קצת חשוב זה 1,
04:36
"A little important" is worth 1.
108
276173
1889
04:38
"Somewhat important" is worth 10.
109
278538
1809
די חשוב שווה 10,
04:40
"Very important" is 50.
110
280831
1754
מאוד חשוב זה 50,
04:42
And "absolutely mandatory" is 250.
111
282609
3612
והכרחי לחלוטין זה 250.
04:46
Next, the algorithm makes two simple calculations.
112
286245
2631
אחרי זה, האלגוריתם עושה שני חישובים פשוטים.
04:48
The first is: How much did B's answers satisfy you?
113
288900
3246
הראשון הוא כמה התשובות של "ב" מספקות אתכם,
שזה אומר, כמה נקודות אפשריות "ב" קיבל במדד שלכם?
04:52
That is, how many possible points did B score on your scale?
114
292170
3793
04:55
Well, you indicated that B's answer to the first question,
115
295987
3212
ובכן, אמרתם שהתשובה של "ב"
לשאלה הראשונה על סדר
04:59
about messiness,
116
299223
1166
היא מאוד חשובה לכם.
05:00
was very important to you.
117
300413
1350
05:01
It's worth 50 points and B got that right.
118
301787
2230
היא שווה 50 נקודות ו"ב" קלע אליה.
05:04
The second question is worth only 1,
119
304375
1737
השאלה השניה שווה רק 1
מפני שאמרתם שזה רק קצת חשוב לכם,
05:06
because you said it was only a little important.
120
306136
2278
ו"ב" לא קלע לזה.
05:08
B got that wrong,
121
308438
1197
05:09
so B's answers were 50 out of 51 possible points.
122
309659
2782
אז התשובות של "ב" היו 50 מתוך 51 נקודות אפשריות.
05:12
That's 98% satisfactory. Pretty good.
123
312465
2608
זה סיפוק של 98%.
זה די טוב.
05:15
The second question the algorithm looks at is: How much did you satisfy B?
124
315097
3949
והשאלה השניה שהאלגורתם בודק
זה כמה אתם מספקים את "ב".
ובכן, "ב" נתן נקודה אחת לתשובה שלכם
05:19
Well, B placed 1 point on your answer to the messiness question
125
319070
3259
לשאלת הסדר
05:22
and 10 on your answer to the second.
126
322353
1953
ו 10 על התשובה שלכם לשניה.
05:24
Of those 11, that's 1 plus 10, you earned 10 --
127
324745
3387
מאלה, 11, זה 1 ועוד 10,
אתם הרווחתם 10,
05:28
you guys satisfied each other on the second question.
128
328156
2595
אתם סיפקתם אחד את השני בשאלה השניה.
05:30
So your answers were 10 out of 11 equals 91 percent satisfactory to B.
129
330775
4242
אז התשובה שלכם היתה 10 מתוך 11
שזה שווה ל 91% סיפוק ל "ב".
05:35
That's not bad.
130
335041
1151
זה לא רע.
05:36
The final step is to take these two match percentages
131
336216
2507
השלב האחרון הוא לקחת את שתי התאמות האחוז האלו
05:38
and get one number for the both of you.
132
338747
1866
ולקבל מספר אחד לשניכם.
05:40
To do this, the algorithm multiplies your scores,
133
340637
2611
כדי לעשות את זה, האלגוריתם מכפיל את התוצאות שלכם,
אז הוא לוקח את השורש ה"n",
05:43
then takes the nth root,
134
343272
1665
05:44
where "n" is the number of questions.
135
344961
2183
כש "n" הוא מספר השאלות.
מפני ש"ס", שזה מספר השאלות,
05:47
Because s, which is the number of questions in this sample,
136
347168
2830
בדוגמה הזו, הוא רק 2,
05:50
is only 2,
137
350022
1841
05:51
we have: match percentage equals the square root
138
351887
3665
יש לנו אחוז התאמה ששווה
לשורש ריבועי של 98% כפול 91%.
05:55
of 98 percent times 91 percent.
139
355576
2896
05:58
That equals 94 percent.
140
358496
1784
זה שווה 94%.
06:00
That 94 percent is your match percentage with B.
141
360304
3204
ה94% האלה הם אחוז ההתאמה שלכם ל"ב".
06:03
It's a mathematical expression of how happy you'd be with each other,
142
363532
3243
זה ביטוי מתמטי
של כמה מאושרים אתם תהיו אחד עם השני
06:06
based on what we know.
143
366799
1183
בהתבסס על מה שאנחנו יודעים.
עכשיו, למה האלגוריתם מכפיל ולא
06:08
Now, why does the algorithm multiply,
144
368006
1786
06:09
as opposed to, say, average the two match scores together,
145
369816
2769
ממצע את שתי התוצאות יחד
06:12
and do the square-root business?
146
372609
1670
ומחשב שורש ריבועי?
06:14
In general, this formula is called the geometric mean.
147
374303
2529
בכללי, הנוסחה נקראת הממוצע הגאומטרי,
06:16
It's a great way to combine values that have wide ranges
148
376856
2627
שזו דרך מעולה לשלב ערכים
שיש להם טווח רחב
06:19
and represent very different properties.
149
379507
1915
ומייצגים תכונות שונות מאוד.
במילים אחרות, זה מושלם להתאמה רומנטית.
06:21
In other words, it's perfect for romantic matching.
150
381446
2413
06:23
You've got wide ranges and you've got tons of different data points,
151
383883
3247
יש לכם טווח רחב
ויש לכם המון נקודות מידע,
כמו שאמרתי, על סרטים,
06:27
like I said, about movies, politics, religion -- everything.
152
387154
3438
על פוליטיקה,
על דת,
על הכל.
06:30
Intuitively, too, this makes sense.
153
390616
1838
באופן אינטואיטיבי זה הגיוני.
06:32
Two people satisfying each other 50 percent
154
392478
2775
שני אנשים שמספקים אחד את השני 50%
צריכים להיות התאמה טובה יותר
06:35
should be a better match than two others who satisfy 0 and 100,
155
395277
3952
מאלה שמספקים אחד את השני 0 ו 100,
06:39
because affection needs to be mutual.
156
399253
1814
מפני שחיבה צריכה להיות הדדית.
אחרי הוספת תיקון קטן למרווח טעות,
06:41
After adding a little correction for margin of error,
157
401091
2491
06:43
in the case where we have a small number of questions,
158
403606
2571
במקרה שיש לנו מספר קטן של שאלות,
כמו שאנחנו עושים בדוגמה הזו,
06:46
like we do in this example,
159
406201
1317
06:47
we're good to go.
160
407542
1172
אנחנו מוכנים לצאת לדרך.
06:48
Any time OkCupid matches two people,
161
408738
1912
כל פעם שOK קופידון מתאים שני אנשים,
06:50
it goes through the steps we just outlined.
162
410674
2032
הוא עובר את השלבים שהראנו.
06:52
First it collects data about your answers,
163
412730
2269
ראשית הוא אוסף מידע על התשובות שלכם,
אז הוא משווה את הבחירות שלכם וההעדפות שלכם
06:55
then it compares your choices and preferences to other people's
164
415023
2985
לאנשים האחרים בדרכים מתמטיות פשוטות.
06:58
in simple, mathematical ways.
165
418032
1967
היכולת לקחת תופעה מהעולם האמיתי
07:00
This, the ability to take real-world phenomena
166
420023
2923
07:02
and make them something a microchip can understand,
167
422970
2415
ולהפוך אותה למשהו שמיקרומעבד יכול להבין,
07:05
is, I think, the most important skill anyone can have these days.
168
425409
3277
היא, אני חושב,
היכולת הכי חשובה שיכולה להיות למישהו היום.
07:08
Like you use sentences to tell a story to a person,
169
428710
2423
כמו שאתם משתמשים במשפטים כדי לספר סיפור לאדם,
אתם משתמשים באלגוריתמים לספר סיפור למחשב.
07:11
you use algorithms to tell a story to a computer.
170
431157
2484
אם תלמדו את השפה,
07:14
If you learn the language, you can go out and tell your stories.
171
434349
3033
אתם יכולים לצאת ולספר את הסיפורים שלכם.
אני מקווה שזה יעזור לכם לעשות את זה.
07:17
I hope this will help you do that.
172
437406
1753
על אתר זה

אתר זה יציג בפניכם סרטוני YouTube המועילים ללימוד אנגלית. תוכלו לראות שיעורי אנגלית המועברים על ידי מורים מהשורה הראשונה מרחבי העולם. לחץ פעמיים על הכתוביות באנגלית המוצגות בכל דף וידאו כדי להפעיל את הסרטון משם. הכתוביות גוללות בסנכרון עם הפעלת הווידאו. אם יש לך הערות או בקשות, אנא צור איתנו קשר באמצעות טופס יצירת קשר זה.

https://forms.gle/WvT1wiN1qDtmnspy7