Inside OKCupid: The math of online dating - Christian Rudder

1,231,737 views ・ 2013-02-13

TED-Ed


Двойчы пстрыкніце па англійскіх субтытрах ніжэй, каб прайграць відэа.

00:00
Translator: Andrea McDonough Reviewer: Bedirhan Cinar
0
0
7000
Translator: Dasha Sizova Reviewer: Hanna Baradzina
00:17
Hello, my name is Christian Rudder,
1
17903
1714
Прывітанне, я Крысціян Радэр,
00:19
and I was one of the founders of OkCupid.
2
19641
2209
я адзін з заснавальнікаў OkCupid.
00:21
It's now one of the biggest dating sites in the United States.
3
21874
2918
Зараз гэта адзін з найбуйнейшых сайтаў знаёмстваў у ЗША.
00:24
Like most everyone at the site, I was a math major,
4
24816
2391
Як і многія на гэтым сайце,
я матэматык, і лагічна,
00:27
As you may expect, we're known for the analytic approach we take to love.
5
27231
3440
што мы аналітычна падыходзім да любві.
Мы называем гэта алгарытмам сумяшчэння.
00:30
We call it our matching algorithm.
6
30695
1638
Увогуле, алгарытм OkCupid
00:32
Basically, OkCupid's matching algorithm helps us decide
7
32357
2588
дапамагае нам вызначыць, ці варта пары людзей пайсці на спатканне.
00:34
whether two people should go on a date.
8
34969
1876
00:36
We built our entire business around it.
9
36869
1872
Мы пабудавалі на гэтым увесь наш бізнес.
00:38
Now, algorithm is a fancy word,
10
38765
1960
Алгарытм — разумнае слоўца,
00:40
and people like to drop it like it's this big thing.
11
40749
2485
і людзі больш любяць кідацца ім як чымсьці складаным,
00:43
But really, an algorithm is just a systematic,
12
43258
2288
але насамрэч гэта проста ўпарадкаваная
00:45
step-by-step way to solve a problem.
13
45570
2223
пакрокавая інструкцыя для вырашэння праблемы.
00:47
It doesn't have to be fancy at all.
14
47817
2177
Ёй зусім не трэба быць складанай.
На гэтым уроку я растлумачу,
00:50
Here in this lesson,
15
50018
1151
00:51
I'm going to explain how we arrived at our particular algorithm,
16
51193
3008
як мы прыйшлі да такога алгарытму,
і вы ўбачыце, як усё працуе.
00:54
so you can see how it's done.
17
54225
1411
00:55
Now, why are algorithms even important?
18
55660
1934
А чаму ўвогуле алгарытмы важныя?
00:57
Why does this lesson even exist?
19
57618
1580
Навошта наогул гэты ўрок?
00:59
Well, notice one very significant phrase I used above:
20
59222
3420
Звярніце ўвагу на фразу, сказаную мной раней:
01:02
they are a step-by-step way to solve a problem,
21
62666
2339
пакрокавыя інструкцыі для вырашэння праблем,
01:05
and as you probably know, computers excel at step-by-step processes.
22
65029
3418
і, як вядома, кампутары цудоўна з гэтым спраўляюцца.
01:08
A computer without an algorithm
23
68471
1589
Кампутар без алгарытма —
01:10
is basically an expensive paperweight.
24
70084
2724
па сутнасці, дарагое прэс-пап'е.
01:12
And since computers are such a pervasive part of everyday life,
25
72832
2989
А раз кампутары сустракаюцца на кожным кроку,
01:15
algorithms are everywhere.
26
75845
1547
алгарытмы таксама паўсюль.
01:18
The math behind OkCupid's matching algorithm is surprisingly simple.
27
78590
3197
Матэматыка алгарытма OkCupid на здзіўленне простая.
01:21
It's just some addition, multiplication, a little bit of square roots.
28
81811
4002
Трошку складання, множання і ледзь-ледзь квадратных каранёў.
01:25
The tricky part in designing it
29
85837
1690
Хаця пры яго распрацоўцы была складанасць
01:27
was figuring out how to take something mysterious,
30
87551
2565
у разуменні таго, як узяць нешта загадкавае —
01:30
human attraction,
31
90140
1150
прывабнасць —
01:31
and break it into components that a computer can work with.
32
91314
2784
і разбіць на часткі, з якімі можа працаваць кампутар.
Спачатку для сумяшчэння людзей спатрэбіліся іх дадзеныя,
01:34
The first thing we needed to match people up was data,
33
94122
2553
01:36
something for the algorithm to work with.
34
96699
1992
нешта, з чым мог бы працаваць алгарытм.
01:38
The best way to get data quickly from people is to just ask for it.
35
98715
3158
Лепшы спосаб хутка іх атрымаць — проста запытаць.
01:41
So we decided that OkCupid should ask users questions,
36
101897
2727
І мы вырашылі, што OkCupid будзе задаваць пытанні накшталт:
01:44
stuff like, "Do you want to have kids one day?"
37
104648
2357
«Ці хочаце вы калі-небудзь завесці дзяцей?»,
«Як часта вы чысціце зубы?»,
01:47
"How often do you brush your teeth?"
38
107029
1758
01:48
"Do you like scary movies?"
39
108811
1392
«Вам падабаюцца фільмы жахаў?»
01:50
And big stuff like, "Do you believe in God?"
40
110675
2077
А таксама важныя рэчы накшталт: «Ці верыце вы ў Бога?»
01:53
Now, a lot of the questions are good for matching like with like,
41
113843
3064
Многія пытанні добрыя для пошуку супадзенняў,
01:56
that is, when both people answer the same way.
42
116931
2156
інакш кажучы, калі абодва чалавекі адказваюць аднолькава.
01:59
For example, two people who are both into scary movies
43
119111
2548
Напрыклад, два чалавекі, якія любяць фільмы жахаў,
02:01
are probably a better match than one person who is and one who isn't.
44
121683
3321
напэўна, больш сумясцімыя, чым тыя, у каго густы адрозніваюцца.
02:05
But what about a question like,
45
125028
1493
Але што наконт пытання тыпу:
02:06
"Do you like to be the center of attention?"
46
126545
2062
«Ці любіце вы быць у цэнтры ўвагі?»
02:08
If both people in a relationship are saying yes to this,
47
128631
2628
Калі абодва партнёры адказваюць «так»,
у іх будуць вялізныя праблемы,
02:11
they're going to have massive problems.
48
131283
2093
02:13
We realized this early on,
49
133400
1245
Мы адразу зразумелі гэта і вырашылі, што нам патрэбна
02:14
and so we decided we needed a bit more data from each question.
50
134669
3269
больш інфармацыі ў кожным пытанні.
02:17
We had to ask people to specify not only their own answer,
51
137962
2763
Трэба прасіць людзей не толькі выбраць свой адказ,
02:20
but the answer they wanted from someone else.
52
140749
2265
але і адказ, які яны хацелі б атрымаць ад партнёра.
02:23
That worked really well.
53
143038
1501
Гэта спрацавала выдатна, але нам патрэбна было яшчэ адно вымярэнне.
02:24
But we needed one more dimension.
54
144563
1604
02:26
Some questions tell you more about a person than others.
55
146191
2643
Некаторыя адказы кажуць пра чалавека больш, чым іншыя.
02:28
For example, a question about politics, something like,
56
148858
3395
Напрыклад, пытанне пра палітыку:
«Што горш: спаліць кнігу ці сцяг?»,
02:32
"Which is worse: book burning or flag burning?"
57
152277
2288
02:34
might reveal more about someone than their taste in movies.
58
154589
2810
мог бы сказаць больш, чым перавагі ў фільмах.
02:37
And it doesn't make sense to weigh all things equally,
59
157423
2619
І няправільна прыдаваць пытанням аднолькавую вагу,
таму мы дадалі заключны пункт.
02:40
so we added one final data point.
60
160066
1596
02:41
For everything that OkCupid asks you,
61
161686
2024
У кожным пытанні на OkCupid,
02:43
you have a chance to tell us the role it plays in your life.
62
163734
2829
можна адзначыць, наколькі важны для вас той ці іншы аспект, —
02:46
And this ranges from irrelevant to mandatory.
63
166587
2319
у дыяпазоне ад абыякавасці да абавязковасці.
02:49
So now, for every question, we have three things for our algorithm:
64
169446
3222
Зараз для кожнага пытання у нас ёсць тры рэчы ў алгарытме:
02:52
first, your answer;
65
172692
1352
першае — ваш адказ,
02:54
second, how you want someone else -- your potential match -- to answer;
66
174617
4140
другое — пераважны адказ патэнцыйнага партнёра,
02:58
and third, how important the question is to you at all.
67
178781
2788
і трэцяе — важнасць гэтага пытання для вас.
03:02
With all this information,
68
182710
1252
Пры дапамозе гэтай інфармацыі
03:03
OkCupid can figure out how well two people will get along.
69
183986
3118
OkCupid можа зразумець, як складуцца адносіны паміж людзьмі.
03:07
The algorithm crunches the numbers and gives us a result.
70
187128
3006
Алгарытм аперыруе лікамі і выдае вынік.
У якасці прыклада
03:10
As a practical example,
71
190158
1152
03:11
let's look at how we'd match you with another person.
72
191334
2525
паглядзім на вашу сумясцімасць з іншым чалавекам,
03:13
Let's call him "B."
73
193883
1189
назавём яго «Б».
Працэнт сумясцімасці з «Б» грунтуецца на пытаннях, на якія вы абодва адказалі.
03:16
Your match percentage with B is based on questions you've both answered.
74
196023
3482
03:19
Let's call that set of common questions "s."
75
199529
2425
Назавём набор агульных пытанняў «С».
Для простасці мы возьмем маленькі набор «С»,
03:22
As a very simple example, we use a small set "s"
76
202559
2349
03:24
with just two questions in common,
77
204932
1641
усяго з двух агульных пытанняў,
03:26
and compute a match from that.
78
206597
1828
і вылічым сумясцімасць на іх аснове.
03:28
Here are our two example questions.
79
208449
1671
Вось нашыя два пытанні.
03:30
The first one, let's say, is, "How messy are you?"
80
210144
2381
Першае, скажам: «Наколькі вы мурза?»
03:32
And the answer possibilities are:
81
212549
2096
Магчымыя адказы:
03:34
very messy, average and very organized.
82
214669
3361
«мурза», «сярэдне» і «вельмі акуратны».
03:38
And let's say you answered "very organized,"
83
218054
2060
Хай вы «вельмі акуратная»
і хацелі б, каб ваш партнёр адказаў так жа,
03:40
and you'd like someone else to answer "very organized,"
84
220138
2760
03:42
and the question is very important to you.
85
222922
2256
а пытанне для вас вельмі важнае.
03:45
Basically, you're a neat freak.
86
225202
1492
Увогуле, вы акуратыстка.
03:46
You're neat, you want someone else to be neat, and that's it.
87
226718
2868
Вы чысцёха і хочаце, каб ваш партнёр таксама быў чысцёхай.
03:49
And let's say B is a little bit different.
88
229610
2015
Дапусцім, «Б» трошкі іншы.
03:51
He answered "very organized" for himself,
89
231649
2039
Ён адказаў, што сам ён «вельмі акуратны»,
03:53
but "average" is OK with him as an answer from someone else,
90
233712
3007
але «сярэдняя» акуратнасць яго задаволіць у якасці адказа ад партнёра,
03:56
and the question is only a little important to him.
91
236743
2402
а само пытанне для яго не вельмі важнае.
Паглядзім на другое пытанне, мы яго ўжо згадвалі:
03:59
Let's look at the second question, from our previous example:
92
239169
2893
«Вам падабаецца быць у цэнтры ўвагі?»
04:02
"Do you like to be the center of attention?"
93
242086
2056
Адказы толькі «так» і «не».
04:04
The answers are "yes" and "no."
94
244166
1514
04:05
You've answered "no," you want someone else to answer "no,"
95
245704
2995
Вы адказалі «не», хочаце, каб партнёр адказаў «не»,
а пытанне не вельмі важнае.
04:08
and the question is only a little important to you.
96
248723
2391
«Б» адказаў «так»,
04:11
Now B, he's answered "yes."
97
251138
1621
04:12
He wants someone else to answer "no,"
98
252783
1776
і хоча, каб партнёр адказаў «не»,
04:14
because he wants the spotlight on him,
99
254583
2274
таму што хоча быць у цэнтры ўвагі,
04:16
and the question is somewhat important to him.
100
256881
2430
а пытанне для яго дастаткова важнае.
04:19
So, let's try to compute all of this.
101
259335
1999
Давайце ўсё гэта вылічым.
04:21
Our first step is, since we use computers to do this,
102
261972
2503
Першы крок, паколькі мы выкарыстоўваем кампутары, —
04:24
we need to assign numerical values
103
264499
1867
надаць лікавыя значэнні
04:26
to ideas like "somewhat important" and "very important,"
104
266390
2627
паняццям накшталт «даволі важна» і «вельмі важна»,
04:29
because computers need everything in numbers.
105
269041
2211
таму што кампутары разумеюць толькі лікі.
04:31
We at OkCupid decided on the following scale:
106
271276
2403
У OkCupid мы выкарыстоўваем такія велічыні:
04:33
"Irrelevant" is worth 0.
107
273703
1946
«абыякава» — гэта 0,
«не вельмі важна» — гэта 1,
04:36
"A little important" is worth 1.
108
276173
1889
04:38
"Somewhat important" is worth 10.
109
278538
1809
«даволі важна» — гэта 10,
04:40
"Very important" is 50.
110
280831
1754
«вельмі важна» — 50,
04:42
And "absolutely mandatory" is 250.
111
282609
3612
і «абавязкова» — 250.
04:46
Next, the algorithm makes two simple calculations.
112
286245
2631
Зараз алгарытм робіць два простыя вылічэнні.
04:48
The first is: How much did B's answers satisfy you?
113
288900
3246
Першае: наколькі адказы «Б» задавальняюць вас,
гэта значыць колькі з магчымых балаў «Б» атрымаў па вашых мерках?
04:52
That is, how many possible points did B score on your scale?
114
292170
3793
04:55
Well, you indicated that B's answer to the first question,
115
295987
3212
Такім чынам, вы пазначылі, што адказ «Б»
на першае пытанне пра ахайнасць
04:59
about messiness,
116
299223
1166
быў вельмі важным для вас.
05:00
was very important to you.
117
300413
1350
05:01
It's worth 50 points and B got that right.
118
301787
2230
ЁН каштуе 50 балаў, і «Б» адказаў правільна.
05:04
The second question is worth only 1,
119
304375
1737
Другое пытанне каштуе толькі 1 бал,
бо вы сказалі, што яно не вельмі важнае,
05:06
because you said it was only a little important.
120
306136
2278
а адказ «Б» не падышоў.
05:08
B got that wrong,
121
308438
1197
05:09
so B's answers were 50 out of 51 possible points.
122
309659
2782
Адказы «Б» набралі 50 з 51 магчымых балаў.
05:12
That's 98% satisfactory. Pretty good.
123
312465
2608
Гэта на 98% здавальняюча. Дастаткова добра.
05:15
The second question the algorithm looks at is: How much did you satisfy B?
124
315097
3949
Другі пункт у алгарытме высвятляе, наколькі вы падыходзіце «Б».
«Б» даў 1 бал вашаму адказу пра ахайнасць
05:19
Well, B placed 1 point on your answer to the messiness question
125
319070
3259
05:22
and 10 on your answer to the second.
126
322353
1953
і 10 адказу на другое пытанне.
05:24
Of those 11, that's 1 plus 10, you earned 10 --
127
324745
3387
З гэтых 11 балаў, паколькі 1 плюс 10, вы зарабілі 10,
05:28
you guys satisfied each other on the second question.
128
328156
2595
вы задаволілі адзін аднаго па другім пытанні.
05:30
So your answers were 10 out of 11 equals 91 percent satisfactory to B.
129
330775
4242
Вашы адказы складаюць 10 з 11, што на 91% падыходзіць «Б».
05:35
That's not bad.
130
335041
1151
Гэта нядрэнна.
05:36
The final step is to take these two match percentages
131
336216
2507
Апошні крок: узяць працэнты сумясцімасцяў
05:38
and get one number for the both of you.
132
338747
1866
і атрымаць адзін лік для вас абаіх.
05:40
To do this, the algorithm multiplies your scores,
133
340637
2611
Каб гэта зрабіць, алгарытм перамножвае вашы балы
і здабывае N-ны корань,
05:43
then takes the nth root,
134
343272
1665
05:44
where "n" is the number of questions.
135
344961
2183
дзе N — колькасць пытанняў.
Паколькі «С», колькасць пытанняў,
05:47
Because s, which is the number of questions in this sample,
136
347168
2830
у прыкладзе толькі 2,
05:50
is only 2,
137
350022
1841
05:51
we have: match percentage equals the square root
138
351887
3665
працэнт сумясцімасці раўны
квадратнаму кораню ад 98%, памножанаму на 91%.
05:55
of 98 percent times 91 percent.
139
355576
2896
05:58
That equals 94 percent.
140
358496
1784
гэта 94%.
06:00
That 94 percent is your match percentage with B.
141
360304
3204
94% — ваша сумясцімасць з «Б».
06:03
It's a mathematical expression of how happy you'd be with each other,
142
363532
3243
Гэта матэматычны выраз вашай імавернасці шчасця разам,
06:06
based on what we know.
143
366799
1183
які заснаваны на тым, што мы ведаем.
Чаму алгарытм памнажае замест таго каб, напрыклад,
06:08
Now, why does the algorithm multiply,
144
368006
1786
06:09
as opposed to, say, average the two match scores together,
145
369816
2769
выводзіць сярэдняе паміж баламі,
06:12
and do the square-root business?
146
372609
1670
і займаецца здабываннем каранёў?
06:14
In general, this formula is called the geometric mean.
147
374303
2529
Гэта формула — сярэдняе арыфметычнае,
06:16
It's a great way to combine values that have wide ranges
148
376856
2627
гэта выдатны спосаб спалучаць значэнні з вялікіх дыяпазонаў
06:19
and represent very different properties.
149
379507
1915
з рознымі ўласцівасцямі.
Гэта значыць яна ідэальная для рамантычных супадзенняў.
06:21
In other words, it's perfect for romantic matching.
150
381446
2413
06:23
You've got wide ranges and you've got tons of different data points,
151
383883
3247
Ёсць шырокія дыяпазоны і куча розных дадзеных —
пра кіно, палітыку, рэлігію — пра ўсё.
06:27
like I said, about movies, politics, religion -- everything.
152
387154
3438
06:30
Intuitively, too, this makes sense.
153
390616
1838
Гэта мае сэнс на ўзроўні інтуіцыі.
06:32
Two people satisfying each other 50 percent
154
392478
2775
Два чалавекі, якія задавальняюць адзін аднаго на 50%,
больш сумясцімыя, чым два іншыя, чый вынік — 0 і 100,
06:35
should be a better match than two others who satisfy 0 and 100,
155
395277
3952
таму што сімпатыя павінна быць узаемнай.
06:39
because affection needs to be mutual.
156
399253
1814
Пасля невялікай карэкціроўкі хібнасці,
06:41
After adding a little correction for margin of error,
157
401091
2491
06:43
in the case where we have a small number of questions,
158
403606
2571
у выпадку, калі колькасць пытанняў невялікая,
як у нашым прыкладзе,
06:46
like we do in this example,
159
406201
1317
06:47
we're good to go.
160
407542
1172
усё гатова.
06:48
Any time OkCupid matches two people,
161
408738
1912
Калі OkCupid знаходзіць пары,
06:50
it goes through the steps we just outlined.
162
410674
2032
ён праходзіць праз апісаныя вышэй крокі.
06:52
First it collects data about your answers,
163
412730
2269
Спачатку ён збірае дадзеныя аб вашых адказах,
потым сумяшчае вашы варыянты і перавагі
06:55
then it compares your choices and preferences to other people's
164
415023
2985
простымі, матэматычнымі спосабамі.
06:58
in simple, mathematical ways.
165
418032
1967
Магчымасць браць з'явы рэальнага свету
07:00
This, the ability to take real-world phenomena
166
420023
2923
07:02
and make them something a microchip can understand,
167
422970
2415
і рабіць іх зразумелымі мікрачыпу —
07:05
is, I think, the most important skill anyone can have these days.
168
425409
3277
самы важны навык у нашы дні.
07:08
Like you use sentences to tell a story to a person,
169
428710
2423
Вы карыстаецеся сказамі, каб расказаць гісторыю чалавеку,
07:11
you use algorithms to tell a story to a computer.
170
431157
2484
і алгарытмамі, каб расказаць гісторыю кампутару.
Калі вы вывучыце мову, то зможаце распавесці свае гісторыі.
07:14
If you learn the language, you can go out and tell your stories.
171
434349
3033
Я спадзяюся, гэта будзе вам карысна.
07:17
I hope this will help you do that.
172
437406
1753
Аб гэтым сайце

Гэты сайт пазнаёміць вас з відэа YouTube, якія карысныя для вывучэння англійскай мовы. Вы ўбачыце ўрокі англійскай мовы, якія вядуць высакакласныя выкладчыкі з усяго свету. Двойчы пстрыкніце англійскія субтытры, якія адлюстроўваюцца на кожнай старонцы відэа, каб прайграць відэа адтуль. Субтытры пракручваюцца сінхранізавана з прайграваннем відэа. Калі ў вас ёсць якія-небудзь каментарыі або пажаданні, звяжыцеся з намі, выкарыстоўваючы гэтую кантактную форму.

https://forms.gle/WvT1wiN1qDtmnspy7