Inside OKCupid: The math of online dating - Christian Rudder

1,237,397 views ・ 2013-02-13

TED-Ed


Videoyu oynatmak için lütfen aşağıdaki İngilizce altyazılara çift tıklayınız.

00:00
Translator: Andrea McDonough Reviewer: Bedirhan Cinar
0
0
7000
Çeviri: Gözde Alpçetin Gözden geçirme: Can Boysan
00:17
Hello, my name is Christian Rudder,
1
17903
1714
Merhaba, benim adım Christian Rudder ve ben OkCupid'in kurucularından biriydim.
00:19
and I was one of the founders of OkCupid.
2
19641
2209
00:21
It's now one of the biggest dating sites in the United States.
3
21874
2918
Artık ABD'deki en büyük tanışma sitelerinden biri.
00:24
Like most everyone at the site, I was a math major,
4
24816
2391
Sitedeki neredeyse herkes gibi ben de matematik bölümündeydim.
00:27
As you may expect, we're known for the analytic approach we take to love.
5
27231
3440
Tahmin edebileceğiniz gibi çözümsel yaklaşımlarla biliniriz.
00:30
We call it our matching algorithm.
6
30695
1638
Buna eşleştirme algoritması diyoruz.
Temelde OkCupid'in eşleştirme algoritması
00:32
Basically, OkCupid's matching algorithm helps us decide
7
32357
2588
iki kişinin randevuya çıkıp çıkmaması konusunda yardımcı oluyor.
00:34
whether two people should go on a date.
8
34969
1876
00:36
We built our entire business around it.
9
36869
1872
Tüm işimizi bunu temel olarak inşa ettik.
00:38
Now, algorithm is a fancy word,
10
38765
1960
Algoritma süslü bir kelime
00:40
and people like to drop it like it's this big thing.
11
40749
2485
ve insanlar bunu büyük bir şeymiş gibi düşünmekten hoşlanıyorlar.
00:43
But really, an algorithm is just a systematic,
12
43258
2288
Ama aslında algoritma sadece bir sistematik,
00:45
step-by-step way to solve a problem.
13
45570
2223
bir sorunu çözmenin kademeli bir yolu.
00:47
It doesn't have to be fancy at all.
14
47817
2177
Süslü olmasına hiç de gerek yok.
00:50
Here in this lesson,
15
50018
1151
Bu derste bu özel algoritmamızı nasıl elde ettiğimizi açıklayacağım,
00:51
I'm going to explain how we arrived at our particular algorithm,
16
51193
3008
böylece nasıl yapıldığını da görmüş olacaksınız.
00:54
so you can see how it's done.
17
54225
1411
00:55
Now, why are algorithms even important?
18
55660
1934
Algoritmalar neden önemli ki?
00:57
Why does this lesson even exist?
19
57618
1580
Bu ders neden var?
00:59
Well, notice one very significant phrase I used above:
20
59222
3420
Yukarıda kullandığım çok önemli bir ifadeyi fark edin:
01:02
they are a step-by-step way to solve a problem,
21
62666
2339
Bir sorunu çözmenin kademeli yolunu oluşturuyorlar
01:05
and as you probably know, computers excel at step-by-step processes.
22
65029
3418
ve bildiğiniz gibi bilgisayarlar kademeli işlemlerde çok başarılılar.
01:08
A computer without an algorithm
23
68471
1589
Algoritmasız bir bilgisayar sadece pahalı bir ağırlıktan başka bir şey değil
01:10
is basically an expensive paperweight.
24
70084
2724
01:12
And since computers are such a pervasive part of everyday life,
25
72832
2989
ve bilgisayarlar günlük hayatımızın her tarafını işgal ettiğinden beri
01:15
algorithms are everywhere.
26
75845
1547
algoritmalar her yerdeler.
OkCupid'in eşleştirme algoritmasının arkasındaki matematik
01:18
The math behind OkCupid's matching algorithm is surprisingly simple.
27
78590
3197
şaşırtıcı derecede basit.
01:21
It's just some addition, multiplication, a little bit of square roots.
28
81811
4002
Sadece biraz toplama, çarpma ve birazcık da karekök.
01:25
The tricky part in designing it
29
85837
1690
Onu tasarlarken karışık olan taraf ise gizemli bir şeyi, insan çekiciliğini alıp
01:27
was figuring out how to take something mysterious,
30
87551
2565
01:30
human attraction,
31
90140
1150
bilgisayarın üzerinde çalışabileceği ögelere nasıl ayırabileceğini bulmaktı.
01:31
and break it into components that a computer can work with.
32
91314
2784
İnsanları eşleştirmek için ihtiyacımız olan ilk şey veriydi,
01:34
The first thing we needed to match people up was data,
33
94122
2553
01:36
something for the algorithm to work with.
34
96699
1992
algoritmanın üzerinde çalışacağı bir şey.
01:38
The best way to get data quickly from people is to just ask for it.
35
98715
3158
İnsanlardan hızlıca veri elde etmenin en iyi yolu ise sadece sormak.
01:41
So we decided that OkCupid should ask users questions,
36
101897
2727
Bu yüzden OkCupid'in kullanıcılara
01:44
stuff like, "Do you want to have kids one day?"
37
104648
2357
"Bir gün çocuk sahibi olmak istiyor musunuz?"
"Ne sıklıkla dişlerinizi fırçalıyorsunuz?"
01:47
"How often do you brush your teeth?"
38
107029
1758
01:48
"Do you like scary movies?"
39
108811
1392
"Korku filmlerini seviyor musunuz?"
01:50
And big stuff like, "Do you believe in God?"
40
110675
2077
"Tanrı'ya inanıyor musunuz?" gibi önemli sorular sormasına karar verdik.
01:53
Now, a lot of the questions are good for matching like with like,
41
113843
3064
Soruların çoğu benzeri benzerle eşleştirmek için uygun,
01:56
that is, when both people answer the same way.
42
116931
2156
yani her iki kişi de aynı şekilde cevap verirse.
01:59
For example, two people who are both into scary movies
43
119111
2548
Örneğin, korku filmlerini seven iki kişi
02:01
are probably a better match than one person who is and one who isn't.
44
121683
3321
muhtemelen seven biri ve sevmeyen birinden daha iyi bir eşleşmedir.
02:05
But what about a question like,
45
125028
1493
Peki ya "İlgi odağı olmaktan hoşlanır mısınız?" gibi bir soru?
02:06
"Do you like to be the center of attention?"
46
126545
2062
02:08
If both people in a relationship are saying yes to this,
47
128631
2628
Eğer bir ilişkide her iki kişi buna evet cevabını veriyorsa
02:11
they're going to have massive problems.
48
131283
2093
çok büyük sorunları olacaktır.
02:13
We realized this early on,
49
133400
1245
Bunu erken fark ettik
02:14
and so we decided we needed a bit more data from each question.
50
134669
3269
ve her soruda biraz daha veri elde etmemiz gerektiğine karar verdik.
02:17
We had to ask people to specify not only their own answer,
51
137962
2763
Sadece kendi cevaplarını değil,
aynı zamanda başkasından almak istedikleri cevabı da belirtmelerini istedik.
02:20
but the answer they wanted from someone else.
52
140749
2265
02:23
That worked really well.
53
143038
1501
Bu, bayağı işe yaradı.
02:24
But we needed one more dimension.
54
144563
1604
Ama bir boyuta daha ihtiyacımız vardı.
02:26
Some questions tell you more about a person than others.
55
146191
2643
Bazı sorular, biri hakkında diğerlerinden daha fazla şey söyler.
02:28
For example, a question about politics, something like,
56
148858
3395
Örneğin, politika hakkındaki bir soru;
"Hangisi daha kötü: Kitabın mı yoksa bayrağın yanması mı?" gibi bir soru
02:32
"Which is worse: book burning or flag burning?"
57
152277
2288
02:34
might reveal more about someone than their taste in movies.
58
154589
2810
bir kişinin film zevklerinden daha fazla şey ortaya çıkarır
02:37
And it doesn't make sense to weigh all things equally,
59
157423
2619
ve her şeyi eşit olarak ölçmek bir anlam ifade etmiyor,
bu yüzden veri göstergesi ekledik.
02:40
so we added one final data point.
60
160066
1596
02:41
For everything that OkCupid asks you,
61
161686
2024
OkCupid'in size sorduğu her şey için
02:43
you have a chance to tell us the role it plays in your life.
62
163734
2829
hayatınızda oynadığı rolü bize anlatma şansınız var
02:46
And this ranges from irrelevant to mandatory.
63
166587
2319
ve bu alakasız ile gerekli şeyler arasında değişiyor.
02:49
So now, for every question, we have three things for our algorithm:
64
169446
3222
Her soru için algoritmamız açısından üç şeyimiz var:
02:52
first, your answer;
65
172692
1352
İlk olarak, cevabınız;
02:54
second, how you want someone else -- your potential match -- to answer;
66
174617
4140
ikinci olarak, başkasının nasıl cevap vermesini istemeniz --
potansiyel eşiniz --
02:58
and third, how important the question is to you at all.
67
178781
2788
ve üçüncü olarak, sorunun sizin için ne kadar önemli olması.
03:02
With all this information,
68
182710
1252
Tüm bu bilgilerle birlikte
03:03
OkCupid can figure out how well two people will get along.
69
183986
3118
OkCupid iki kişinin ne kadar iyi geçinebileceğini bulabiliyor.
03:07
The algorithm crunches the numbers and gives us a result.
70
187128
3006
Algoritma, sayıları inceleyip bize bir sonuç veriyor.
03:10
As a practical example,
71
190158
1152
Uygulamalı bir örnek olarak
03:11
let's look at how we'd match you with another person.
72
191334
2525
hadi sizi başka biriyle nasıl eşleştireceğimize bakalım.
03:13
Let's call him "B."
73
193883
1189
Ona "B" diyelim.
03:16
Your match percentage with B is based on questions you've both answered.
74
196023
3482
B ile olan eşleşme yüzdeniz
ikinizin de cevapladığı soruları baz alıyor.
03:19
Let's call that set of common questions "s."
75
199529
2425
Ortak sorulara da "s" diyelim.
03:22
As a very simple example, we use a small set "s"
76
202559
2349
Çok basit bir örnek olarak
bir grup "s"yi sadece iki ortak soruyla kullanıyoruz
03:24
with just two questions in common,
77
204932
1641
03:26
and compute a match from that.
78
206597
1828
ve bundan bir eşleşme çıkartıyoruz.
03:28
Here are our two example questions.
79
208449
1671
İşte iki örnek sorumuz.
03:30
The first one, let's say, is, "How messy are you?"
80
210144
2381
İlki diyelim ki "Ne kadar dağınıksın?"
03:32
And the answer possibilities are:
81
212549
2096
ve cevap olasılıkları da şunlar:
03:34
very messy, average and very organized.
82
214669
3361
Çok dağınık, ortalama ve çok düzenli.
03:38
And let's say you answered "very organized,"
83
218054
2060
"Çok düzenli" olarak cevapladığınızı,
başkasının da "çok düzenli" olarak cevaplamasını istediğinizi
03:40
and you'd like someone else to answer "very organized,"
84
220138
2760
03:42
and the question is very important to you.
85
222922
2256
ve sorunun sizin için çok önemli olduğunu varsayalım.
03:45
Basically, you're a neat freak.
86
225202
1492
Yani temizlik delisisiniz.
03:46
You're neat, you want someone else to be neat, and that's it.
87
226718
2868
Düzenlisiniz, başkasının da düzenli olmasını istiyorsunuz, hepsi bu
03:49
And let's say B is a little bit different.
88
229610
2015
ve B'nin biraz farklı olduğunu varsayalım.
03:51
He answered "very organized" for himself,
89
231649
2039
Kendisini "çok düzenli" olarak cevapladı
03:53
but "average" is OK with him as an answer from someone else,
90
233712
3007
ama başkasının "ortalama" cevabı onun için yeterli
03:56
and the question is only a little important to him.
91
236743
2402
ve sorunun onun için çok da bir önemi yok.
03:59
Let's look at the second question, from our previous example:
92
239169
2893
Önceki örneğimizden ikinci soruya bakalım.
04:02
"Do you like to be the center of attention?"
93
242086
2056
"İlgi odağı olmaktan hoşlanır mısınız?"
04:04
The answers are "yes" and "no."
94
244166
1514
Cevap ya "evet" ya da "hayır."
04:05
You've answered "no," you want someone else to answer "no,"
95
245704
2995
"Hayır"ı cevapladınız, başkasının da "hayır"ı cevaplamasını istiyorsunuz
04:08
and the question is only a little important to you.
96
248723
2391
ve sorunun sizin için çok da bir önemi yok.
04:11
Now B, he's answered "yes."
97
251138
1621
B "evet"i cevapladı.
04:12
He wants someone else to answer "no,"
98
252783
1776
Başkasının da "hayır"ı cevaplamasını istiyor
04:14
because he wants the spotlight on him,
99
254583
2274
çünkü tüm ilginin onda olmasını istiyor
04:16
and the question is somewhat important to him.
100
256881
2430
ve soru onun için bir miktar önemli.
04:19
So, let's try to compute all of this.
101
259335
1999
Şimdi tüm bunları hesaplamaya çalışalım.
04:21
Our first step is, since we use computers to do this,
102
261972
2503
İlk adımımız, bunu yapmak için bilgisayarları kullandığımızdan dolayı,
04:24
we need to assign numerical values
103
264499
1867
"bir miktar önemli" ve "çok önemli" gibi düşüncelere sayısal değerler vermeliyiz
04:26
to ideas like "somewhat important" and "very important,"
104
266390
2627
çünkü bilgisayar her şeye sayı biçiminde ihtiyaç duyar.
04:29
because computers need everything in numbers.
105
269041
2211
04:31
We at OkCupid decided on the following scale:
106
271276
2403
OkCupid için şu ölçekte karar kıldık:
04:33
"Irrelevant" is worth 0.
107
273703
1946
"Alakasız" 0 değerinde.
04:36
"A little important" is worth 1.
108
276173
1889
"Biraz önemli" 1 değerinde.
04:38
"Somewhat important" is worth 10.
109
278538
1809
"Bir miktar önemli" 10 değerinde.
04:40
"Very important" is 50.
110
280831
1754
"Çok önemli" 50 değerinde.
04:42
And "absolutely mandatory" is 250.
111
282609
3612
"Kesinlikle gerekli" 250 değerinde.
04:46
Next, the algorithm makes two simple calculations.
112
286245
2631
Daha sonrasında algoritma iki basit hesaplama yapıyor.
04:48
The first is: How much did B's answers satisfy you?
113
288900
3246
İlki "B'nin cevapları sizi ne kadar tatmin etti?"
04:52
That is, how many possible points did B score on your scale?
114
292170
3793
Yani B sizin ölçeğinizde ne kadar olası puan topladı?
04:55
Well, you indicated that B's answer to the first question,
115
295987
3212
B'nin ilk soruya, dağınıklık hakkındaki soruya olan cevabının,
sizin için çok önemli olduğunu belirttiniz.
04:59
about messiness,
116
299223
1166
05:00
was very important to you.
117
300413
1350
05:01
It's worth 50 points and B got that right.
118
301787
2230
50 puan değerinde ve B bunu bildi.
05:04
The second question is worth only 1,
119
304375
1737
İkinci soru ise sadece 1 puan değerinde çünkü biraz önemli olduğunu söylediniz,
05:06
because you said it was only a little important.
120
306136
2278
05:08
B got that wrong,
121
308438
1197
B bunu bilemedi,
05:09
so B's answers were 50 out of 51 possible points.
122
309659
2782
dolayısıyla B'nin cevapları 51 olası puan üzerinden 50.
05:12
That's 98% satisfactory. Pretty good.
123
312465
2608
Bu %98 oranında tatmin edici, çok iyi.
05:15
The second question the algorithm looks at is: How much did you satisfy B?
124
315097
3949
Algoritmanın göz önünde bulundurduğu ikinci soru ise şu:
B'yi ne kadar tatmin ettiniz?
05:19
Well, B placed 1 point on your answer to the messiness question
125
319070
3259
B, dağınıklık sorusuna olan cevabınıza 1 puan verdi
05:22
and 10 on your answer to the second.
126
322353
1953
ve ikincisine de 10 puan verdi.
05:24
Of those 11, that's 1 plus 10, you earned 10 --
127
324745
3387
Bu 11 puanın, 1 ile 10'un toplamı, 10 puan kazandınız --
05:28
you guys satisfied each other on the second question.
128
328156
2595
ikinci soruda birbirinizi cevabınızla tatmin ettiniz.
05:30
So your answers were 10 out of 11 equals 91 percent satisfactory to B.
129
330775
4242
11 üzerinden 10 puan olan cevaplarınız B için %91 oranında tatmin edici.
05:35
That's not bad.
130
335041
1151
Fena değil.
05:36
The final step is to take these two match percentages
131
336216
2507
Son adım, bu iki eşleşme yüzdelerini alıp
05:38
and get one number for the both of you.
132
338747
1866
ikiniz için de tek bir sayı elde etmek.
05:40
To do this, the algorithm multiplies your scores,
133
340637
2611
Bunu yapmak için algoritma puanlarınızı çarpıyor,
05:43
then takes the nth root,
134
343272
1665
sonra n dereceden kökünü alıyor,
05:44
where "n" is the number of questions.
135
344961
2183
"n" soru sayısını oluşturuyor.
05:47
Because s, which is the number of questions in this sample,
136
347168
2830
S, - ki bu örnekte soru sayısını oluşturuyor -
sadece 2 olduğundan dolayı
05:50
is only 2,
137
350022
1841
05:51
we have: match percentage equals the square root
138
351887
3665
hesap şöyle:
eşleşme yüzdesi yüzde 98 ile yüzde 91'in çarpımının kare köküne denk geliyor.
05:55
of 98 percent times 91 percent.
139
355576
2896
05:58
That equals 94 percent.
140
358496
1784
Bu da yüzde 94'e denk geliyor.
06:00
That 94 percent is your match percentage with B.
141
360304
3204
Bu 94'lük yüzde, B ile olan eşleşme yüzdeniz.
06:03
It's a mathematical expression of how happy you'd be with each other,
142
363532
3243
Bildiklerimize dayanarak
birbirinizle ne kadar mutlu olabileceğinizin matematiksel ifadesi.
06:06
based on what we know.
143
366799
1183
06:08
Now, why does the algorithm multiply,
144
368006
1786
Peki algoritma neden iki eşleşme puanının ortalamasını almak yerine
06:09
as opposed to, say, average the two match scores together,
145
369816
2769
çarpıyor ve kare kökünü alıyor?
06:12
and do the square-root business?
146
372609
1670
06:14
In general, this formula is called the geometric mean.
147
374303
2529
Genel olarak bu formüle geometrik ortalama deniyor.
06:16
It's a great way to combine values that have wide ranges
148
376856
2627
Geniş aralığı olan değerleri birleştirmek
ve farklı nitelikleri temsil etmek için harika bir yol.
06:19
and represent very different properties.
149
379507
1915
06:21
In other words, it's perfect for romantic matching.
150
381446
2413
Diğer bir ifadeyle romantik eşleştirme için mükemmel.
06:23
You've got wide ranges and you've got tons of different data points,
151
383883
3247
Geniş aralıklarınız ve tonlarca farklı veri göstergeniz var,
dediğim gibi filmler, politika, din -- her şey hakkında veri göstergeniz var.
06:27
like I said, about movies, politics, religion -- everything.
152
387154
3438
06:30
Intuitively, too, this makes sense.
153
390616
1838
Sezgisel olarak bu çok mantıklı.
06:32
Two people satisfying each other 50 percent
154
392478
2775
Yüzde 50 oranında birbirini tatmin eden iki insan
06:35
should be a better match than two others who satisfy 0 and 100,
155
395277
3952
0 ile 100 oranında tatmin eden diğer iki kişiden daha iyi bir eşleşme olmalı
06:39
because affection needs to be mutual.
156
399253
1814
çünkü sevgi karşılıklı olmalı.
06:41
After adding a little correction for margin of error,
157
401091
2491
Yanılma payı için biraz düzeltme ekledikten sonra,
06:43
in the case where we have a small number of questions,
158
403606
2571
bu durumda az sayıda sorumuz var,
06:46
like we do in this example,
159
406201
1317
bu örnekte yaptığımız gibi,
06:47
we're good to go.
160
407542
1172
devam edebiliriz.
06:48
Any time OkCupid matches two people,
161
408738
1912
OkCupid iki kişiyi her eşleştirdiğinde
06:50
it goes through the steps we just outlined.
162
410674
2032
henüz özetlediğimiz adımlardan geçiyor.
06:52
First it collects data about your answers,
163
412730
2269
İlk olarak cevaplarınız hakkındaki veriyi topluyor,
06:55
then it compares your choices and preferences to other people's
164
415023
2985
sonra tercihlerinizi ve diğer insanların tercihlerini
basit, matematiksel yollarla karşılaştırıyor.
06:58
in simple, mathematical ways.
165
418032
1967
07:00
This, the ability to take real-world phenomena
166
420023
2923
Bu, gerçek dünya olgusunu alıp
07:02
and make them something a microchip can understand,
167
422970
2415
onu bir mikroçipin anlayabileceği bir şeye dönüştürme kabiliyeti,
07:05
is, I think, the most important skill anyone can have these days.
168
425409
3277
bence birinin bu günlerde sahip olabileceği en önemli yetenek.
07:08
Like you use sentences to tell a story to a person,
169
428710
2423
Birine bir hikâye anlatmak için cümleleri kullandığınız gibi
07:11
you use algorithms to tell a story to a computer.
170
431157
2484
bilgisayara hikâye anlatmak için algoritmaları kullanıyorsunuz.
07:14
If you learn the language, you can go out and tell your stories.
171
434349
3033
Dili öğrenirseniz çıkıp hikâyelerinizi anlatabilirsiniz.
Umarım bu yardımcı olacak.
07:17
I hope this will help you do that.
172
437406
1753
Bu web sitesi hakkında

Bu site size İngilizce öğrenmek için yararlı olan YouTube videolarını tanıtacaktır. Dünyanın dört bir yanından birinci sınıf öğretmenler tarafından verilen İngilizce derslerini göreceksiniz. Videoyu oradan oynatmak için her video sayfasında görüntülenen İngilizce altyazılara çift tıklayın. Altyazılar video oynatımı ile senkronize olarak kayar. Herhangi bir yorumunuz veya isteğiniz varsa, lütfen bu iletişim formunu kullanarak bizimle iletişime geçin.

https://forms.gle/WvT1wiN1qDtmnspy7