How statistics can be misleading - Mark Liddell

1,427,995 views ・ 2016-01-14

TED-Ed


Videoyu oynatmak için lütfen aşağıdaki İngilizce altyazılara çift tıklayınız.

Çeviri: Selda Yener Gözden geçirme: Ahmet Mesut ATEŞ
00:06
Statistics are persuasive.
0
6636
2441
İstatistikler ikna edicidir.
00:09
So much so that people, organizations, and whole countries
1
9077
3464
Öyle ikna edici ki, insanlar, kurumlar ve bütün ülkeler
00:12
base some of their most important decisions on organized data.
2
12541
5206
en önemli bazı kararlarını düzenli bilgiye dayanarak alırlar.
00:17
But there's a problem with that.
3
17747
1737
Ancak burada bir sorun var.
00:19
Any set of statistics might have something lurking inside it,
4
19484
3817
İstatistik verilerinde gizlenmiş, sonuçları tamamen alt üst edebilecek
00:23
something that can turn the results completely upside down.
5
23301
3950
bir şeyler olabilir.
00:27
For example, imagine you need to choose between two hospitals
6
27251
3669
Örneğin, yaşlı bir akrabanızın ameliyatı için iki hastane arasında
00:30
for an elderly relative's surgery.
7
30920
2817
seçim yapmak zorunda olduğunuzu düşünün.
00:33
Out of each hospital's last 1000 patient's,
8
33737
2697
Her iki hastanenin de son 1000 hastasından,
00:36
900 survived at Hospital A,
9
36434
3178
A hastanesinde 900'ü hayatta kalırken
00:39
while only 800 survived at Hospital B.
10
39612
3409
B hastanesinde sadece 800 kişi sağ kalmış.
00:43
So it looks like Hospital A is the better choice.
11
43021
3149
O hâlde A hastanesi daha iyi bir seçim gibi görünüyor.
00:46
But before you make your decision,
12
46170
1673
Ancak karar vermeden önce
00:47
remember that not all patients arrive at the hospital
13
47843
3568
tüm hastaların hastaneye aynı sağlık durumunda
00:51
with the same level of health.
14
51411
2400
gelmediğini hatırlayın.
00:53
And if we divide each hospital's last 1000 patients
15
53811
2892
İki hastanenin de son 1000 hastasını
00:56
into those who arrived in good health and those who arrived in poor health,
16
56703
4429
sağlıklı gelenler ve sağlıksız gelenler olarak bölersek
01:01
the picture starts to look very different.
17
61132
2640
resim çok daha farklı görünmeye başlar.
01:03
Hospital A had only 100 patients who arrived in poor health,
18
63772
4077
A hastanesine sağlıksız durumda gelen sadece 100 hasta varken
01:07
of which 30 survived.
19
67849
2476
30'u kurtarılmıştır.
01:10
But Hospital B had 400, and they were able to save 210.
20
70325
4527
Fakat B hastanesinde 400 hastadan 210'u kurtarılmıştır.
01:14
So Hospital B is the better choice
21
74852
2317
O zaman B hastanesi
01:17
for patients who arrive at hospital in poor health,
22
77169
3572
ağır durumda gelen hastalar için %52,5 kurtulma oranıyla
01:20
with a survival rate of 52.5%.
23
80741
3785
daha iyi bir seçimdir.
01:24
And what if your relative's health is good when she arrives at the hospital?
24
84526
3919
Peki ya hastanızın sağlığı hastaneye vardığında iyiyse?
01:28
Strangely enough, Hospital B is still the better choice,
25
88445
3826
Garip gelebilir ama B hastanesi %98 hayatta kalma oranıyla
01:32
with a survival rate of over 98%.
26
92271
3405
yine daha iyi bir seçimdir.
01:35
So how can Hospital A have a better overall survival rate
27
95676
3057
Her iki gruptan hastalar için B hastanesi daha iyi kurtulma oranına sahipken
01:38
if Hospital B has better survival rates for patients in each of the two groups?
28
98733
6097
A hastanesi genelde nasıl daha iyi bir kurtulma orana sahip olabilir?
01:44
What we've stumbled upon is a case of Simpson's paradox,
29
104830
3759
Karşılaştığımız şey, gruplandırma şekline bağlı olarak
01:48
where the same set of data can appear to show opposite trends
30
108589
3310
aynı verilerin zıt eğilimler gösterebildiği
01:51
depending on how it's grouped.
31
111899
2765
Simpson paradoksudur.
01:54
This often occurs when aggregated data hides a conditional variable,
32
114664
4080
Bu durum genelde kümelenmiş bilgi koşullu bir değişkeni örttüğünde oluşur,
01:58
sometimes known as a lurking variable,
33
118744
2633
karışıklığa neden olan değişken olarak da bilinir,
02:01
which is a hidden additional factor that significantly influences results.
34
121377
5207
bu ise sonuçları önemli ölçüde etkileyen gizli bir ek faktördür.
02:06
Here, the hidden factor is the relative proportion of patients
35
126584
3439
Buradaki gizli faktör, sağlıklı ve sağlıksız gelen hastaların
02:10
who arrive in good or poor health.
36
130023
3241
göreceli oranıdır.
02:13
Simpson's paradox isn't just a hypothetical scenario.
37
133264
3280
Simpson paradoksu basit bir varsayımsal durum değildir.
02:16
It pops up from time to time in the real world,
38
136544
2380
Gerçek dünyada ara sıra,
02:18
sometimes in important contexts.
39
138924
3208
bazen önemli durumlarda ortaya çıkar.
02:22
One study in the UK appeared to show
40
142132
1998
Birleşik Krallık'ta yapılan bir araştırma
02:24
that smokers had a higher survival rate than nonsmokers
41
144130
3470
sigara içenlerin içmeyenlerden -yirmi yıldan fazla bir sürede-
02:27
over a twenty-year time period.
42
147600
2246
daha yüksek yaşama oranına sahip olduğunu gösteriyordu.
02:29
That is, until dividing the participants by age group
43
149846
3461
Katılımcıların yaş gruplarına bölünmesi,
02:33
showed that the nonsmokers were significantly older on average,
44
153307
4516
sigara içmeyenlerin önemli oranda ortalamadan yaşlı olduğunu
02:37
and thus, more likely to die during the trial period,
45
157823
3107
ve bu nedenle genel olarak daha uzun yaşadıkları için
02:40
precisely because they were living longer in general.
46
160930
3508
tam da deney sırasında ölmelerinin muhtemel olduğunu gösteriyordu.
02:44
Here, the age groups are the lurking variable,
47
164438
2848
Burada karışıklığa yol açan değişken yaş gruplarıdır ve
02:47
and are vital to correctly interpret the data.
48
167286
2890
veriyi doğru yorumlamada son derece önemlidir.
02:50
In another example,
49
170176
1383
Diğer bir örnekte ise
02:51
an analysis of Florida's death penalty cases
50
171559
2722
Florida'nın idam cezası davalarının analizi,
02:54
seemed to reveal no racial disparity in sentencing
51
174281
3984
cinayetten hükümlü siyahi ve beyaz zanlılar arasında
02:58
between black and white defendants convicted of murder.
52
178265
3316
ceza kararlarında ırksal eşitsizliğin olmadığını ortaya çıkarır.
03:01
But dividing the cases by the race of the victim told a different story.
53
181581
4815
Fakat davaları mağdurun ırkına göre ayırmak farklı bir tablo gösterir.
03:06
In either situation,
54
186396
1573
Her iki durumda da
03:07
black defendants were more likely to be sentenced to death.
55
187969
3122
siyahi davalıların idam cezası alması daha muhtemeldir.
03:11
The slightly higher overall sentencing rate for white defendants
56
191091
3975
Beyaz sanıkların genel ceza oranlarının nispeten yüksek olması,
03:15
was due to the fact that cases with white victims
57
195066
3626
mağdurların beyaz olduğu davalarda
03:18
were more likely to elicit a death sentence
58
198692
2667
idam cezasının çıkmasının,
03:21
than cases where the victim was black,
59
201359
2732
mağdurun siyahi olduğu davalardan daha muhtemel olması
03:24
and most murders occurred between people of the same race.
60
204091
4392
ve çoğu cinayetin aynı ırktan insanlar arasında olmasından dolayıydı.
03:28
So how do we avoid falling for the paradox?
61
208483
2836
Peki çelişkiye düşmekten nasıl kurtulabiliriz?
03:31
Unfortunately, there's no one-size-fits-all answer.
62
211319
3367
Ne yazık ki hepsine uyan bir cevap yok.
03:34
Data can be grouped and divided in any number of ways,
63
214686
3818
Veriler birçok şekilde gruplanıp kategoriye bölünebilir
03:38
and overall numbers may sometimes give a more accurate picture
64
218504
3602
ve genel rakamlar bazen yanıltıcı ve rastlantısal kategorilere
03:42
than data divided into misleading or arbitrary categories.
65
222106
4532
bölünen verilerden daha doğru bir tablo verir.
03:46
All we can do is carefully study the actual situations the statistics describe
66
226638
5451
Tek yapabileceğimiz, istatistiğin verdiği geçerli durumu
03:52
and consider whether lurking variables may be present.
67
232089
3888
iyi inceleyip karışıklığa neden olan değişkeni olup olmadığını düşünmektir.
03:55
Otherwise, we leave ourselves vulnerable to those who would use data
68
235977
3401
Aksi takdirde kendimizi, verileri başkalarını yönlendirmek ve
03:59
to manipulate others and promote their own agendas.
69
239378
3271
kendi çıkarlarını korumak için kullananlara karşı savunmasız bırakırız.
Bu web sitesi hakkında

Bu site size İngilizce öğrenmek için yararlı olan YouTube videolarını tanıtacaktır. Dünyanın dört bir yanından birinci sınıf öğretmenler tarafından verilen İngilizce derslerini göreceksiniz. Videoyu oradan oynatmak için her video sayfasında görüntülenen İngilizce altyazılara çift tıklayın. Altyazılar video oynatımı ile senkronize olarak kayar. Herhangi bir yorumunuz veya isteğiniz varsa, lütfen bu iletişim formunu kullanarak bizimle iletişime geçin.

https://forms.gle/WvT1wiN1qDtmnspy7