How statistics can be misleading - Mark Liddell

1,440,818 views ・ 2016-01-14

TED-Ed


Silakan klik dua kali pada teks bahasa Inggris di bawah ini untuk memutar video.

Translator: Hafizh Alfarisi Reviewer: Reno Kanti Riananda
00:06
Statistics are persuasive.
0
6636
2441
Statistik begitu memikat,
hingga orang, lembaga, dan seluruh negara
00:09
So much so that people, organizations, and whole countries
1
9077
3464
00:12
base some of their most important decisions on organized data.
2
12541
5206
menyandarkan keputusan pentingnya pada data terstruktur.
00:17
But there's a problem with that.
3
17747
1737
Namun, ada masalah di situ.
00:19
Any set of statistics might have something lurking inside it,
4
19484
3817
Kumpulan statistik bisa menyembunyikan sesuatu di dalamnya.
00:23
something that can turn the results completely upside down.
5
23301
3950
Sesuatu yang dapat membalikkan hasil sepenuhnya.
00:27
For example, imagine you need to choose between two hospitals
6
27251
3669
Misalnya, bayangkan kau perlu memilih
antara dua rumah sakit untuk operasi seorang kerabat lansia.
00:30
for an elderly relative's surgery.
7
30920
2817
00:33
Out of each hospital's last 1000 patient's,
8
33737
2697
Dari 1.000 pasien terakhir di tiap rumah sakit,
00:36
900 survived at Hospital A,
9
36434
3178
900 selamat di Rumah Sakit A,
00:39
while only 800 survived at Hospital B.
10
39612
3409
sedangkan hanya 800 yang selamat di Rumah Sakit B.
Rumah Sakit A terlihat sebagai pilihan tepat.
00:43
So it looks like Hospital A is the better choice.
11
43021
3149
Tapi sebelum membuat keputusan, ingatlah bahwa tidak semua pasien
00:46
But before you make your decision,
12
46170
1673
00:47
remember that not all patients arrive at the hospital
13
47843
3568
tiba di rumah sakit dengan kondisi kesehatan yang sama.
00:51
with the same level of health.
14
51411
2400
00:53
And if we divide each hospital's last 1000 patients
15
53811
2892
Bila 1.000 pasien terakhir dari tiap rumah sakit dibagi
00:56
into those who arrived in good health and those who arrived in poor health,
16
56703
4429
menjadi pasien yang masuk dengan kondisi baik dan buruk,
01:01
the picture starts to look very different.
17
61132
2640
gambarannya menjadi sangat berbeda.
01:03
Hospital A had only 100 patients who arrived in poor health,
18
63772
4077
Rumah Sakit A cuma punya 100 pasien yang tiba dengan kondisi buruk
01:07
of which 30 survived.
19
67849
2476
dan 30 pasiennya selamat.
01:10
But Hospital B had 400, and they were able to save 210.
20
70325
4527
Tapi Rumah Sakit B punya 400 pasien dan bisa menyelamatkan 210 pasien.
01:14
So Hospital B is the better choice
21
74852
2317
Rumah Sakit B jadi pilihan terbaik
01:17
for patients who arrive at hospital in poor health,
22
77169
3572
untuk pasien yang tiba dalam kondisi buruk,
01:20
with a survival rate of 52.5%.
23
80741
3785
dengan tingkat selamat 52,5%.
01:24
And what if your relative's health is good when she arrives at the hospital?
24
84526
3919
Apa jadinya bila kondisi kerabatmu baik saat tiba di rumah sakit?
01:28
Strangely enough, Hospital B is still the better choice,
25
88445
3826
Ajaibnya, Rumah Sakit B masih jadi pilihan terbaik
01:32
with a survival rate of over 98%.
26
92271
3405
dengan tingkat selamat di atas 98%.
01:35
So how can Hospital A have a better overall survival rate
27
95676
3057
Mengapa total tingkat selamat di Rumah Sakit A lebih baik
01:38
if Hospital B has better survival rates for patients in each of the two groups?
28
98733
6097
jika Rumah Sakit B punya tingkat selamat lebih baik di dua kelompok pasien?
01:44
What we've stumbled upon is a case of Simpson's paradox,
29
104830
3759
Yang kita temui ini adalah kasus paradoks Simpson
01:48
where the same set of data can appear to show opposite trends
30
108589
3310
di mana kumpulan data yang sama menunjukkan kecenderungan berlainan
01:51
depending on how it's grouped.
31
111899
2765
tergantung dari cara pengumpulannya.
01:54
This often occurs when aggregated data hides a conditional variable,
32
114664
4080
Hal ini terjadi saat data terkumpul menyembunyikan variabel bersyarat,
01:58
sometimes known as a lurking variable,
33
118744
2633
kadang dikenal sebagai variabel tersembunyi,
02:01
which is a hidden additional factor that significantly influences results.
34
121377
5207
Variabel ini menutupi faktor tambahan yang sangat memengaruhi hasil.
02:06
Here, the hidden factor is the relative proportion of patients
35
126584
3439
Di sini, faktor tersembunyinya adalah pembagian tak tentu dari pasien
02:10
who arrive in good or poor health.
36
130023
3241
yang tiba dalam kondisi baik atau buruk.
Paradoks Simpson bukan hanya kerangka hipotesis.
02:13
Simpson's paradox isn't just a hypothetical scenario.
37
133264
3280
02:16
It pops up from time to time in the real world,
38
136544
2380
Paradoks ini sesekali muncul di dunia nyata,
02:18
sometimes in important contexts.
39
138924
3208
kadang dalam konteks penting.
02:22
One study in the UK appeared to show
40
142132
1998
Studi di Inggris Raya menunjukkan
02:24
that smokers had a higher survival rate than nonsmokers
41
144130
3470
bila tingkat kelangsungan hidup perokok lebih tinggi dari nonperokok
02:27
over a twenty-year time period.
42
147600
2246
sekitar lebih 20 tahun.
02:29
That is, until dividing the participants by age group
43
149846
3461
Sampai akhirnya peserta dibagi berdasarkan umur.
02:33
showed that the nonsmokers were significantly older on average,
44
153307
4516
Ternyata rata-rata nonperokok lebih tua
02:37
and thus, more likely to die during the trial period,
45
157823
3107
dan karenanya, lebih mungkin wafat selama masa pengujian.
02:40
precisely because they were living longer in general.
46
160930
3508
Justru sebenarnya, mereka hidup lebih lama.
02:44
Here, the age groups are the lurking variable,
47
164438
2848
Di sini, kelompok usia menjadi variabel tersembunyi
02:47
and are vital to correctly interpret the data.
48
167286
2890
dan sangat penting untuk menjelaskan data dengan benar.
02:50
In another example,
49
170176
1383
Pada contoh lainnya, analisis kasus hukuman mati di Florida
02:51
an analysis of Florida's death penalty cases
50
171559
2722
02:54
seemed to reveal no racial disparity in sentencing
51
174281
3984
mengungkap tak adanya perbedaan ras dalam vonis
02:58
between black and white defendants convicted of murder.
52
178265
3316
antara terdakwa kulit hitam dan putih yang dihukum atas pembunuhan.
03:01
But dividing the cases by the race of the victim told a different story.
53
181581
4815
Namun, pembagian kasus sesuai ras korban mengungkap hal berbeda.
03:06
In either situation,
54
186396
1573
Tak peduli ras korbannya,
03:07
black defendants were more likely to be sentenced to death.
55
187969
3122
terdakwa kulit hitam lebih mungkin dihukum mati.
03:11
The slightly higher overall sentencing rate for white defendants
56
191091
3975
Total tingkat hukuman sedikit lebih tinggi bagi terdakwa kulit putih
03:15
was due to the fact that cases with white victims
57
195066
3626
karena kasus mereka terhadap korban kulit putih
03:18
were more likely to elicit a death sentence
58
198692
2667
lebih mungkin diganjar hukuman mati ketimbang jika korbannya kulit hitam.
03:21
than cases where the victim was black,
59
201359
2732
Dan kebanyakan pembunuhan terjadi antara orang dengan ras yang sama.
03:24
and most murders occurred between people of the same race.
60
204091
4392
03:28
So how do we avoid falling for the paradox?
61
208483
2836
Jadi, bagaimana cara menghindari jebakan paradoks ini?
03:31
Unfortunately, there's no one-size-fits-all answer.
62
211319
3367
Sayangnya, tidak ada jawaban pasti.
03:34
Data can be grouped and divided in any number of ways,
63
214686
3818
Data bisa dikelompokkan dan dibagi dalam berbagai cara.
03:38
and overall numbers may sometimes give a more accurate picture
64
218504
3602
Keseluruhan angka kadang memberi gambaran tepat
03:42
than data divided into misleading or arbitrary categories.
65
222106
4532
daripada data yang dibagi ke kategori yang menyesatkan atau secara acak.
03:46
All we can do is carefully study the actual situations the statistics describe
66
226638
5451
Kita hanya bisa lebih teliti mengamati kondisi sebenarnya dari gambaran statistik
03:52
and consider whether lurking variables may be present.
67
232089
3888
dan meninjau apakah variabel tersembunyi ada di dalamnya.
03:55
Otherwise, we leave ourselves vulnerable to those who would use data
68
235977
3401
Jika tidak, kita membiarkan diri terhasut oleh mereka yang memakai data
03:59
to manipulate others and promote their own agendas.
69
239378
3271
untuk mengelabui orang-orang dan menyebarkan kepentingan mereka.
Tentang situs web ini

Situs ini akan memperkenalkan Anda pada video YouTube yang berguna untuk belajar bahasa Inggris. Anda akan melihat pelajaran bahasa Inggris yang diajarkan oleh guru-guru terbaik dari seluruh dunia. Klik dua kali pada subtitle bahasa Inggris yang ditampilkan di setiap halaman video untuk memutar video dari sana. Subtitle bergulir selaras dengan pemutaran video. Jika Anda memiliki komentar atau permintaan, silakan hubungi kami menggunakan formulir kontak ini.

https://forms.gle/WvT1wiN1qDtmnspy7