How statistics can be misleading - Mark Liddell

1,435,666 views ・ 2016-01-14

TED-Ed


Please double-click on the English subtitles below to play the video.

Translator: Rezhin Ahmad Reviewer: Daban Q. Jaff
00:06
Statistics are persuasive.
0
6636
2441
ئامارەکان قایلکەرن.
00:09
So much so that people, organizations, and whole countries
1
9077
3464
ئەوەندە خەڵکەو، رێکخراوەکان، و هەموو وڵاتان
00:12
base some of their most important decisions on organized data.
2
12541
5206
هەندێک لە بڕیارە زۆر گرینگەکانیان لەسەر داتای ڕێکخراوەکانە.
00:17
But there's a problem with that.
3
17747
1737
بەڵام کێشەیەک هەیە لەگەڵ ئەوە.
00:19
Any set of statistics might have something lurking inside it,
4
19484
3817
هەر کۆمەڵە ئامارێک لەوانەیە شتێکی هەبێت کە لە ناویدا خۆی شاردۆتەوە،
00:23
something that can turn the results completely upside down.
5
23301
3950
شتێک کە دەتوانێت ئەنجامەکان بەتەواوی پێچەوانە بکاتەوە
00:27
For example, imagine you need to choose between two hospitals
6
27251
3669
بۆ نموونە،بیهێنە پێش چاوت کە پێویستە لە نێوان دوو نەخۆشخانەدا دانەیەک هەڵبژێری
00:30
for an elderly relative's surgery.
7
30920
2817
بۆ نەشتەرگەری خزمێکی بەتەمەنت.
00:33
Out of each hospital's last 1000 patient's,
8
33737
2697
لەدەرەوەی هەر نەخۆشخانەیەک ١٠٠٠ نەخۆش بوون،
00:36
900 survived at Hospital A,
9
36434
3178
900 کەس لە نەخۆشخانەی ئەی ڕزگاریان بوو،
00:39
while only 800 survived at Hospital B.
10
39612
3409
لە کاتێکدا تەنها 800 کەس لە نەخۆشخانەی بی رزگاریان بوو.
00:43
So it looks like Hospital A is the better choice.
11
43021
3149
بۆیە پێدەچێت هەڵبژاردەی نەخۆشخانەی ئەی باشتربێت.
00:46
But before you make your decision,
12
46170
1673
بەڵام پێش ئەوەی بڕیاری خۆت بدەیت،
00:47
remember that not all patients arrive at the hospital
13
47843
3568
ئەوەت لە یاد بێت کە هەموو نەخۆشەکان ناگەنە نەخۆشخانه
00:51
with the same level of health.
14
51411
2400
لەگەڵ هەمان ئاستی تەندروستیدا.
00:53
And if we divide each hospital's last 1000 patients
15
53811
2892
و ئەگەر هەر نەخۆشخانەیەک دابەش بکەین بۆ 1000 نەخۆش
00:56
into those who arrived in good health and those who arrived in poor health,
16
56703
4429
بۆ ئەوانەی کە بە تەندروستییەکی باش گەیشتن و ئەوانەی کە بە تەندرووستیەکی خراپ گەیشتن،
01:01
the picture starts to look very different.
17
61132
2640
وێنەکە زۆر جیاواز دەردەکەوێ.
01:03
Hospital A had only 100 patients who arrived in poor health,
18
63772
4077
نەخۆشخانەی ئەی تەنها 100 نەخۆشی هەبوو کە بە تەندروستییەکی خراپەوە گەشتن
01:07
of which 30 survived.
19
67849
2476
کە 30 یان ڕزگاریان بووە.
01:10
But Hospital B had 400, and they were able to save 210.
20
70325
4527
بەڵام نەخۆشخانەی بی 400 نەخۆش بوو و توانییان 210 نەخۆش ڕزگار بکەن.
01:14
So Hospital B is the better choice
21
74852
2317
کەواتە هەڵبژاردەی نەخۆشخانەی بی باشترە
01:17
for patients who arrive at hospital in poor health,
22
77169
3572
بۆ ئەو نەخۆشانەی کە دەگەنە نەخۆشخانە بە تەندروستییەکی خراپەوە،
01:20
with a survival rate of 52.5%.
23
80741
3785
بە ڕێژەی مانەوە لە 52.5%.
01:24
And what if your relative's health is good when she arrives at the hospital?
24
84526
3919
ئەی چی ئەگەر تەندروستی خزمەکەت باشبێت کاتێک دەگاتە نەخۆشخانە؟
01:28
Strangely enough, Hospital B is still the better choice,
25
88445
3826
سەیر ئەوەیە کە نەخۆشخانەی بی هێشتا هەڵبژاردەی باشترە،
01:32
with a survival rate of over 98%.
26
92271
3405
کە ڕێژەی مانەوەیان لە 98% زیاتر بووە.
01:35
So how can Hospital A have a better overall survival rate
27
95676
3057
کەواتە چۆن نەخۆشخانەی ئەی بە گشتی ڕێژەی مانەوە باشتر دەبێت
01:38
if Hospital B has better survival rates for patients in each of the two groups?
28
98733
6097
ئەگەر نەخۆشخانەی بی ڕێژەی مانەوەی باشتربێ بۆ نەخۆشەکان لە هەر یەکێک لەو دوو گروپەدا؟
01:44
What we've stumbled upon is a case of Simpson's paradox,
29
104830
3759
ئەوەی کە ئێمە کەوتوینە سەر ئەو حاڵەتە لە پارادۆکسەکەی سیمپسۆن،
01:48
where the same set of data can appear to show opposite trends
30
108589
3310
هەمان کۆمەڵەی داتاکان دەتوانن دەرکەون بۆ نیشاندانی ئاراستەی پێچەوانە
01:51
depending on how it's grouped.
31
111899
2765
بە پشت بەستن بە چۆنیەتی گروپ کردن.
01:54
This often occurs when aggregated data hides a conditional variable,
32
114664
4080
ئەمە زۆرجار روودەدات کاتێک داتای کۆکراوە گۆڕاوێکی مەرجدراو دەشارێتەوە،
01:58
sometimes known as a lurking variable,
33
118744
2633
هەندێک جار بە گۆڕاوێکی ناڕوون ناسراوە،
02:01
which is a hidden additional factor that significantly influences results.
34
121377
5207
کە ئەمەش هۆکارێکی زیادەی شاراوەیە کە کاریگەری زۆری لەسەر ئەنجامەکان هەیە.
02:06
Here, the hidden factor is the relative proportion of patients
35
126584
3439
لێرەدا، فاکتەرێکی شاراوە ڕێژەیی ڕێژەی نەخۆشەکانە
02:10
who arrive in good or poor health.
36
130023
3241
کە بە تەندروستیەکی باش یان خراپ دەگەن.
02:13
Simpson's paradox isn't just a hypothetical scenario.
37
133264
3280
پارادۆکسی سیمپسۆن تەنها سیناریۆی گریمانەیی نییە.
02:16
It pops up from time to time in the real world,
38
136544
2380
لەکاتی جیاواز بەرز دەبێتەوە لەجیهانێکی ڕاستەقینەدا،
02:18
sometimes in important contexts.
39
138924
3208
هەندێک جار لە چەند بوارێکی گرنگدا،
02:22
One study in the UK appeared to show
40
142132
1998
لێکۆڵینەوەیەکی بەریتانی دەرکەوت بۆ دەرخستنی
02:24
that smokers had a higher survival rate than nonsmokers
41
144130
3470
ئەوەی کە جگەرەکێشەکان ڕێژەی مانەوەیان بەرزتر بوو لە جگەرە نەکێشەکان
02:27
over a twenty-year time period.
42
147600
2246
زیاتر لە ماوەی بیست ساڵدا.
02:29
That is, until dividing the participants by age group
43
149846
3461
یانی تا دابەش کردنی بەشداربووان لەلایەن گرووپی تەمەنەوە
02:33
showed that the nonsmokers were significantly older on average,
44
153307
4516
نیشانی دا کە جگەرە نەکێشەکان بە شێوەیەکی بەرچاو بەتەمەن تر بوون،
02:37
and thus, more likely to die during the trial period,
45
157823
3107
و بەم شێوەیە، زیاتر لە ماوەی دادگاییکردندا دەمرن
02:40
precisely because they were living longer in general.
46
160930
3508
بە وردی لەبەرئەوەی ئەوان بە گشتی زیاتر دەژیان.
02:44
Here, the age groups are the lurking variable,
47
164438
2848
لێرە گروپە بە تەمەنەکان ئەوانە گۆڕاوی ناڕوونن،
02:47
and are vital to correctly interpret the data.
48
167286
2890
و زۆر گرنگە بۆ ڕاست لێکدانەوەی داتاکان.
02:50
In another example,
49
170176
1383
لە نموونەیەکی تردا،
02:51
an analysis of Florida's death penalty cases
50
171559
2722
شیکردنەوەیەک بۆ کەیسەکانی سزای لە سێدارەدانی فلۆریدا
02:54
seemed to reveal no racial disparity in sentencing
51
174281
3984
وادیار بوو دەریدەخات کە هیچ جیاوازییەکی ڕەگەزی نییە لە سزاداندا
02:58
between black and white defendants convicted of murder.
52
178265
3316
لە نێوان تاوانبارە ڕەش و سپیەکان بە تاوانی کوشتن تاوانبار کراوە.
03:01
But dividing the cases by the race of the victim told a different story.
53
181581
4815
به ڵام به شکردنی کەیس کە بەهۆی پێشبرکێکەوە قوربانیەکە چیرۆکێکی جیاوازی باس کرد
03:06
In either situation,
54
186396
1573
لە هەر بارێکدا،
03:07
black defendants were more likely to be sentenced to death.
55
187969
3122
تاوانبارە ڕەشپێستەکان زیاتر لە سزای لە سێدارەدان بدرێن.
03:11
The slightly higher overall sentencing rate for white defendants
56
191091
3975
بەگشتی ڕێژەی سزای بەرگریکارە سپی پێستەکان کەمێک زیاترە
03:15
was due to the fact that cases with white victims
57
195066
3626
بەهۆی ئەوەوە بوو کە حاڵەتەکان لەگەڵ قوربانیانی سپی
03:18
were more likely to elicit a death sentence
58
198692
2667
زیاتربوو بۆ ئەوەی سزای مردن دەربکات
03:21
than cases where the victim was black,
59
201359
2732
لەو حاڵەتانەی کە قوربانیەکە ڕەش پێست بووە،
03:24
and most murders occurred between people of the same race.
60
204091
4392
و زۆربەی کوشتنەکان لە نێوان خەڵکی هەمان ڕەگەزن.
03:28
So how do we avoid falling for the paradox?
61
208483
2836
چۆن خۆمان بە دوور بگرین لە ناکۆکییەکان؟
03:31
Unfortunately, there's no one-size-fits-all answer.
62
211319
3367
بەداخەوە، هیچ وەڵامێکی گونجاو نییە.
03:34
Data can be grouped and divided in any number of ways,
63
214686
3818
داتاکان دەتوانرێن بکرێنە گروپ و دابەش بکرێن لە هەر ڕێگایەکەوە بێت،
03:38
and overall numbers may sometimes give a more accurate picture
64
218504
3602
و لەوانەیە هەندێک جار ژمارەکان وێنەیەکی وردتر بدەن
03:42
than data divided into misleading or arbitrary categories.
65
222106
4532
لەوەی کە داتا دابەش کراون بۆ چەواشەکردن یان پۆلێنی هەڕەمەکی.
03:46
All we can do is carefully study the actual situations the statistics describe
66
226638
5451
هەموو ئەوەی دەتوانین بیکەین ئەوەیە بەوردی حاڵەتی ڕاستەقینەی ئامارەکان باس بکەین
03:52
and consider whether lurking variables may be present.
67
232089
3888
و ڕەچاوی ئەوە بکە لەوانەیە گۆڕانکاریەکی شاراوە دەرکەوێت
03:55
Otherwise, we leave ourselves vulnerable to those who would use data
68
235977
3401
ئەگینا خۆمان بێ دەسەڵات نیشان دەدەین بەرامبەر ئەوانەی داتا بەکاردێنن
03:59
to manipulate others and promote their own agendas.
69
239378
3271
بۆ یاری کردن بەوانیترو بەرزکردنەوەی کارنامەی خۆیان
About this website

This site will introduce you to YouTube videos that are useful for learning English. You will see English lessons taught by top-notch teachers from around the world. Double-click on the English subtitles displayed on each video page to play the video from there. The subtitles scroll in sync with the video playback. If you have any comments or requests, please contact us using this contact form.

https://forms.gle/WvT1wiN1qDtmnspy7