How statistics can be misleading - Mark Liddell

1,435,666 views ・ 2016-01-14

TED-Ed


لطفا برای پخش فیلم روی زیرنویس انگلیسی زیر دوبار کلیک کنید.

Translator: soheila Jafari Reviewer: Hajar Almasi
00:06
Statistics are persuasive.
0
6636
2441
علمِ آمار متقاعد کننده است.
00:09
So much so that people, organizations, and whole countries
1
9077
3464
آنقدر که افراد، سازمان ها، و تمامی کشورها
00:12
base some of their most important decisions on organized data.
2
12541
5206
برخی از تصمیمات بسیار مهمشان را بر پایه داده های طبقه بندی شده می گذارند.
00:17
But there's a problem with that.
3
17747
1737
ولی این یک ایراد دارد.
00:19
Any set of statistics might have something lurking inside it,
4
19484
3817
هر مجموعه آماری ممکن است چیزی در خفا در خود داشته باشد،
00:23
something that can turn the results completely upside down.
5
23301
3950
چیزی که ممکن است نتایج را بکلی تغییر دهد.
00:27
For example, imagine you need to choose between two hospitals
6
27251
3669
بعنوان مثال، تصور کنید که باید از بین دو بیمارستان یکی را
00:30
for an elderly relative's surgery.
7
30920
2817
را برای جراحی یک خویشاوند مُسن انتخاب کنید.
00:33
Out of each hospital's last 1000 patient's,
8
33737
2697
از ۱٫۰۰۰ نفر بیمار اخیر هر بیمارستان،
00:36
900 survived at Hospital A,
9
36434
3178
۹۰۰ نفر در بیمارستان الف جان بدر بردند،
00:39
while only 800 survived at Hospital B.
10
39612
3409
در حالیکه در بیمارستان ب ۸۰۰ نفر زنده ماندند.
00:43
So it looks like Hospital A is the better choice.
11
43021
3149
پس بنظر می آید که بیمارستان الف گزینه بهتری است.
00:46
But before you make your decision,
12
46170
1673
ولی قبل از اینکه تصمیم بگیرید،
00:47
remember that not all patients arrive at the hospital
13
47843
3568
بخاطر داشته باشید که همه بیماران با سلامت یکسان
00:51
with the same level of health.
14
51411
2400
به بیمارستان آورده نشده اند.
00:53
And if we divide each hospital's last 1000 patients
15
53811
2892
و اگر ۱٫۰۰۰ بیمار اخیر هر بیمارستان را به دو گروه تقسیم کنیم
00:56
into those who arrived in good health and those who arrived in poor health,
16
56703
4429
آنهایی که به سلامت خوبی آمدند، و اونهایی که با سلامت کم آمده اند،
01:01
the picture starts to look very different.
17
61132
2640
تصویر بسیار متفاوتی بنظر می آید.
01:03
Hospital A had only 100 patients who arrived in poor health,
18
63772
4077
بیمارستان الف تنها ۱۰۰ بیمار با سلامت کم داشته است، که
01:07
of which 30 survived.
19
67849
2476
۳۰ تا از آنها زنده ماندند.
01:10
But Hospital B had 400, and they were able to save 210.
20
70325
4527
اما بیمارستان ب ۴۰۰ تا داشته، که توانستن ۲۱۰ تا را نجات دهد.
01:14
So Hospital B is the better choice
21
74852
2317
پس بیمارستان ب گزینه بهتریست برای
01:17
for patients who arrive at hospital in poor health,
22
77169
3572
بیمارانی که با شرایط سلامتی ضعیف می رسند،
01:20
with a survival rate of 52.5%.
23
80741
3785
با نرخ حیات ۵۲/۵ %.
01:24
And what if your relative's health is good when she arrives at the hospital?
24
84526
3919
و اگر حال خویشاوند شما وقتی به بیمارستان می رسد خوب باشد چطور؟
01:28
Strangely enough, Hospital B is still the better choice,
25
88445
3826
شگفت آور اینکه، بیمارستان ب هنوز گزینه بهتری است،
01:32
with a survival rate of over 98%.
26
92271
3405
با نرخ نجات بالای ۹۸%.
01:35
So how can Hospital A have a better overall survival rate
27
95676
3057
پس چطور بیمارستان الف می تواند نرخ بقای کلی بهتری داشته باشد
01:38
if Hospital B has better survival rates for patients in each of the two groups?
28
98733
6097
اگر بیمارستان ب برای بیماران در هر یک از گروه نرخ بقای بهتری دارد؟
01:44
What we've stumbled upon is a case of Simpson's paradox,
29
104830
3759
چیزی که ما به آن مواجهیم موردی از پاردوکس سیمسون است،
01:48
where the same set of data can appear to show opposite trends
30
108589
3310
جایی که مجموعه داده های یکسان می توانند روند متضاد نشان دهند،
01:51
depending on how it's grouped.
31
111899
2765
بسته به آنکه چگونه دسته بندی شده اند.
01:54
This often occurs when aggregated data hides a conditional variable,
32
114664
4080
این اغلب وقتی رخ می دهد که انبوه داده ها یک متغیر مشروط را پنهان کرده اند،
01:58
sometimes known as a lurking variable,
33
118744
2633
چیزی که به متغیر مخفی شناخته می شود،
02:01
which is a hidden additional factor that significantly influences results.
34
121377
5207
که یک فاکتور نهانی اضافی است که نتایج را بطور چشمگیری تحت تاثیر قرار می دهد.
02:06
Here, the hidden factor is the relative proportion of patients
35
126584
3439
در اینجا، فاکتور پنهان نسبت سهم بیمارانی است که
02:10
who arrive in good or poor health.
36
130023
3241
با حالِ خوب یا بد حال به بیمارستان می رسند.
02:13
Simpson's paradox isn't just a hypothetical scenario.
37
133264
3280
پاردوکس سیمسون فقط یک سناریو فرضی نیست.
02:16
It pops up from time to time in the real world,
38
136544
2380
گاه به گاه در دنیا واقعی سر می زند،
02:18
sometimes in important contexts.
39
138924
3208
بضی اوقات در زمینه های مهم.
02:22
One study in the UK appeared to show
40
142132
1998
یک مطالعه در بریتانیا اینطور نشان می داد
02:24
that smokers had a higher survival rate than nonsmokers
41
144130
3470
که سیگاری ها بیشتر از غیر سیگاری ها شانس زنده ماندن دارند
02:27
over a twenty-year time period.
42
147600
2246
در یک دوره ۲۰ ساله.
02:29
That is, until dividing the participants by age group
43
149846
3461
تقسیم شرکت کنندگان در گروه‌های سنی
02:33
showed that the nonsmokers were significantly older on average,
44
153307
4516
نشان می‌دهد که افراد غیرسیگاری بطور چشمگیری مسن‌تر از متوسط افراد هستند،
02:37
and thus, more likely to die during the trial period,
45
157823
3107
و در نتیجه ممکن هست که در دوره این بررسی فوت کنند،
02:40
precisely because they were living longer in general.
46
160930
3508
دقیقا به دلیل اینکه آنها زندگی طولانی‌تر داشته‌اند.
02:44
Here, the age groups are the lurking variable,
47
164438
2848
در اینجا، گروه های سنی در خفا مانده،
02:47
and are vital to correctly interpret the data.
48
167286
2890
و تفسیر درست داده ها حیاتی است.
02:50
In another example,
49
170176
1383
در مثال دیگری،
02:51
an analysis of Florida's death penalty cases
50
171559
2722
تحلیلی در مورد حکم های اعدام در فلوریدا
02:54
seemed to reveal no racial disparity in sentencing
51
174281
3984
نشان می‌دهد که هیچ اختلاف نژادی در صدور حکم
02:58
between black and white defendants convicted of murder.
52
178265
3316
بین متهمین سفید پوست و سیاه پوست محکوم به اعدام وجود ندارد.
03:01
But dividing the cases by the race of the victim told a different story.
53
181581
4815
اما جداسازی پروندهای با نژاد قربانیان داستان دیگری را بیان می‌کند.
03:06
In either situation,
54
186396
1573
در هر دو وضعیت،
03:07
black defendants were more likely to be sentenced to death.
55
187969
3122
حکم اعدام بیشتری برای متهمین سیاه پوست صادر شده است.
03:11
The slightly higher overall sentencing rate for white defendants
56
191091
3975
در کل نرخ حکم اعدام برای متهمین سفید پوست کمی بیشتر بوده
03:15
was due to the fact that cases with white victims
57
195066
3626
بر پایه این واقعیت که قربانی‌های آنها سفید پوست بودند
03:18
were more likely to elicit a death sentence
58
198692
2667
تا اینکه حکم اعدام برای مواردی که قربانی‌های آنها سیاه پوست بوده اند،
03:21
than cases where the victim was black,
59
201359
2732
( اگر قربانی‌ها سفید‌پوست بود حکم اعدام بیشتری صادر می‌شد تا اگر سیاه‌‌پوست بود)
03:24
and most murders occurred between people of the same race.
60
204091
4392
ضمن اینکه بیشتر قتل‌ها بین افراد هم‌نژاد اتفاق می‌افتد.
03:28
So how do we avoid falling for the paradox?
61
208483
2836
خُب چگونه می‌توان از افتادن در این تناقضات اجتناب کنیم؟
03:31
Unfortunately, there's no one-size-fits-all answer.
62
211319
3367
متاسفانه، پاسخ مناسبی برای این وجود ندارد.
03:34
Data can be grouped and divided in any number of ways,
63
214686
3818
داده‌ها می‌توانند به روش‌های متعددی دسته‌بندی و تقسیم‌بندی شوند،
03:38
and overall numbers may sometimes give a more accurate picture
64
218504
3602
و تعداد کلی ممکن است گاهی یک تصویر دقیق‌تری را ارائه دهد
03:42
than data divided into misleading or arbitrary categories.
65
222106
4532
تا تقسیم‌بندی گمراه‌ کننده و یا دسته‌های دلخواه داده‌ها.
03:46
All we can do is carefully study the actual situations the statistics describe
66
226638
5451
آنچه که می‌توانیم بکنیم این است که به دقت وضعیت‌های واقعی آمارها را مطالعه کنیم
03:52
and consider whether lurking variables may be present.
67
232089
3888
و نظر گرفتن اینکه آیا متغیرهای پنهانی ممکن است وجود داشته باشد.
03:55
Otherwise, we leave ourselves vulnerable to those who would use data
68
235977
3401
در غیر این صورت، خودمان را در مقابل کسانی که ازاین داده‌ها برای
03:59
to manipulate others and promote their own agendas.
69
239378
3271
گول زدن مردم و ترویج برنامه‌هایشان از آنها استفاده می‌کنند آسیب‌پذیر می‌کنیم.
درباره این وب سایت

این سایت ویدیوهای یوتیوب را به شما معرفی می کند که برای یادگیری زبان انگلیسی مفید هستند. دروس انگلیسی را خواهید دید که توسط معلمان درجه یک از سراسر جهان تدریس می شود. روی زیرنویس انگلیسی نمایش داده شده در هر صفحه ویدیو دوبار کلیک کنید تا ویدیو از آنجا پخش شود. زیرنویس‌ها با پخش ویدیو همگام می‌شوند. اگر نظر یا درخواستی دارید، لطفا با استفاده از این فرم تماس با ما تماس بگیرید.

https://forms.gle/WvT1wiN1qDtmnspy7