How statistics can be misleading - Mark Liddell

איך סטטיסטיקות יכולות להטעות - מארק לידל

1,427,995 views

2016-01-14 ・ TED-Ed


New videos

How statistics can be misleading - Mark Liddell

איך סטטיסטיקות יכולות להטעות - מארק לידל

1,427,995 views ・ 2016-01-14

TED-Ed


אנא לחץ פעמיים על הכתוביות באנגלית למטה כדי להפעיל את הסרטון.

תרגום: Ido Dekkers עריכה: Tal Dekkers
00:06
Statistics are persuasive.
0
6636
2441
סטטיסטיקות הן משכנעות.
00:09
So much so that people, organizations, and whole countries
1
9077
3464
כל כך שאנשים, ארגונים, ומדינות שלמות
00:12
base some of their most important decisions on organized data.
2
12541
5206
מבססות את ההחלטות הכי חשובות שלהן על מידע מאורגן.
00:17
But there's a problem with that.
3
17747
1737
אבל יש בעיה עם זה.
00:19
Any set of statistics might have something lurking inside it,
4
19484
3817
בכל סט של סטטיסטיקות יכול להיות משהו שאורב בתוכו,
00:23
something that can turn the results completely upside down.
5
23301
3950
משהו שיכול להפוך את התוצאות לגמרי.
00:27
For example, imagine you need to choose between two hospitals
6
27251
3669
לדוגמה, דמיינו שאתם צריכים לבחור בין שני בתי חולים
00:30
for an elderly relative's surgery.
7
30920
2817
לניתוח של קרובה מבוגרת.
00:33
Out of each hospital's last 1000 patient's,
8
33737
2697
מתוך 1000 החולים האחרונים של כל בית חולים,
00:36
900 survived at Hospital A,
9
36434
3178
900 שרדו בבית חולים א',
00:39
while only 800 survived at Hospital B.
10
39612
3409
בעוד רק 800 שרדו בבית חולים ב'.
00:43
So it looks like Hospital A is the better choice.
11
43021
3149
אז נראה כאילו בית חולים א' הוא הבחירה הטובה יותר.
00:46
But before you make your decision,
12
46170
1673
אבל לפני שתעשו החלטה,
00:47
remember that not all patients arrive at the hospital
13
47843
3568
זכרו שלא כל החולים מגיעים לבית החולים
00:51
with the same level of health.
14
51411
2400
עם אותה רמה של בריאות.
00:53
And if we divide each hospital's last 1000 patients
15
53811
2892
ואם נחלק את כל 1000 החולים האחרונים של בתי החולים
00:56
into those who arrived in good health and those who arrived in poor health,
16
56703
4429
לאלה שהגיעו בבריאות טובה ואלה שהגיעו בבריאות גרועה,
01:01
the picture starts to look very different.
17
61132
2640
התמונה מתחילה להראות מאוד שונה.
01:03
Hospital A had only 100 patients who arrived in poor health,
18
63772
4077
לבית חולים א' היו רק 100 חולים שהגיעו בבריאות ירודה,
01:07
of which 30 survived.
19
67849
2476
מתוכם 30 שרדו.
01:10
But Hospital B had 400, and they were able to save 210.
20
70325
4527
אבל לבית חולים ב' הגיעו 400, והם הצליחו להציל 210.
01:14
So Hospital B is the better choice
21
74852
2317
אז בית חולים ב' הוא הבחירה הטובה יותר
01:17
for patients who arrive at hospital in poor health,
22
77169
3572
לחולים שמגיעים עם בריאות ירודה,
01:20
with a survival rate of 52.5%.
23
80741
3785
עם יחס השרדות של 52.5%.
01:24
And what if your relative's health is good when she arrives at the hospital?
24
84526
3919
ומה אם בריאות הקרובה שלכם היא טובה כשהיא מגיעה לבית החולים?
01:28
Strangely enough, Hospital B is still the better choice,
25
88445
3826
למרבה הפלא, בית חולים ב' הוא עדיין הבחירה הטובה,
01:32
with a survival rate of over 98%.
26
92271
3405
עם יחס השרדות של יותר מ 98%.
01:35
So how can Hospital A have a better overall survival rate
27
95676
3057
אז איך בית חולים א' יכול להיות טוב יותר בסך הכל באחוז ההשרדות
01:38
if Hospital B has better survival rates for patients in each of the two groups?
28
98733
6097
אם לבית חולים ב' יש אחוז השרדות גבוה יותר לחולים משתי הקבוצות?
01:44
What we've stumbled upon is a case of Simpson's paradox,
29
104830
3759
מה שנתקלנו בו הוא מקרה של פרדוקס סימפסון,
01:48
where the same set of data can appear to show opposite trends
30
108589
3310
בו אותו סט של מידע יכול להראות מגמות הפוכות
01:51
depending on how it's grouped.
31
111899
2765
תלוי באיך מקבצים אותו.
01:54
This often occurs when aggregated data hides a conditional variable,
32
114664
4080
זה הרבה פעמים קורה כשמידע מקובץ מחביא משתנה תלוי,
01:58
sometimes known as a lurking variable,
33
118744
2633
ולפעמים ידוע כמשתנה אורב,
02:01
which is a hidden additional factor that significantly influences results.
34
121377
5207
שהוא גורם חבוי נוסף שמשפיע באופן משמעותי על התוצאות.
02:06
Here, the hidden factor is the relative proportion of patients
35
126584
3439
פה, הגורם החבוי הוא היחס של החולים
02:10
who arrive in good or poor health.
36
130023
3241
שמגיעים בבריאות טובה או ירודה.
02:13
Simpson's paradox isn't just a hypothetical scenario.
37
133264
3280
פרדוקס סימפסון הוא לא רק מצב היפוטטי.
02:16
It pops up from time to time in the real world,
38
136544
2380
הוא מופיע מדי פעם בעולם האמיתי,
02:18
sometimes in important contexts.
39
138924
3208
לפעמים בהקשרים חשובים.
02:22
One study in the UK appeared to show
40
142132
1998
מחקר אחד באנגליה הראה
02:24
that smokers had a higher survival rate than nonsmokers
41
144130
3470
שלמעשנים יש שיעור השרדות גבוה יותר מלא מעשנים
02:27
over a twenty-year time period.
42
147600
2246
במשך תקופת זמן של עשרים שנה.
02:29
That is, until dividing the participants by age group
43
149846
3461
זה אומר, עד שמחלקים את המשתתפים לפי קבוצת גיל
02:33
showed that the nonsmokers were significantly older on average,
44
153307
4516
שמראה שלא מעשנים היו מבוגרים משמעותית בממוצע,
02:37
and thus, more likely to die during the trial period,
45
157823
3107
ולכן, יש סיכוי גבוה יותר שימותו במהלך הניסוי,
02:40
precisely because they were living longer in general.
46
160930
3508
בדיוק בגלל שהם חיים יותר באופן כללי.
02:44
Here, the age groups are the lurking variable,
47
164438
2848
פה, קבוצת הגיל הוא משתנה חבוי,
02:47
and are vital to correctly interpret the data.
48
167286
2890
והוא חיוני לפרש במדויק את המידע.
02:50
In another example,
49
170176
1383
בדוגמה אחרת,
02:51
an analysis of Florida's death penalty cases
50
171559
2722
אנליזה של מקרי עונש המוות של פלורידה
02:54
seemed to reveal no racial disparity in sentencing
51
174281
3984
נראו שהם מגלים שאין אפליה גזענית בשפיטה
02:58
between black and white defendants convicted of murder.
52
178265
3316
בין נאשמים שחורים ללבנים שהורשעו ברצח.
03:01
But dividing the cases by the race of the victim told a different story.
53
181581
4815
אבל חלוקת המקרים לפי גזע הקורבן מספרת סיפור שונה.
03:06
In either situation,
54
186396
1573
בכל מצב,
03:07
black defendants were more likely to be sentenced to death.
55
187969
3122
נאשמים שחורים היו בסבירות גבוהה יותר להשפט למוות.
03:11
The slightly higher overall sentencing rate for white defendants
56
191091
3975
רמות השפיטה הגבוהות מעט לנאשמים לבנים
03:15
was due to the fact that cases with white victims
57
195066
3626
היו בשל העובדה שמקרים עם קורבנות לבנים
03:18
were more likely to elicit a death sentence
58
198692
2667
היו בסיכוי גבוה יותר להסתיים בעונש מוות
03:21
than cases where the victim was black,
59
201359
2732
מאשר מקרים בהם הקורבן היה שחור,
03:24
and most murders occurred between people of the same race.
60
204091
4392
ורוב מקרי הרצח התרחשו בין אנשים מאותו גזע.
03:28
So how do we avoid falling for the paradox?
61
208483
2836
אז איך אנחנו נמנעים מליפול לפרדוקס?
03:31
Unfortunately, there's no one-size-fits-all answer.
62
211319
3367
למרבה הצער, אין תשובה אחת שמתאימה לכל דבר.
03:34
Data can be grouped and divided in any number of ways,
63
214686
3818
מידע יכול להיות מקובץ ומחולק בכל מספר דרכים,
03:38
and overall numbers may sometimes give a more accurate picture
64
218504
3602
ומספרים כלליים יכולים לפעמים לתת תמונה יותר מדוייקת
03:42
than data divided into misleading or arbitrary categories.
65
222106
4532
ממידע שמחולק לקטגוריות מטעות או שרירותיות.
03:46
All we can do is carefully study the actual situations the statistics describe
66
226638
5451
כל מה שאנחנו יכולים לעשות זה לחקור בזהירות את המצבים שהסטטיסטיקות מתארות
03:52
and consider whether lurking variables may be present.
67
232089
3888
ולשקול אם משתנים חבויים אולי נמצאים.
03:55
Otherwise, we leave ourselves vulnerable to those who would use data
68
235977
3401
אחרת, אנחנו משאירים את עצמנו פגיעים לאלה שהיו משתמשים במידע
03:59
to manipulate others and promote their own agendas.
69
239378
3271
כדי לתמרן אחרים ולקדם את האג'נדות שלהם.
על אתר זה

אתר זה יציג בפניכם סרטוני YouTube המועילים ללימוד אנגלית. תוכלו לראות שיעורי אנגלית המועברים על ידי מורים מהשורה הראשונה מרחבי העולם. לחץ פעמיים על הכתוביות באנגלית המוצגות בכל דף וידאו כדי להפעיל את הסרטון משם. הכתוביות גוללות בסנכרון עם הפעלת הווידאו. אם יש לך הערות או בקשות, אנא צור איתנו קשר באמצעות טופס יצירת קשר זה.

https://forms.gle/WvT1wiN1qDtmnspy7