How statistics can be misleading - Mark Liddell

1,427,995 views ・ 2016-01-14

TED-Ed


Κάντε διπλό κλικ στους αγγλικούς υπότιτλους παρακάτω για να αναπαραγάγετε το βίντεο.

Μετάφραση: Christos Giannakis-Bompolis Επιμέλεια: Chryssa Takahashi
00:06
Statistics are persuasive.
0
6636
2441
Η στατιστική είναι πειστική.
Τόσο πολύ που άνθρωποι, οργανώσεις και ολόκληρες χώρες
00:09
So much so that people, organizations, and whole countries
1
9077
3464
00:12
base some of their most important decisions on organized data.
2
12541
5206
βασίζουν ορισμένες από τις πιο κρίσιμες αποφάσεις τους σε οργανωμένα δεδομένα.
00:17
But there's a problem with that.
3
17747
1737
Ωστόσο, υπάρχει ένα πρόβλημα με αυτό.
00:19
Any set of statistics might have something lurking inside it,
4
19484
3817
Κάθε στατιστικό δείγμα ενδέχεται να ελλοχεύει
κάτι που ανατρέπει εξ ολοκλήρου τα αποτελέσματα.
00:23
something that can turn the results completely upside down.
5
23301
3950
00:27
For example, imagine you need to choose between two hospitals
6
27251
3669
Για παράδειγμα, φαντάσου ότι χρειάζεται να αποφασίσεις μεταξύ δύο νοσοκομείων
00:30
for an elderly relative's surgery.
7
30920
2817
για τη χειρουργική επέμβαση ενός ηλικιωμένου συγγενή.
00:33
Out of each hospital's last 1000 patient's,
8
33737
2697
Από τους τελευταίους 1.000 ασθενείς κάθε νοσοκομείου,
00:36
900 survived at Hospital A,
9
36434
3178
στο πρώτο νοσοκομείο επέζησαν 900
00:39
while only 800 survived at Hospital B.
10
39612
3409
και μόνο 800 στο δεύτερο.
Επομένως, το πρώτο νοσοκομείο φαντάζει καλύτερη επιλογή.
00:43
So it looks like Hospital A is the better choice.
11
43021
3149
Όμως πριν αποφασίσεις,
00:46
But before you make your decision,
12
46170
1673
00:47
remember that not all patients arrive at the hospital
13
47843
3568
θυμίσου ότι δεν έφτασαν όλοι οι πάσχοντες στο νοσοκομείο
00:51
with the same level of health.
14
51411
2400
στην ίδια κατάσταση.
00:53
And if we divide each hospital's last 1000 patients
15
53811
2892
Αν σε κάθε νοσοκομείο διαιρέσουμε τους 1.000 τελευταίους ασθενείς
00:56
into those who arrived in good health and those who arrived in poor health,
16
56703
4429
σε αυτούς που φτάνουν σε καλή και σε αυτούς που φτάνουν σε άσχημη κατάσταση,
01:01
the picture starts to look very different.
17
61132
2640
η εικόνα αρχίζει να αλλάζει σημαντικά.
01:03
Hospital A had only 100 patients who arrived in poor health,
18
63772
4077
Το νοσοκομείο Α είχε μόλις 100 ασθενείς που έφτασαν σε άσχημη κατάσταση υγείας,
01:07
of which 30 survived.
19
67849
2476
30 από τους οποίους επέζησαν.
01:10
But Hospital B had 400, and they were able to save 210.
20
70325
4527
Όμως, το νοσοκομείο Β είχε 400 και μπόρεσε να σώσει τους 210.
01:14
So Hospital B is the better choice
21
74852
2317
Οπότε το δεύτερο είναι καλύτερη επιλογή
01:17
for patients who arrive at hospital in poor health,
22
77169
3572
για ασθενείς που φτάνουν στο νοσοκομείο σε κακή κατάσταση υγείας,
01:20
with a survival rate of 52.5%.
23
80741
3785
με ποσοστό επιβίωσης 52,5%.
01:24
And what if your relative's health is good when she arrives at the hospital?
24
84526
3919
Αν η κατάσταση υγείας του συγγενή σας είναι καλή όταν φτάνει στο νοσοκομείο;
01:28
Strangely enough, Hospital B is still the better choice,
25
88445
3826
Περιέργως, το νοσοκομείο Β είναι πάλι καλύτερη επιλογή,
01:32
with a survival rate of over 98%.
26
92271
3405
με ποσοστό επιβίωσης πάνω από 98%.
01:35
So how can Hospital A have a better overall survival rate
27
95676
3057
Πώς είναι δυνατό να έχουμε ένα μεγαλύτερο ποσοστό επιβίωσης στο Α
01:38
if Hospital B has better survival rates for patients in each of the two groups?
28
98733
6097
όταν το Β έχει καλύτερα ποσοστά επιβίωσης και στις δύο ομάδες ασθενών;
01:44
What we've stumbled upon is a case of Simpson's paradox,
29
104830
3759
Έχουμε πέσει πάνω στην περίπτωση του παράδοξου του Σίμπσονς
01:48
where the same set of data can appear to show opposite trends
30
108589
3310
όπου ίδιες ομάδες δεδομένων μπορούν να δείξουν διαφορετικές τάσεις,
01:51
depending on how it's grouped.
31
111899
2765
ανάλογα με την ομαδοποίηση.
01:54
This often occurs when aggregated data hides a conditional variable,
32
114664
4080
Αυτό συμβαίνει όταν ομαδοποιημένα δεδομένα κρύβουν έναν μεταβλητό παράγοντα,
01:58
sometimes known as a lurking variable,
33
118744
2633
γνωστή και ως «κρυφή μεταβλητή»,
02:01
which is a hidden additional factor that significantly influences results.
34
121377
5207
που είναι ένας επιπρόσθετος παράγοντας που επηρεάζει σημαντικά τα αποτελέσματα.
02:06
Here, the hidden factor is the relative proportion of patients
35
126584
3439
Εδώ, ο κρυφός παράγοντας είναι η σχετική αναλογία των ασθενών
02:10
who arrive in good or poor health.
36
130023
3241
που φτάνουν σε καλή και κακή κατάσταση.
02:13
Simpson's paradox isn't just a hypothetical scenario.
37
133264
3280
Το παράδοξο του Σίμπσον δεν είναι ένα υποθετικό σενάριο.
02:16
It pops up from time to time in the real world,
38
136544
2380
Εμφανίζεται σποραδικά στον πραγματικό κόσμο,
02:18
sometimes in important contexts.
39
138924
3208
μερικές φορές σε σημαντικές περιστάσεις.
02:22
One study in the UK appeared to show
40
142132
1998
Μια έρευνα στο Ηνωμένο Βασίλειο
έδειξε πως οι καπνιστές έχουν μεγαλύτερο ποσοστό επιβίωσης
02:24
that smokers had a higher survival rate than nonsmokers
41
144130
3470
από τους μη καπνιστές, σε περίοδο είκοσι ετών.
02:27
over a twenty-year time period.
42
147600
2246
02:29
That is, until dividing the participants by age group
43
149846
3461
Όταν έγινε ο διαχωρισμός των συμμετέχοντων ανά ηλικιακή ομάδα
02:33
showed that the nonsmokers were significantly older on average,
44
153307
4516
η έρευνα έδειξε πως οι μη καπνιστές ήταν σαφώς μεγαλύτερης ηλικίας,
02:37
and thus, more likely to die during the trial period,
45
157823
3107
οπότε, πολύ πιθανότερο να πεθάνουν κατά την ελεγχόμενη περίοδο,
02:40
precisely because they were living longer in general.
46
160930
3508
ακριβώς επειδή είχαν ζήσει ήδη περισσότερο.
02:44
Here, the age groups are the lurking variable,
47
164438
2848
Εδώ, οι ηλικιακές ομάδες είναι ο κρυφός παράγοντας
02:47
and are vital to correctly interpret the data.
48
167286
2890
και είναι ζωτικής σημασίας να ληφθούν υπόψη στην ανάλυση.
02:50
In another example,
49
170176
1383
Σε ένα άλλο παράδειγμα,
02:51
an analysis of Florida's death penalty cases
50
171559
2722
μιας ανάλυσης περιπτώσεων θανατικών ποινών στη Φλόριντα,
02:54
seemed to reveal no racial disparity in sentencing
51
174281
3984
φαινόταν να μην υπάρχει φυλετική διάκριση
02:58
between black and white defendants convicted of murder.
52
178265
3316
μεταξύ μαύρων και λευκών καταδικασμένων σε θάνατο.
03:01
But dividing the cases by the race of the victim told a different story.
53
181581
4815
Όμως, χωρίζοντας τις περιπτώσεις ανά φυλή κάθε θύματος προέκυψε άλλη ερμηνεία.
03:06
In either situation,
54
186396
1573
Σε κάθε περίπτωση,
03:07
black defendants were more likely to be sentenced to death.
55
187969
3122
ήταν πολύ πιθανότερη η καταδίκη των μαύρων κατηγορούμενων.
03:11
The slightly higher overall sentencing rate for white defendants
56
191091
3975
Το ελαφρώς μεγαλύτερο ποσοστό καταδίκης για τους λευκούς εναγόμενους
03:15
was due to the fact that cases with white victims
57
195066
3626
οφειλόταν στο ότι οι υποθέσεις με θύματα λευκούς
03:18
were more likely to elicit a death sentence
58
198692
2667
ήταν πιο πιθανό να προβλέπουν θανατική ποινή
03:21
than cases where the victim was black,
59
201359
2732
σε σχέση με τις υποθέσεις με θύματα μαύρους,
03:24
and most murders occurred between people of the same race.
60
204091
4392
και οι περισσότεροι φόνοι συνέβησαν μεταξύ ανθρώπων της ίδιας φυλής.
03:28
So how do we avoid falling for the paradox?
61
208483
2836
Πώς μπορούμε να αποφύγουμε να πέσουμε σε παράδοξο;
03:31
Unfortunately, there's no one-size-fits-all answer.
62
211319
3367
Δυστυχώς, δεν υπάρχει μία απάντηση για όλες τις περιπτώσεις.
03:34
Data can be grouped and divided in any number of ways,
63
214686
3818
Τα δεδομένα μπορούν να ομαδοποιηθούν και να καταμεριστούν με διάφορους τρόπους
03:38
and overall numbers may sometimes give a more accurate picture
64
218504
3602
και τα σύνολα μερικές φορές δίνουν μια πιο σαφή εικόνα
03:42
than data divided into misleading or arbitrary categories.
65
222106
4532
από δεδομένα διαιρεμένα σε παραπλανητικές ή αυθαίρετες κατηγορίες.
03:46
All we can do is carefully study the actual situations the statistics describe
66
226638
5451
Αυτό που μπορούμε είναι να μελετήσουμε προσεκτικά τις πραγματικές καταστάσεις
που περιγράφονται με χρήση στατιστικής
03:52
and consider whether lurking variables may be present.
67
232089
3888
και να αναλογιστούμε τυχόν ύπαρξη κρυφών μεταβλητών.
03:55
Otherwise, we leave ourselves vulnerable to those who would use data
68
235977
3401
Διαφορετικά, γινόμαστε ευάλωτοι σε αυτούς που χρησιμοποιούν τα δεδομένα
03:59
to manipulate others and promote their own agendas.
69
239378
3271
για να χειραγωγήσουν τους άλλους και να προωθήσουν τα δικά τους σχέδια.
Σχετικά με αυτόν τον ιστότοπο

Αυτός ο ιστότοπος θα σας παρουσιάσει βίντεο στο YouTube που είναι χρήσιμα για την εκμάθηση της αγγλικής γλώσσας. Θα δείτε μαθήματα αγγλικών που διδάσκουν κορυφαίοι καθηγητές από όλο τον κόσμο. Κάντε διπλό κλικ στους αγγλικούς υπότιτλους που εμφανίζονται σε κάθε σελίδα βίντεο για να αναπαράγετε το βίντεο από εκεί. Οι υπότιτλοι μετακινούνται συγχρονισμένα με την αναπαραγωγή του βίντεο. Εάν έχετε οποιαδήποτε σχόλια ή αιτήματα, παρακαλούμε επικοινωνήστε μαζί μας χρησιμοποιώντας αυτή τη φόρμα επικοινωνίας.

https://forms.gle/WvT1wiN1qDtmnspy7