How statistics can be misleading - Mark Liddell

1,427,995 views ・ 2016-01-14

TED-Ed


Bitte doppelklicken Sie auf die englischen Untertitel unten, um das Video abzuspielen.

Übersetzung: Johannes Duschner Lektorat: Angelika Lueckert Leon
00:06
Statistics are persuasive.
0
6636
2441
Statistiken überzeugen.
00:09
So much so that people, organizations, and whole countries
1
9077
3464
So sehr, dass Menschen, Organisationen und ganze Länder
00:12
base some of their most important decisions on organized data.
2
12541
5206
ihre wichtigsten Entscheidungen auf strukturierte Daten gründen.
00:17
But there's a problem with that.
3
17747
1737
Aber darin liegt das Problem.
00:19
Any set of statistics might have something lurking inside it,
4
19484
3817
In allen statistischen Daten hält sich vielleicht etwas versteckt,
00:23
something that can turn the results completely upside down.
5
23301
3950
dass die Befunde auf den Kopf stellt.
00:27
For example, imagine you need to choose between two hospitals
6
27251
3669
Zum Beispiel: Angenommen, man muss zwischen zwei Krankenhäusern wählen,
00:30
for an elderly relative's surgery.
7
30920
2817
weil ein älterer Angehöriger operiert werden muss.
00:33
Out of each hospital's last 1000 patient's,
8
33737
2697
Von den letzten 1000 Patienten der beiden Krankenhäuser
00:36
900 survived at Hospital A,
9
36434
3178
überlebten 900 in Klinik A,
00:39
while only 800 survived at Hospital B.
10
39612
3409
wohingegen nur 800 in Klinik B überlebten.
00:43
So it looks like Hospital A is the better choice.
11
43021
3149
Also scheint Klinik A die bessere Wahl zu sein.
00:46
But before you make your decision,
12
46170
1673
Aber bevor man sich entscheidet, sollte man bedenken,
00:47
remember that not all patients arrive at the hospital
13
47843
3568
dass Patienten nicht mit dem gleichen Gesundheitszustand
00:51
with the same level of health.
14
51411
2400
ins Krankenhaus aufgenommen werden.
00:53
And if we divide each hospital's last 1000 patients
15
53811
2892
Wenn man die letzten 1000 Patienten von beiden Krankenhäusern
00:56
into those who arrived in good health and those who arrived in poor health,
16
56703
4429
in jene bei guter Gesundheit und solche bei schlechter Gesundheit einteilt,
01:01
the picture starts to look very different.
17
61132
2640
sieht die Sache ganz anders aus.
01:03
Hospital A had only 100 patients who arrived in poor health,
18
63772
4077
Klinik A hatte nur 100 Patienten bei schlechter Gesundheit aufgenommen,
01:07
of which 30 survived.
19
67849
2476
von denen 30 überlebten.
01:10
But Hospital B had 400, and they were able to save 210.
20
70325
4527
Aber Klinik B hatte 400 und sie konnten 210 retten.
01:14
So Hospital B is the better choice
21
74852
2317
Also ist Klinik B für Patienten bei schlechter Gesundheit
01:17
for patients who arrive at hospital in poor health,
22
77169
3572
mit einer Überlebensrate von 52,5 % die bessere Wahl.
01:20
with a survival rate of 52.5%.
23
80741
3785
01:24
And what if your relative's health is good when she arrives at the hospital?
24
84526
3919
Was, wenn man den Angehörigen bei guter Gesundheit
ins Krankenhaus aufnimmt?
01:28
Strangely enough, Hospital B is still the better choice,
25
88445
3826
Merkwürdigerweise ist Klinik B mit einer Überlebensrate von über 98 %
01:32
with a survival rate of over 98%.
26
92271
3405
immer noch die bessere Wahl.
01:35
So how can Hospital A have a better overall survival rate
27
95676
3057
Wie kann Klinik A eine bessere Gesamtüberlebensrate haben,
01:38
if Hospital B has better survival rates for patients in each of the two groups?
28
98733
6097
wenn Klinik B
die besseren Überlebensraten bei beiden Patientengruppen hat?
01:44
What we've stumbled upon is a case of Simpson's paradox,
29
104830
3759
Worauf wir zufällig stießen, ist ein Fall des Simpson-Paradoxon,
01:48
where the same set of data can appear to show opposite trends
30
108589
3310
bei dem dieselbe Reihe von Daten, je nachdem wie sie gruppiert sind,
01:51
depending on how it's grouped.
31
111899
2765
gegenläufige Tendenzen zu zeigen scheinen.
01:54
This often occurs when aggregated data hides a conditional variable,
32
114664
4080
Das geschieht häufig, wenn aggregierte Daten
eine Bedingungsvariable verbergen, auch als Störvariable bekannt,
01:58
sometimes known as a lurking variable,
33
118744
2633
02:01
which is a hidden additional factor that significantly influences results.
34
121377
5207
die ein verborgener, zusätzlicher Faktor ist,
der Ergebnisse signifikant beeinflusst.
02:06
Here, the hidden factor is the relative proportion of patients
35
126584
3439
Hier ist der versteckte Faktor der relative Anteil von Patienten
02:10
who arrive in good or poor health.
36
130023
3241
bei guter oder schlechter Gesundheit.
02:13
Simpson's paradox isn't just a hypothetical scenario.
37
133264
3280
Das Simpson-Paradoxon ist nicht nur ein hypothetisches Szenario.
02:16
It pops up from time to time in the real world,
38
136544
2380
Es tritt von Zeit zu Zeit in der wirklichen Welt auf,
02:18
sometimes in important contexts.
39
138924
3208
manchmal in wichtigen Zusammenhängen.
02:22
One study in the UK appeared to show
40
142132
1998
Einer Studie im Vereinigten Königreich zufolge,
02:24
that smokers had a higher survival rate than nonsmokers
41
144130
3470
schien die Überlebensrate von Rauchern über einen Zeitraum von zwanzig Jahren
02:27
over a twenty-year time period.
42
147600
2246
höher wäre als die von Nichtrauchern.
02:29
That is, until dividing the participants by age group
43
149846
3461
Zumindest bis die Unterteilung der Teilnehmer in Altersgruppen zeigte,
02:33
showed that the nonsmokers were significantly older on average,
44
153307
4516
dass die Nichtraucher im Durchschnitt signifikant älter waren
02:37
and thus, more likely to die during the trial period,
45
157823
3107
und daher mit höherer Wahscheinlichkeit während des Versuchszeitraums starben,
02:40
precisely because they were living longer in general.
46
160930
3508
die Raucher im Allgemeinen länger lebten.
02:44
Here, the age groups are the lurking variable,
47
164438
2848
Hier sind die Altersgruppen die Störvariablen
02:47
and are vital to correctly interpret the data.
48
167286
2890
und äußerst wichtig, um die Daten korrekt zu deuten.
02:50
In another example,
49
170176
1383
In einem weiteren Beispiel
02:51
an analysis of Florida's death penalty cases
50
171559
2722
schien die Analyse der Fälle mit Todesstrafen aus Florida
02:54
seemed to reveal no racial disparity in sentencing
51
174281
3984
keine ethnische Ungleichverteilung
zwischen schwarzen und weißen Mordangeklagten
02:58
between black and white defendants convicted of murder.
52
178265
3316
bei der Verurteilung aufzudecken.
03:01
But dividing the cases by the race of the victim told a different story.
53
181581
4815
Die anhand der "Rasse" der Opfer eingeteilten Fälle
sagten aber etwas anderes.
03:06
In either situation,
54
186396
1573
Bei beiden Sachlagen wurden schwarze Angeklagte
03:07
black defendants were more likely to be sentenced to death.
55
187969
3122
mit höherer Wahrscheinlichkeit zum Tode verurteilt.
03:11
The slightly higher overall sentencing rate for white defendants
56
191091
3975
Die etwas höhere Verurteilungsrate für weiße Angeklagte insgesamt
03:15
was due to the fact that cases with white victims
57
195066
3626
ergab sich infolge der Tatsache, dass Fälle mit weißen Opfern
03:18
were more likely to elicit a death sentence
58
198692
2667
mit höherer Wahrscheinlichkeit ein Todesurteil hervorriefen
03:21
than cases where the victim was black,
59
201359
2732
als Fälle mit schwarzen Opfern;
03:24
and most murders occurred between people of the same race.
60
204091
4392
und die meisten Morde geschahen zwischen Menschen derselben "Rasse".
03:28
So how do we avoid falling for the paradox?
61
208483
2836
Wie vermeiden wir also auf das Paradoxon hereinzufallen?
03:31
Unfortunately, there's no one-size-fits-all answer.
62
211319
3367
Leider gibt es keine allgemeingültige Antwort.
03:34
Data can be grouped and divided in any number of ways,
63
214686
3818
Daten können auf unzählige Arten gruppiert und unterteilt werden
03:38
and overall numbers may sometimes give a more accurate picture
64
218504
3602
und Gesamtzahlen können manchmal ein genaueres Bild zeichnen
03:42
than data divided into misleading or arbitrary categories.
65
222106
4532
als Daten, die man in irreführende oder willkürliche Kategorien einteilt.
03:46
All we can do is carefully study the actual situations the statistics describe
66
226638
5451
Alles was wir tun können, ist, die tatsächlichen Sachverhalte,
die Statistiken beschreiben, zu untersuchen
03:52
and consider whether lurking variables may be present.
67
232089
3888
und zu überlegen, ob Störvariablen vorhanden sein könnten.
03:55
Otherwise, we leave ourselves vulnerable to those who would use data
68
235977
3401
Andernfalls machen wir uns anfällig gegenüber denen, die Daten benutzen,
03:59
to manipulate others and promote their own agendas.
69
239378
3271
um uns zu manipulieren und ihre eigenen Interessen zu befördern.
Über diese Website

Auf dieser Seite finden Sie YouTube-Videos, die zum Englischlernen nützlich sind. Sie sehen Englischlektionen, die von hochkarätigen Lehrern aus der ganzen Welt unterrichtet werden. Doppelklicken Sie auf die englischen Untertitel, die auf jeder Videoseite angezeigt werden, um das Video von dort aus abzuspielen. Die Untertitel laufen synchron mit der Videowiedergabe. Wenn Sie irgendwelche Kommentare oder Wünsche haben, kontaktieren Sie uns bitte über dieses Kontaktformular.

https://forms.gle/WvT1wiN1qDtmnspy7