How statistics can be misleading - Mark Liddell

1,438,722 views ・ 2016-01-14

TED-Ed


Fai dobre clic nos subtítulos en inglés a continuación para reproducir o vídeo.

Translator: Victoria Méndez Reviewer: traduceTED USC
00:06
Statistics are persuasive.
0
6636
2441
As estatísticas son moi convincentes,
tanto que persoas, organizacións e mesmo países enteiros
00:09
So much so that people, organizations, and whole countries
1
9077
3464
00:12
base some of their most important decisions on organized data.
2
12541
5206
basean algunhas das súas decisións máis importantes en datos organizados.
00:17
But there's a problem with that.
3
17747
1737
Pero hai un problema:
00:19
Any set of statistics might have something lurking inside it,
4
19484
3817
calquera conxunto de estatísticas pode ter información oculta,
00:23
something that can turn the results completely upside down.
5
23301
3950
datos que cambian totalmente as conclusións obtidas.
00:27
For example, imagine you need to choose between two hospitals
6
27251
3669
Por exemplo, imaxina que tes que elixir entre dous hospitais
00:30
for an elderly relative's surgery.
7
30920
2817
para a operación dun familiar ancián.
00:33
Out of each hospital's last 1000 patient's,
8
33737
2697
Dos últimos 1000 pacientes de cada hospital,
00:36
900 survived at Hospital A,
9
36434
3178
no hospital A sobreviviron 900,
00:39
while only 800 survived at Hospital B.
10
39612
3409
mentres que só 800 no hospital B.
Parece que o hospital A é a mellor opción.
00:43
So it looks like Hospital A is the better choice.
11
43021
3149
00:46
But before you make your decision,
12
46170
1673
Pero, antes de tomar unha decisión,
00:47
remember that not all patients arrive at the hospital
13
47843
3568
pensa que non todos os pacientes chegan ao hospital
00:51
with the same level of health.
14
51411
2400
co mesmo nivel de saúde.
00:53
And if we divide each hospital's last 1000 patients
15
53811
2892
E se dividimos os últimos 1000 pacientes de cada un dos hospitais
00:56
into those who arrived in good health and those who arrived in poor health,
16
56703
4429
entre os que gozaban de boa saúde ao chegar e os que non,
01:01
the picture starts to look very different.
17
61132
2640
o panorama cambia radicalmente.
01:03
Hospital A had only 100 patients who arrived in poor health,
18
63772
4077
Ao hospital A só chegaran 100 pacientes con mala saúde,
01:07
of which 30 survived.
19
67849
2476
dos que 30 sobreviviron.
01:10
But Hospital B had 400, and they were able to save 210.
20
70325
4527
Pero ao hospital B chegaran 400, e puideron salvar a 120.
01:14
So Hospital B is the better choice
21
74852
2317
Entón, o hospital B é a mellor opción para aqueles que chegan mal de saúde,
01:17
for patients who arrive at hospital in poor health,
22
77169
3572
01:20
with a survival rate of 52.5%.
23
80741
3785
cunha taxa de supervivencia do 52,2 %.
01:24
And what if your relative's health is good when she arrives at the hospital?
24
84526
3919
E que pasaría se o teu familiar gozase de boa saúde ao chegar ao hospital?
01:28
Strangely enough, Hospital B is still the better choice,
25
88445
3826
Sorprendentemente, o hospital B segue a ser a mellor opción,
01:32
with a survival rate of over 98%.
26
92271
3405
cunha taxa de supervivencia do 98 %.
01:35
So how can Hospital A have a better overall survival rate
27
95676
3057
Como é que o hospital A ten un índice xeral de supervivencia maior
01:38
if Hospital B has better survival rates for patients in each of the two groups?
28
98733
6097
se o hospital B ten mellores resultados para cada un dos dous grupos?
01:44
What we've stumbled upon is a case of Simpson's paradox,
29
104830
3759
Estamos ante un exemplo do paradoxo de Simpson,
01:48
where the same set of data can appear to show opposite trends
30
108589
3310
onde o mesmo conxunto de datos mostra tendencias opostas
01:51
depending on how it's grouped.
31
111899
2765
dependendo de como se agrupen.
01:54
This often occurs when aggregated data hides a conditional variable,
32
114664
4080
Isto sucede normalmente cando un estudo agocha unha variable condicionada
01:58
sometimes known as a lurking variable,
33
118744
2633
denominada variable ou factor de confusión,
02:01
which is a hidden additional factor that significantly influences results.
34
121377
5207
que é un factor adicional oculto que altera significativamente o resultado.
02:06
Here, the hidden factor is the relative proportion of patients
35
126584
3439
Neste caso, o factor influínte é a proporción de pacientes
02:10
who arrive in good or poor health.
36
130023
3241
que chegan con boa ou mala saúde.
02:13
Simpson's paradox isn't just a hypothetical scenario.
37
133264
3280
O paradoxo de Simpson non é só un caso hipotético.
02:16
It pops up from time to time in the real world,
38
136544
2380
Aparece de cando en vez en situacións da vida real,
02:18
sometimes in important contexts.
39
138924
3208
ás veces mesmo en contextos importantes.
02:22
One study in the UK appeared to show
40
142132
1998
Un estudo en Gran Bretaña mostraba que a taxa de supervivencia dos fumadores
02:24
that smokers had a higher survival rate than nonsmokers
41
144130
3470
era maior que a dos non fumadores nun período de vinte anos.
02:27
over a twenty-year time period.
42
147600
2246
02:29
That is, until dividing the participants by age group
43
149846
3461
Isto era así ata que, ao dividir os participantes por grupo de idade,
02:33
showed that the nonsmokers were significantly older on average,
44
153307
4516
os non fumadores eran, de media, significativamente maiores
02:37
and thus, more likely to die during the trial period,
45
157823
3107
e, polo tanto, era máis probable que morresen durante o estudo
02:40
precisely because they were living longer in general.
46
160930
3508
precisamente porque xa viviran máis tempo, en xeral.
02:44
Here, the age groups are the lurking variable,
47
164438
2848
Aquí, os grupos de idade son o factor de confusión
02:47
and are vital to correctly interpret the data.
48
167286
2890
e son vitais para interpretar os datos de xeito adecuado.
02:50
In another example,
49
170176
1383
Noutro exemplo,
02:51
an analysis of Florida's death penalty cases
50
171559
2722
unha análise dos casos de pena de morte en Florida
02:54
seemed to reveal no racial disparity in sentencing
51
174281
3984
mostraba ausencia de racismo á hora de ditar sentenza
02:58
between black and white defendants convicted of murder.
52
178265
3316
entre persoas brancas e negras condenadas por asasinato.
03:01
But dividing the cases by the race of the victim told a different story.
53
181581
4815
Porén, ao dividir os casos segundo a raza da vítima, os resultados cambiaban.
03:06
In either situation,
54
186396
1573
En calquera situación,
03:07
black defendants were more likely to be sentenced to death.
55
187969
3122
os acusados negros eran máis propensos a que os sentenciasen.
03:11
The slightly higher overall sentencing rate for white defendants
56
191091
3975
A media xeral era lixeiramente maior para os acusados brancos
03:15
was due to the fact that cases with white victims
57
195066
3626
precisamente porque, nos casos en que a vítima era branca,
03:18
were more likely to elicit a death sentence
58
198692
2667
a sentenza era case sempre de pena de morte,
03:21
than cases where the victim was black,
59
201359
2732
non coma nos casos con vítimas negras,
e a maioría de asasinatos producíranse entre xente da mesma raza.
03:24
and most murders occurred between people of the same race.
60
204091
4392
03:28
So how do we avoid falling for the paradox?
61
208483
2836
Entón, como evitamos caer no paradoxo?
03:31
Unfortunately, there's no one-size-fits-all answer.
62
211319
3367
Lamentablemente, non hai unha única resposta correcta.
03:34
Data can be grouped and divided in any number of ways,
63
214686
3818
Os datos poden agruparse e dividirse de moitísimos xeitos diferentes
03:38
and overall numbers may sometimes give a more accurate picture
64
218504
3602
e as observacións globais ás veces dan unha imaxe máis axeitada
03:42
than data divided into misleading or arbitrary categories.
65
222106
4532
que as resultantes de dividir os datos en categorías arbitrarias ou confusas.
03:46
All we can do is carefully study the actual situations the statistics describe
66
226638
5451
Todo canto podemos facer é estudar con coidado as situacións reais descritas
e considerar se hai variables de confusión que alteren a información.
03:52
and consider whether lurking variables may be present.
67
232089
3888
03:55
Otherwise, we leave ourselves vulnerable to those who would use data
68
235977
3401
Doutro xeito, quedamos vulnerables ante aqueles que usarán os datos
03:59
to manipulate others and promote their own agendas.
69
239378
3271
para manipular os demais e promover os seus intereses propios.
About this website

Este sitio presentarache vídeos de YouTube que son útiles para aprender inglés. Verás clases de inglés impartidas por profesores de primeiro nivel de todo o mundo. Fai dobre clic nos subtítulos en inglés que aparecen en cada páxina de vídeo para reproducir o vídeo desde alí. Os subtítulos desprázanse sincronizados coa reprodución do vídeo. Se tes algún comentario ou solicitude, póñase en contacto connosco a través deste formulario de contacto.

https://forms.gle/WvT1wiN1qDtmnspy7