How statistics can be misleading - Mark Liddell

1,435,666 views ・ 2016-01-14

TED-Ed


Haga doble clic en los subtítulos en inglés para reproducir el vídeo.

Traductor: Lidia Cámara de la Fuente Revisor: Ciro Gomez
00:06
Statistics are persuasive.
0
6636
2441
Las estadísticas son convincentes.
00:09
So much so that people, organizations, and whole countries
1
9077
3464
Tanto es así que personas, organizaciones y países enteros
00:12
base some of their most important decisions on organized data.
2
12541
5206
basan algunas de sus decisiones más importantes en datos estadísticos.
00:17
But there's a problem with that.
3
17747
1737
Pero hay un problema en ellos.
00:19
Any set of statistics might have something lurking inside it,
4
19484
3817
Cualquier conjunto de datos estadísticos podría contener algo
00:23
something that can turn the results completely upside down.
5
23301
3950
que puede poner los resultados al revés y completamente patas arriba.
00:27
For example, imagine you need to choose between two hospitals
6
27251
3669
Por ejemplo, imagina que tienes que elegir entre dos hospitales
00:30
for an elderly relative's surgery.
7
30920
2817
para la operación de cirugía de un pariente anciano.
00:33
Out of each hospital's last 1000 patient's,
8
33737
2697
De cada 1000 pacientes hospitalizados
00:36
900 survived at Hospital A,
9
36434
3178
900 sobrevivieron en el hospital A,
00:39
while only 800 survived at Hospital B.
10
39612
3409
mientras que solo 800 lo hicieron en el Hospital B.
00:43
So it looks like Hospital A is the better choice.
11
43021
3149
Así que parece que el hospital A es la mejor opción.
00:46
But before you make your decision,
12
46170
1673
Pero antes de tomar la decisión,
00:47
remember that not all patients arrive at the hospital
13
47843
3568
recuerda que no todos los pacientes llegan al hospital
00:51
with the same level of health.
14
51411
2400
con el mismo nivel de salud.
00:53
And if we divide each hospital's last 1000 patients
15
53811
2892
Y si dividimos los últimos 1000 pacientes de cada hospital
00:56
into those who arrived in good health and those who arrived in poor health,
16
56703
4429
en los que llegaron en buen estado de salud y los que llegaron en mal estado,
01:01
the picture starts to look very different.
17
61132
2640
esto empieza a verse muy diferente.
01:03
Hospital A had only 100 patients who arrived in poor health,
18
63772
4077
El hospital A solo tenía 100 pacientes que llegaron en mal estado de salud,
01:07
of which 30 survived.
19
67849
2476
de los cuales 30 sobrevivieron.
01:10
But Hospital B had 400, and they were able to save 210.
20
70325
4527
Pero el hospital B tenía 400, y pudieron salvar a 210.
01:14
So Hospital B is the better choice
21
74852
2317
Así que el Hospital B es la mejor opción
01:17
for patients who arrive at hospital in poor health,
22
77169
3572
para los pacientes que acuden al hospital con problemas de salud,
01:20
with a survival rate of 52.5%.
23
80741
3785
con una tasa de supervivencia del 52,5 %.
01:24
And what if your relative's health is good when she arrives at the hospital?
24
84526
3919
¿Y si la salud de tu familiar es buena cuando llega al hospital?
01:28
Strangely enough, Hospital B is still the better choice,
25
88445
3826
Curiosamente, el hospital B sigue siendo la mejor opción,
01:32
with a survival rate of over 98%.
26
92271
3405
con una tasa de supervivencia de más del 98 %.
01:35
So how can Hospital A have a better overall survival rate
27
95676
3057
¿Cómo puede el hospital A tener una mejor tasa de supervivencia
01:38
if Hospital B has better survival rates for patients in each of the two groups?
28
98733
6097
si el hospital B tiene mejores tasas de supervivencia de pacientes en cada grupo?
01:44
What we've stumbled upon is a case of Simpson's paradox,
29
104830
3759
Con lo que nos topamos aquí, es con un caso de la paradoja de Simpson,
01:48
where the same set of data can appear to show opposite trends
30
108589
3310
donde el mismo conjunto de datos puede mostrar tendencias opuestas
01:51
depending on how it's grouped.
31
111899
2765
dependiendo de cómo se agrupan.
01:54
This often occurs when aggregated data hides a conditional variable,
32
114664
4080
Pasa a menudo cuando en datos agregados se oculta una variable condicional,
01:58
sometimes known as a lurking variable,
33
118744
2633
conocida a veces como variable oculta,
02:01
which is a hidden additional factor that significantly influences results.
34
121377
5207
que es un factor adicional oculto que influye mucho en los resultados.
02:06
Here, the hidden factor is the relative proportion of patients
35
126584
3439
Aquí, el factor oculto es la proporción relativa de pacientes
02:10
who arrive in good or poor health.
36
130023
3241
que llegan en buen o mal estado de salud.
02:13
Simpson's paradox isn't just a hypothetical scenario.
37
133264
3280
La paradoja de Simpson no es solo un escenario hipotético.
02:16
It pops up from time to time in the real world,
38
136544
2380
Aparece de vez en cuando en el mundo real,
02:18
sometimes in important contexts.
39
138924
3208
a veces en contextos importantes.
Un estudio en el Reino Unido parecía demostrar
02:22
One study in the UK appeared to show
40
142132
1998
02:24
that smokers had a higher survival rate than nonsmokers
41
144130
3470
que los fumadores tenían una mayor tasa de supervivencia que los no fumadores
02:27
over a twenty-year time period.
42
147600
2246
durante un período de 20 años.
02:29
That is, until dividing the participants by age group
43
149846
3461
Es decir, hasta que dividieron a los participantes por grupo de edad,
02:33
showed that the nonsmokers were significantly older on average,
44
153307
4516
entonces demostraron que los no fumadores eran mucho mayores en promedio,
02:37
and thus, more likely to die during the trial period,
45
157823
3107
y, por tanto, con mayor probabilidad de morir durante el período de test,
02:40
precisely because they were living longer in general.
46
160930
3508
precisamente porque vivían más tiempo en general.
02:44
Here, the age groups are the lurking variable,
47
164438
2848
En este caso, los grupos de edad son la variable oculta
02:47
and are vital to correctly interpret the data.
48
167286
2890
y son vitales para interpretar correctamente los datos.
02:50
In another example,
49
170176
1383
En otro ejemplo,
02:51
an analysis of Florida's death penalty cases
50
171559
2722
un análisis de los casos de pena de muerte de Florida
02:54
seemed to reveal no racial disparity in sentencing
51
174281
3984
no parecía revelar ninguna disparidad racial en las sentencias
02:58
between black and white defendants convicted of murder.
52
178265
3316
entre los acusados ​​blancos y negros condenados por asesinato.
03:01
But dividing the cases by the race of the victim told a different story.
53
181581
4815
Pero la división de los casos por raza de la víctima contó una historia diferente.
03:06
In either situation,
54
186396
1573
En cualquier situación,
03:07
black defendants were more likely to be sentenced to death.
55
187969
3122
los acusados ​​negros tenían mayor probabilidad de ser condenados a muerte.
03:11
The slightly higher overall sentencing rate for white defendants
56
191091
3975
La tasa global de la sentencia algo superior para los acusados ​​blancos
03:15
was due to the fact that cases with white victims
57
195066
3626
se debió al hecho de que los casos con víctimas blancas
03:18
were more likely to elicit a death sentence
58
198692
2667
tenían mayor probabilidad de obtener una sentencia de muerte
03:21
than cases where the victim was black,
59
201359
2732
que en los casos donde la víctima era negra,
03:24
and most murders occurred between people of the same race.
60
204091
4392
y la mayoría de las muertes ocurrieron entre personas de la misma raza.
03:28
So how do we avoid falling for the paradox?
61
208483
2836
Y ¿cómo evitar caer en la paradoja?
03:31
Unfortunately, there's no one-size-fits-all answer.
62
211319
3367
Desafortunadamente no hay una receta única para todos los casos.
03:34
Data can be grouped and divided in any number of ways,
63
214686
3818
Los datos pueden agruparse y dividirse en varias formas,
03:38
and overall numbers may sometimes give a more accurate picture
64
218504
3602
y los números generales a veces pueden dar una imagen más precisa
03:42
than data divided into misleading or arbitrary categories.
65
222106
4532
que los datos divididos en categorías erróneas o arbitrarias.
03:46
All we can do is carefully study the actual situations the statistics describe
66
226638
5451
Lo que podemos hacer es estudiar cuidadosamente las situaciones reales
que describen las estadísticas
03:52
and consider whether lurking variables may be present.
67
232089
3888
y considerar si las variables ocultas deberían estar presentes.
03:55
Otherwise, we leave ourselves vulnerable to those who would use data
68
235977
3401
De lo contrario, nos hacemos vulnerables a aquellos que usan los datos
03:59
to manipulate others and promote their own agendas.
69
239378
3271
para manipular a otros y promover sus propias agendas.
Acerca de este sitio web

Este sitio le presentará vídeos de YouTube útiles para aprender inglés. Verá lecciones de inglés impartidas por profesores de primera categoría de todo el mundo. Haz doble clic en los subtítulos en inglés que aparecen en cada página de vídeo para reproducir el vídeo desde allí. Los subtítulos se desplazan en sincronía con la reproducción del vídeo. Si tiene algún comentario o petición, póngase en contacto con nosotros mediante este formulario de contacto.

https://forms.gle/WvT1wiN1qDtmnspy7