How statistics can be misleading - Mark Liddell

Come le statistiche possono essere ingannevoli - Mark Liddell

1,435,666 views

2016-01-14 ・ TED-Ed


New videos

How statistics can be misleading - Mark Liddell

Come le statistiche possono essere ingannevoli - Mark Liddell

1,435,666 views ・ 2016-01-14

TED-Ed


Fare doppio clic sui sottotitoli in inglese per riprodurre il video.

Traduttore: Marco Longhin Revisore: Silvia Fornasiero
00:06
Statistics are persuasive.
0
6636
2441
Le statistiche sono persuasive.
00:09
So much so that people, organizations, and whole countries
1
9077
3464
Così tanto che persone, organizzazioni e intere nazioni
00:12
base some of their most important decisions on organized data.
2
12541
5206
basano alcune delle loro decisioni più importanti su dati aggregati.
00:17
But there's a problem with that.
3
17747
1737
Ma questo pone un problema.
00:19
Any set of statistics might have something lurking inside it,
4
19484
3817
Ogni statistica potrebbe nascondere al suo interno
00:23
something that can turn the results completely upside down.
5
23301
3950
qualcosa in grado di capovolgere completamente i risultati.
00:27
For example, imagine you need to choose between two hospitals
6
27251
3669
Per esempio, immagina di dover scegliere tra due ospedali
00:30
for an elderly relative's surgery.
7
30920
2817
per l'operazione di un anziano parente.
00:33
Out of each hospital's last 1000 patient's,
8
33737
2697
Analizzando gli ultimi 1000 pazienti di ogni ospedale,
00:36
900 survived at Hospital A,
9
36434
3178
900 sono sopravvissuti nell'ospedale A,
00:39
while only 800 survived at Hospital B.
10
39612
3409
mentre solo 800 sono sopravvissuti nell'ospedale B.
00:43
So it looks like Hospital A is the better choice.
11
43021
3149
Sembrerebbe che l'ospedale A sia la scelta migliore.
00:46
But before you make your decision,
12
46170
1673
Ma, prima di prendere una decisione,
00:47
remember that not all patients arrive at the hospital
13
47843
3568
considera che non tutti i pazienti arrivano all'ospedale
00:51
with the same level of health.
14
51411
2400
nello stesso stato di salute.
00:53
And if we divide each hospital's last 1000 patients
15
53811
2892
Se dividiamo gli ultimi 1000 pazienti di ogni ospedale
00:56
into those who arrived in good health and those who arrived in poor health,
16
56703
4429
in quelli che sono arrivati in buona salute
e quelli che sono arrivati in cattiva salute,
01:01
the picture starts to look very different.
17
61132
2640
il quadro inizia a sembrare molto diverso.
01:03
Hospital A had only 100 patients who arrived in poor health,
18
63772
4077
L'ospedale A ha ricevuto solo 100 pazienti in cattiva salute,
01:07
of which 30 survived.
19
67849
2476
di cui 30 sono sopravvissuti.
01:10
But Hospital B had 400, and they were able to save 210.
20
70325
4527
Ma l'ospedale B ne ha ricevuti 400, riuscendo a salvarne 210.
01:14
So Hospital B is the better choice
21
74852
2317
Per cui l'ospedale B è una scelta migliore
01:17
for patients who arrive at hospital in poor health,
22
77169
3572
per i pazienti che arrivano in cattiva salute,
01:20
with a survival rate of 52.5%.
23
80741
3785
con una probabilità di sopravvivenza del 52,5%.
01:24
And what if your relative's health is good when she arrives at the hospital?
24
84526
3919
E se la salute del tuo parente è buona quando arriva in ospedale?
01:28
Strangely enough, Hospital B is still the better choice,
25
88445
3826
Sorprendentemente l'ospedale B resta la scelta migliore,
01:32
with a survival rate of over 98%.
26
92271
3405
con un tasso di sopravvivenza superiore al 98%.
01:35
So how can Hospital A have a better overall survival rate
27
95676
3057
Allora come mai il tasso di sopravvivenza totale dell'ospedale A è superiore
01:38
if Hospital B has better survival rates for patients in each of the two groups?
28
98733
6097
se l'ospedale B ha un tasso di sopravvivenza più alto
per i pazienti di ognuno dei due gruppi?
01:44
What we've stumbled upon is a case of Simpson's paradox,
29
104830
3759
Quello in cui siamo incappati è un esempio del paradosso di Simpson,
01:48
where the same set of data can appear to show opposite trends
30
108589
3310
dove gli stessi dati sembrano mostrare trend differenti
01:51
depending on how it's grouped.
31
111899
2765
a seconda di come sono raggruppati.
Questo accade spesso quando dati aggregati
01:54
This often occurs when aggregated data hides a conditional variable,
32
114664
4080
nascondono una variabile condizionata,
01:58
sometimes known as a lurking variable,
33
118744
2633
qualcosa conosciuto come variabile nascosta,
02:01
which is a hidden additional factor that significantly influences results.
34
121377
5207
che è un fattore nascosto che influenza significativamente i risultati.
02:06
Here, the hidden factor is the relative proportion of patients
35
126584
3439
Qui il fattore nascosto è la proporzione dei pazienti
02:10
who arrive in good or poor health.
36
130023
3241
che arrivano in buona o cattiva salute.
02:13
Simpson's paradox isn't just a hypothetical scenario.
37
133264
3280
Il paradosso di Simpson non è solo uno scenario ipotetico.
02:16
It pops up from time to time in the real world,
38
136544
2380
Appare di tanto in tanto nel mondo reale,
02:18
sometimes in important contexts.
39
138924
3208
a volte in contesti importanti.
02:22
One study in the UK appeared to show
40
142132
1998
Uno studio in Inghilterra sembrò mostrare
02:24
that smokers had a higher survival rate than nonsmokers
41
144130
3470
che i fumatori avevano un tasso di sopravvivenza superiore ai non fumatori
02:27
over a twenty-year time period.
42
147600
2246
su un periodo di 20 anni.
02:29
That is, until dividing the participants by age group
43
149846
3461
Questo fino a che si divisero i partecipati per gruppi d'età
02:33
showed that the nonsmokers were significantly older on average,
44
153307
4516
e si vide che i non fumatori erano in media significativamente più vecchi,
02:37
and thus, more likely to die during the trial period,
45
157823
3107
e quindi era più facile che morissero durante il periodo del test
02:40
precisely because they were living longer in general.
46
160930
3508
proprio perché, in generale, avevano vissuto più a lungo.
02:44
Here, the age groups are the lurking variable,
47
164438
2848
In questo caso, i gruppi d'età sono la variabile nascosta
02:47
and are vital to correctly interpret the data.
48
167286
2890
e sono indispensabili per interpretare correttamente i dati.
02:50
In another example,
49
170176
1383
In un altro esempio, un'analisi
02:51
an analysis of Florida's death penalty cases
50
171559
2722
dei casi di pena di morte in Florida
02:54
seemed to reveal no racial disparity in sentencing
51
174281
3984
sembrò mostrare l'assenza di disparità razziale nelle sentenze
02:58
between black and white defendants convicted of murder.
52
178265
3316
tra gli accusati di omicidio bianchi e neri.
03:01
But dividing the cases by the race of the victim told a different story.
53
181581
4815
Ma dividere i casi per la razza delle vittime diede risultati diversi.
03:06
In either situation,
54
186396
1573
In entrambe le situazioni,
03:07
black defendants were more likely to be sentenced to death.
55
187969
3122
gli accusati neri avevano più probabilità di una sentenza capitale.
03:11
The slightly higher overall sentencing rate for white defendants
56
191091
3975
La percentuale un po' più alta di bianchi condannati alla sentenza capitale
03:15
was due to the fact that cases with white victims
57
195066
3626
era dovuta al fatto che i casi con vittime bianche
03:18
were more likely to elicit a death sentence
58
198692
2667
ottenevano più spesso la sentenza capitale
03:21
than cases where the victim was black,
59
201359
2732
rispetto ai casi con vittime nere,
03:24
and most murders occurred between people of the same race.
60
204091
4392
e la maggior parte degli omicidi avveniva tra persone della stessa razza.
03:28
So how do we avoid falling for the paradox?
61
208483
2836
Quindi come possiamo evitare di cadere in questo paradosso?
03:31
Unfortunately, there's no one-size-fits-all answer.
62
211319
3367
Sfortunatamente, non esiste nessuna risposta che vada sempre bene.
03:34
Data can be grouped and divided in any number of ways,
63
214686
3818
I dati possono essere raggruppati e divisi in moltissimi modi
03:38
and overall numbers may sometimes give a more accurate picture
64
218504
3602
e le cifre complessive in alcuni casi possono dare un'immagine più corretta
03:42
than data divided into misleading or arbitrary categories.
65
222106
4532
rispetto ai dati raggruppati in categorie arbitrarie o fuorvianti.
03:46
All we can do is carefully study the actual situations the statistics describe
66
226638
5451
Tutto ciò che possiamo fare è studiare attentamente
la situazione reale descritta dalla statistica
03:52
and consider whether lurking variables may be present.
67
232089
3888
e considerare se possono essere presenti delle variabili nascoste.
03:55
Otherwise, we leave ourselves vulnerable to those who would use data
68
235977
3401
Se no saremo vulnerabili nei confronti di coloro che vorrebbero usare i dati
03:59
to manipulate others and promote their own agendas.
69
239378
3271
per manipolare gli altri e promuovere i propri obiettivi.
A proposito di questo sito web

Questo sito vi presenterà i video di YouTube utili per l'apprendimento dell'inglese. Vedrete lezioni di inglese tenute da insegnanti di alto livello provenienti da tutto il mondo. Fate doppio clic sui sottotitoli in inglese visualizzati su ogni pagina video per riprodurre il video da lì. I sottotitoli scorrono in sincronia con la riproduzione del video. Se avete commenti o richieste, contattateci tramite questo modulo di contatto.

https://forms.gle/WvT1wiN1qDtmnspy7