The method that can "prove" almost anything - James A. Smith

834,995 views ・ 2021-08-05

TED-Ed


Veuillez double-cliquer sur les sous-titres anglais ci-dessous pour lire la vidéo.

Traducteur: Eva Marxer Relecteur: eric vautier
00:06
In 2011, a group of researchers conducted a scientific study
0
6371
4167
En 2011, un groupe de chercheurs a réalité une étude scientifique
00:10
to find an impossible result:
1
10538
2125
pour trouver un résultat impossible :
00:12
that listening to certain songs can make you younger.
2
12663
3500
écouter certaines chansons peut vous rajeunir.
00:16
Their study involved real people, truthfully reported data,
3
16663
3625
Leur étude incluait des vraies personnes, des données véridiques,
00:20
and commonplace statistical analyses.
4
20288
3000
et des analyses statistiques banales.
00:23
So how did they do it?
5
23288
1416
Comment ont-ils fait ?
00:24
The answer lies in a statistical method scientists often use
6
24704
4125
La réponse repose dans une méthode statistique
que les scientifiques utilisent souvent
00:28
to try to figure out whether their results mean something or if they’re random noise.
7
28829
4875
pour tenter de savoir si leurs résultats sont pertinents ou aléatoires.
00:33
In fact, the whole point of the music study
8
33704
2625
En fait, l’idée derrière l’étude de la musique
00:36
was to point out ways this method can be misused.
9
36329
3917
était de montrer les manières dont cette méthode pouvait être mal utilisée.
00:40
A famous thought experiment explains the method:
10
40746
2791
Une célèbre expérimentation explique cette méthode :
00:43
there are eight cups of tea,
11
43746
1750
il y a huit tasses de thé,
00:45
four with the milk added first, and four with the tea added first.
12
45496
4416
quatre avec du lait mis en premier, et quatre avec le thé mis en premier.
00:50
A participant must determine which are which according to taste.
13
50162
3625
Une participante doit déterminer au goût lesquelles sont lesquelles.
00:53
There are 70 different ways the cups can be sorted into two groups of four,
14
53871
4583
Il y a 70 moyens différents de trier les tasses en deux groupes de quatre,
00:58
and only one is correct.
15
58454
2000
et seule une est correcte.
01:00
So, can she taste the difference?
16
60662
2584
Donc, peut-elle sentir la différence ?
01:03
That’s our research question.
17
63246
1625
C’est notre question de recherche.
01:04
To analyze her choices, we define what’s called a null hypothesis:
18
64871
4625
Pour analyser ses choix, nous définissons ce qu’on appelle une hypothèse zéro :
01:09
that she can’t distinguish the teas.
19
69496
2167
elle ne peut pas distinguer les thés.
01:11
If she can’t distinguish the teas,
20
71871
2042
Si elle ne peut pas distinguer les thés,
01:13
she’ll still get the right answer 1 in 70 times by chance.
21
73913
5166
il y a quand même 1 chance sur 70 qu’elle ait la bonne réponse.
01:19
1 in 70 is roughly .014.
22
79079
3334
1 sur 70 signifie 0,014.
01:22
That single number is called a p-value.
23
82746
3292
Ce chiffre est appelé une valeur p.
01:26
In many fields, a p-value of .05 or below is considered statistically significant,
24
86038
6916
Dans plein de domaines, une valeur p de 0,05 ou moins
est considérée comme statistiquement significative,
01:32
meaning there’s enough evidence to reject the null hypothesis.
25
92954
3792
ce qui signifie qu’il y a assez de preuves pour rejeter l’hypothèse zéro.
01:36
Based on a p-value of .014,
26
96996
3375
En se basant sur une valeur p de 0,014,
01:40
they’d rule out the null hypothesis that she can’t distinguish the teas.
27
100371
4125
ils ont écarté l’hypothèse zéro qu’elle ne peut pas distinguer les thés.
01:44
Though p-values are commonly used by both researchers and journals
28
104913
3916
Bien que les valeurs p soient communément utilisées
par les chercheurs et les journalistes pour évaluer les résultats scientifiques,
01:48
to evaluate scientific results,
29
108829
2084
01:50
they’re really confusing, even for many scientists.
30
110913
2958
elles sont très déroutantes même pour de nombreux scientifiques.
01:54
That’s partly because all a p-value actually tells us
31
114329
4042
C’est aussi partiellement parce que tout ce qu’une valeur p nous dit vraiment,
01:58
is the probability of getting a certain result,
32
118371
3000
c’est la probabilité d’avoir un certain résultat,
02:01
assuming the null hypothesis is true.
33
121371
2917
en partant du principe que l’hypothèse zéro est vraie.
02:04
So if she correctly sorts the teas,
34
124663
2791
Donc si elle trie correctement les thés,
02:07
the p-value is the probability of her doing so
35
127454
3417
la valeur p est la probabilité qu’elle le fasse
02:10
assuming she can’t tell the difference.
36
130871
2458
en partant du principe qu’elle ne peut pas faire la différence.
02:13
But the reverse isn’t true:
37
133329
2459
Mais l’inverse n’est pas vrai :
02:15
the p-value doesn’t tell us the probability
38
135788
2416
la valeur p ne nous dit pas la probabilité
qu’elle puisse sentir la différence -
02:18
that she can taste the difference,
39
138204
1625
02:19
which is what we’re trying to find out.
40
139829
2084
qui est ce que nous essayons de trouver.
02:22
So if a p-value doesn’t answer the research question,
41
142329
3250
Donc si une valeur p ne répond pas à la question de recherche,
02:25
why does the scientific community use it?
42
145579
2292
pourquoi la communauté scientifique l’utilise ?
02:28
Well, because even though a p-value doesn’t directly state the probability
43
148329
4709
Eh bien, même si une valeur p ne donne pas directement la probabilité
02:33
that the results are due to random chance,
44
153038
2500
que les résultats soient dus à un choix aléatoire,
02:35
it usually gives a pretty reliable indication.
45
155538
3333
elle donne généralement une indication plutôt fiable.
Au moins, elle le fait quand elle est correctement utilisée.
02:39
At least, it does when used correctly.
46
159204
2792
02:41
And that’s where many researchers, and even whole fields,
47
161996
3917
Et c’est là que beaucoup de chercheurs, et même des domaines entiers,
02:45
have run into trouble.
48
165913
1458
ont eu des problèmes.
02:47
Most real studies are more complex than the tea experiment.
49
167538
3458
La plupart des études sont plus complexes que l’expérience des thés.
Les scientifiques peuvent tester leur question de recherche de bien des manières
02:51
Scientists can test their research question in multiple ways,
50
171288
3375
02:54
and some of these tests might produce a statistically significant result,
51
174663
4375
et certains de ces tests peuvent produire un résultat statistiquement significatif,
02:59
while others don’t.
52
179038
1208
tandis que d’autres non.
03:00
It might seem like a good idea to test every possibility.
53
180454
3167
Cela peut sembler être une bonne idée de tester toutes les possibilités.
03:03
But it’s not, because with each additional test,
54
183913
3083
Mais ça ne l’est pas car avec chaque nouveau test,
03:07
the chance of a false positive increases.
55
187163
3208
la chance d’obtenir un faux positif augmente.
03:10
Searching for a low p-value, and then presenting only that analysis,
56
190996
4500
Chercher une valeur p basse et présenter ensuite seulement cette analyse,
03:15
is often called p-hacking.
57
195496
2750
est souvent appelé piratage p.
C’est comme jeter des fléchettes jusqu’à atteindre le centre
03:18
It’s like throwing darts until you hit a bullseye
58
198246
2750
03:20
and then saying you only threw the dart that hit the bull’s eye.
59
200996
3333
et dire ensuite que vous assez seulement jeté la fléchette qui l’a atteint.
03:24
This is exactly what the music researchers did.
60
204746
3208
C’est exactement ce que les chercheurs de la musique ont fait.
03:28
They played three groups of participants each a different song
61
208079
3709
Ils ont fait écouté une musique différente à trois groupes de participants
03:31
and collected lots of information about them.
62
211788
2500
et ont collecté beaucoup d’informations sur ces derniers.
03:34
The analysis they published included only two out of the three groups.
63
214288
4250
L’analyse publiée comprenait seulement deux des trois groupes.
03:38
Of all the information they collected,
64
218538
2208
De toutes les informations qu’ils avaient collectées,
03:40
their analysis only used participants’ fathers’ age—
65
220746
3542
leur analyse utilisait seulement l’âge des pères des participants --
03:44
to “control for variation in baseline age across participants.”
66
224288
4541
pour « contrôler la variation de l’âge de référence entre les participants ».
03:49
They also paused their experiment after every ten participants,
67
229246
4208
Ils ont aussi suspendu leur expérience tous les dix participants,
03:53
and continued if the p-value was above .05,
68
233454
4459
et ont continué si la valeur p était au-dessus de 0,05,
03:57
but stopped when it dipped below .05.
69
237913
3291
mais ont arrêté quand elle est passée dessous.
04:01
They found that participants who heard one song were 1.5 years younger
70
241746
5208
Ils ont trouvé que les participants qui écoutaient une musique
étaient un an et demi plus jeunes
04:06
than those who heard the other song, with a p-value of .04.
71
246954
4375
que ceux qui écoutaient l’autre musique avec une valeur p de 0,04.
04:12
Usually it’s much tougher to spot p-hacking,
72
252163
2833
Souvent c’est plus dur de déceler le piratage p,
04:14
because we don’t know the results are impossible:
73
254996
2667
car nous ne savons pas que les résultats sont impossibles :
04:17
the whole point of doing experiments is to learn something new.
74
257663
3416
le but de faire des expérimentations est d’apprendre quelque chose de nouveau.
04:21
Fortunately, there’s a simple way to make p-values more reliable:
75
261329
4209
Heureusement, il y a une manière simple de rendre les valeurs p plus fiables :
04:25
pre-registering a detailed plan for the experiment and analysis
76
265913
4708
préenregistrer d’avance un plan détaillé pour l’expérimentation et les analyses,
04:30
beforehand that others can check,
77
270621
2458
que les autres peuvent vérifier,
afin que les chercheurs ne puissent continuer à tenter différentes analyses
04:33
so researchers can’t keep trying different analyses
78
273079
3417
04:36
until they find a significant result.
79
276496
2125
jusqu’à trouver un résultat significatif.
04:38
And, in the true spirit of scientific inquiry,
80
278788
2458
Et, dans le vrai esprit de l’enquête scientifique,
04:41
there’s even a new field that’s basically science doing science on itself:
81
281246
5375
il existe même un nouveau domaine qui est la science
faisant de la science sur elle-même :
04:46
studying scientific practices in order to improve them.
82
286621
3667
étudier les pratiques scientifiques afin de les améliorer.
À propos de ce site Web

Ce site vous présentera des vidéos YouTube utiles pour apprendre l'anglais. Vous verrez des leçons d'anglais dispensées par des professeurs de premier ordre du monde entier. Double-cliquez sur les sous-titres anglais affichés sur chaque page de vidéo pour lire la vidéo à partir de là. Les sous-titres défilent en synchronisation avec la lecture de la vidéo. Si vous avez des commentaires ou des demandes, veuillez nous contacter en utilisant ce formulaire de contact.

https://forms.gle/WvT1wiN1qDtmnspy7