The method that can "prove" almost anything - James A. Smith

832,599 views ・ 2021-08-05

TED-Ed


Pro přehrání videa dvakrát klikněte na anglické titulky níže.

Překladatel: Václav Macko Korektor: Vladimír Harašta
00:06
In 2011, a group of researchers conducted a scientific study
0
6371
4167
V roce 2011 provedla skupina badatelů vědeckou studii,
00:10
to find an impossible result:
1
10538
2125
aby dospěli k nemožnému závěru:
00:12
that listening to certain songs can make you younger.
2
12663
3500
že poslechem určitých písní můžete omládnout.
00:16
Their study involved real people, truthfully reported data,
3
16663
3625
Jejich studie zahrnovala skutečné lidi a pravdivě vykazovaná data
00:20
and commonplace statistical analyses.
4
20288
3000
a běžnou statistickou analýzu.
00:23
So how did they do it?
5
23288
1416
Jak se jim to podařilo?
00:24
The answer lies in a statistical method scientists often use
6
24704
4125
Odpověď spočívá ve statistické metodě, kterou vědci často používají,
00:28
to try to figure out whether their results mean something or if they’re random noise.
7
28829
4875
aby zjistili, zda výsledky dávají smysl, nebo zda jsou jen náhodným šumem.
00:33
In fact, the whole point of the music study
8
33704
2625
Celou pointou této hudební studie ve skutečnosti bylo
00:36
was to point out ways this method can be misused.
9
36329
3917
upozornit na způsoby, jak může být tato metoda zneužita.
00:40
A famous thought experiment explains the method:
10
40746
2791
Slavný myšlenkový experiment vysvětluje metodu takto:
00:43
there are eight cups of tea,
11
43746
1750
máme 8 šálků čaje,
00:45
four with the milk added first, and four with the tea added first.
12
45496
4416
do 4 nalijeme nejprve mléko a do 4 zase nejprve čaj.
00:50
A participant must determine which are which according to taste.
13
50162
3625
Účastníci studie musí rozeznat šálky na základě chuti.
00:53
There are 70 different ways the cups can be sorted into two groups of four,
14
53871
4583
Existuje 70 různých způsobů jak tyto šálky rozdělit do 2 skupin po 4
00:58
and only one is correct.
15
58454
2000
a jenom jeden způsob je správný.
01:00
So, can she taste the difference?
16
60662
2584
Dokážou účastníci poznat rozdíl?
01:03
That’s our research question.
17
63246
1625
To je naše výzkumná otázka.
01:04
To analyze her choices, we define what’s called a null hypothesis:
18
64871
4625
Abychom dokázali analyzovat, co zvolí, definujeme nulovou hypotézu:
01:09
that she can’t distinguish the teas.
19
69496
2167
totiž že je nedokážou rozlišit.
01:11
If she can’t distinguish the teas,
20
71871
2042
Pokud nedokážou čaje rozlišit,
01:13
she’ll still get the right answer 1 in 70 times by chance.
21
73913
5166
tak čistě náhodou stejně vyberou správně v 1 případu ze 70.
01:19
1 in 70 is roughly .014.
22
79079
3334
1 ze 70 je zhruba 0,014.
01:22
That single number is called a p-value.
23
82746
3292
Toto číslo se nazývá p-hodnota.
01:26
In many fields, a p-value of .05 or below is considered statistically significant,
24
86038
6916
V mnoha oborech se p-hodnota menší než 0,05 bere jako statisticky významná,
01:32
meaning there’s enough evidence to reject the null hypothesis.
25
92954
3792
což znamená, že existuje dost důkazů k odmítnutí nulové hypotézy.
01:36
Based on a p-value of .014,
26
96996
3375
Na základě p-hodnoty 0,014
01:40
they’d rule out the null hypothesis that she can’t distinguish the teas.
27
100371
4125
by se vyloučila nulová hypotéza, že čaje nedokážou rozlišit.
01:44
Though p-values are commonly used by both researchers and journals
28
104913
3916
Přestože p-hodnoty pro vyhodnocení věděckých výsledků
01:48
to evaluate scientific results,
29
108829
2084
běžně používají výzkumníci i časopisy,
01:50
they’re really confusing, even for many scientists.
30
110913
2958
jsou velice matoucí, a to i pro mnohé vědce.
01:54
That’s partly because all a p-value actually tells us
31
114329
4042
Částečně je to kvůli tomu, že jediné, co nám p-hodnota říká,
01:58
is the probability of getting a certain result,
32
118371
3000
je pravděpodobnost získání určitého výsledku,
02:01
assuming the null hypothesis is true.
33
121371
2917
pokud by byla nulová hypotéza pravdivá.
02:04
So if she correctly sorts the teas,
34
124663
2791
V případě, že účastníci správně roztřídí šálky s čajem,
02:07
the p-value is the probability of her doing so
35
127454
3417
pak p-hodnota určuje pravděpodobnost, že tak učiní,
02:10
assuming she can’t tell the difference.
36
130871
2458
ačkoliv nedokážou rozeznat rozdíl.
02:13
But the reverse isn’t true:
37
133329
2459
Opačně to ale neplatí,
02:15
the p-value doesn’t tell us the probability
38
135788
2416
p-hodnota neudává pravděpodobnost toho, že dokážou rozeznat rozdíl,
02:18
that she can taste the difference,
39
138204
1625
02:19
which is what we’re trying to find out.
40
139829
2084
což je to, na co se snažíme přijít.
02:22
So if a p-value doesn’t answer the research question,
41
142329
3250
Když ale p-hodnota neodpovídá na výzkumnou otázku,
02:25
why does the scientific community use it?
42
145579
2292
proč ji vědecké obce používají?
02:28
Well, because even though a p-value doesn’t directly state the probability
43
148329
4709
No, protože ačkoli neudává přímo pravděpodobnost,
02:33
that the results are due to random chance,
44
153038
2500
že určité výsledky jsou důsledkem náhody,
02:35
it usually gives a pretty reliable indication.
45
155538
3333
je obvykle docela spolehlivým ukazatelem.
02:39
At least, it does when used correctly.
46
159204
2792
Tedy v případě, že je použita správně.
02:41
And that’s where many researchers, and even whole fields,
47
161996
3917
A tady naráží nejen badatelé, ale celé vědní obory na problém.
02:45
have run into trouble.
48
165913
1458
02:47
Most real studies are more complex than the tea experiment.
49
167538
3458
Většina skutečných studií je složitějších než tento čajový experiment.
02:51
Scientists can test their research question in multiple ways,
50
171288
3375
Vědci mohou otestovat své výzkumné otázky různými způsoby
02:54
and some of these tests might produce a statistically significant result,
51
174663
4375
a některé z těchto způsobů mohou přinést statisticky významné výsledky,
02:59
while others don’t.
52
179038
1208
zatímco ostatní nemusí.
03:00
It might seem like a good idea to test every possibility.
53
180454
3167
Může se zdát jako dobrý nápad vyzkoušet všechny možnosti,
03:03
But it’s not, because with each additional test,
54
183913
3083
ale není tomu tak, protože každý další test
03:07
the chance of a false positive increases.
55
187163
3208
s sebou přináší možnost falešně pozitivního výsledku.
03:10
Searching for a low p-value, and then presenting only that analysis,
56
190996
4500
Hledání nízké p-hodnoty a pak prezentace jen takové analýzy
03:15
is often called p-hacking.
57
195496
2750
se nazývá p-hacking.
03:18
It’s like throwing darts until you hit a bullseye
58
198246
2750
Je to jako házet šipky, dokud netrefíte střed terče,
03:20
and then saying you only threw the dart that hit the bull’s eye.
59
200996
3333
a pak říkat, že jste hodili jen tu jednu šipku.
03:24
This is exactly what the music researchers did.
60
204746
3208
Přesně tak to udělali badatelé ze studie o hudbě.
03:28
They played three groups of participants each a different song
61
208079
3709
Každé ze 3 skupin účastníků pustili jinou píseň
03:31
and collected lots of information about them.
62
211788
2500
a nasbírali o nich množství informací.
03:34
The analysis they published included only two out of the three groups.
63
214288
4250
Analýza, kterou publikovali, však obsahovala jen 2 ze 3 skupin.
03:38
Of all the information they collected,
64
218538
2208
Ze všech informací, které nasbírali,
03:40
their analysis only used participants’ fathers’ age—
65
220746
3542
používala analýza pouze věk otce účastníka,
03:44
to “control for variation in baseline age across participants.”
66
224288
4541
aby „ověřila odchylky s ohledem na referenční věk účastníků“.
03:49
They also paused their experiment after every ten participants,
67
229246
4208
Taktéž pozastavili experiment po každých 10 účastnících
03:53
and continued if the p-value was above .05,
68
233454
4459
a pokračovali pouze pokud byla p-hodnota větší než 0,05,
03:57
but stopped when it dipped below .05.
69
237913
3291
a přestali, když se dostala pod 0,05.
04:01
They found that participants who heard one song were 1.5 years younger
70
241746
5208
Zjistili, že účastníci, kteří poslouchali jednu píseň,
byli o 1,5 roku mladší než ti,
04:06
than those who heard the other song, with a p-value of .04.
71
246954
4375
kteří poslouchali jinou píseň s p-hodnotou 0,04.
04:12
Usually it’s much tougher to spot p-hacking,
72
252163
2833
Obvykle je daleko těžší p-hacking odhalit,
04:14
because we don’t know the results are impossible:
73
254996
2667
protože nevíme, že určitý výsledek není možný.
04:17
the whole point of doing experiments is to learn something new.
74
257663
3416
Celá pointa experimentů spočívá v tom, abychom se naučili něco nového.
04:21
Fortunately, there’s a simple way to make p-values more reliable:
75
261329
4209
Naštěstí existuje jednoduchý způsob jak zvýšit spolehlivosti p-hodnot:
04:25
pre-registering a detailed plan for the experiment and analysis
76
265913
4708
předem ohlásit detailní plán experimentu a analýzy,
04:30
beforehand that others can check,
77
270621
2458
aby je ostatní mohli ověřit,
04:33
so researchers can’t keep trying different analyses
78
273079
3417
protože badatelé nemohou neustále zkoušet různé analýzy,
04:36
until they find a significant result.
79
276496
2125
aby našli nějaký významný výsledek.
04:38
And, in the true spirit of scientific inquiry,
80
278788
2458
A v ryzím duchu vědeckého bádání
04:41
there’s even a new field that’s basically science doing science on itself:
81
281246
5375
dokonce existuje nový obor, kde věda v podstatě zkoumá sama sebe
04:46
studying scientific practices in order to improve them.
82
286621
3667
a studuje vědecké postupy za účelem jejich zlepšování.
O tomto webu

Tato stránka vám představí videa na YouTube, která jsou užitečná pro výuku angličtiny. Uvidíte lekce angličtiny vedené špičkovými učiteli z celého světa. Dvojklikem na anglické titulky zobrazené na každé stránce s videem si video přehrajete přímo odtud. Titulky se posouvají synchronizovaně s přehráváním videa. Pokud máte nějaké připomínky nebo požadavky, kontaktujte nás prosím pomocí tohoto kontaktního formuláře.

https://forms.gle/WvT1wiN1qDtmnspy7