The method that can "prove" almost anything - James A. Smith

816,442 views ・ 2021-08-05

TED-Ed


Пожалуйста, дважды щелкните на английские субтитры ниже, чтобы воспроизвести видео.

Переводчик: Yekaterina Jussupova Редактор: Anton Zamaraev
00:06
In 2011, a group of researchers conducted a scientific study
0
6371
4167
В 2011 году группа учёных запустила исследование,
00:10
to find an impossible result:
1
10538
2125
доказавшее нечто невероятное:
00:12
that listening to certain songs can make you younger.
2
12663
3500
прослушивание определённых песен приводит к омоложению.
00:16
Their study involved real people, truthfully reported data,
3
16663
3625
В исследовании участвовали реальные люди, использовались достоверные данные
00:20
and commonplace statistical analyses.
4
20288
3000
и общепринятые методы статистического анализа.
00:23
So how did they do it?
5
23288
1416
Как же они это доказали?
00:24
The answer lies in a statistical method scientists often use
6
24704
4125
Дело в одном статистическим методе, который учёные часто используют,
00:28
to try to figure out whether their results mean something or if they’re random noise.
7
28829
4875
чтобы понять, действительно ли результаты значимы или это случайное совпадение.
00:33
In fact, the whole point of the music study
8
33704
2625
Настоящей целью этого музыкального исследования
00:36
was to point out ways this method can be misused.
9
36329
3917
было показать, как вышеупомянутый метод может неверно использоваться.
00:40
A famous thought experiment explains the method:
10
40746
2791
Понять его помогает известный мыслительный эксперимент.
00:43
there are eight cups of tea,
11
43746
1750
Даны восемь чашек чая с молоком.
00:45
four with the milk added first, and four with the tea added first.
12
45496
4416
В четыре из них сначала налили молоко, а в другие четыре — чай.
00:50
A participant must determine which are which according to taste.
13
50162
3625
Участники должны определить по вкусу, в какую чашку что было налито первым.
00:53
There are 70 different ways the cups can be sorted into two groups of four,
14
53871
4583
Существуют 70 способов распределения чашек на две группы по четыре чашки в каждой,
00:58
and only one is correct.
15
58454
2000
но лишь один из них — правильный.
01:00
So, can she taste the difference?
16
60662
2584
Так почувствует ли разницу участница эксперимента?
01:03
That’s our research question.
17
63246
1625
Это предмет нашего исследования.
01:04
To analyze her choices, we define what’s called a null hypothesis:
18
64871
4625
Для анализа определим так называемую нулевую гипотезу:
участница не сможет определить разницу во вкусе чая.
01:09
that she can’t distinguish the teas.
19
69496
2167
01:11
If she can’t distinguish the teas,
20
71871
2042
Даже если она не почувствует разницу,
01:13
she’ll still get the right answer 1 in 70 times by chance.
21
73913
5166
то в одном случае из семидесяти всё же случайно даст верный ответ.
01:19
1 in 70 is roughly .014.
22
79079
3334
1 из 70 примерно равно 0,014.
01:22
That single number is called a p-value.
23
82746
3292
Это число называется p-значением.
01:26
In many fields, a p-value of .05 or below is considered statistically significant,
24
86038
6916
Обычно p-значение, равное 0,05 и меньше, считается статистически значимым,
01:32
meaning there’s enough evidence to reject the null hypothesis.
25
92954
3792
то есть достаточным для того, чтобы признать нулевую гипотезу неверной.
01:36
Based on a p-value of .014,
26
96996
3375
Наше p-значение равно 0,014, и значит мы признаём гипотезу,
01:40
they’d rule out the null hypothesis that she can’t distinguish the teas.
27
100371
4125
что участница не определит разницу, неверной.
01:44
Though p-values are commonly used by both researchers and journals
28
104913
3916
Хотя p-значение часто используется как в исследованиях, так и в публикациях
01:48
to evaluate scientific results,
29
108829
2084
для оценки научных результатов,
01:50
they’re really confusing, even for many scientists.
30
110913
2958
даже многие учёные затрудняются в его толковании.
01:54
That’s partly because all a p-value actually tells us
31
114329
4042
Отчасти это происходит потому, что p-значение указывает
01:58
is the probability of getting a certain result,
32
118371
3000
на вероятность определённого результата
02:01
assuming the null hypothesis is true.
33
121371
2917
в предположении, что нулевая гипотеза верна.
02:04
So if she correctly sorts the teas,
34
124663
2791
Поэтому если участница правильно распознает чай,
02:07
the p-value is the probability of her doing so
35
127454
3417
то p-значение является вероятностью успеха при условии,
02:10
assuming she can’t tell the difference.
36
130871
2458
что она не может почувствовать разницу.
02:13
But the reverse isn’t true:
37
133329
2459
Но обратное неверно:
02:15
the p-value doesn’t tell us the probability
38
135788
2416
p-значение не даёт вероятность того,
что она может определить разницу по вкусу,
02:18
that she can taste the difference,
39
138204
1625
02:19
which is what we’re trying to find out.
40
139829
2084
а это именно то, что мы пытаемся выяснить.
02:22
So if a p-value doesn’t answer the research question,
41
142329
3250
Но если p-значение не отвечает на вопрос исследования,
02:25
why does the scientific community use it?
42
145579
2292
почему же учёные постоянно его используют?
02:28
Well, because even though a p-value doesn’t directly state the probability
43
148329
4709
Потому что, хотя p-значение и не даёт вероятность того,
02:33
that the results are due to random chance,
44
153038
2500
что результаты исследования случайны,
02:35
it usually gives a pretty reliable indication.
45
155538
3333
оно всё же обычно является достаточно надёжным показателем.
02:39
At least, it does when used correctly.
46
159204
2792
По крайней мере, при правильной интерпретации.
02:41
And that’s where many researchers, and even whole fields,
47
161996
3917
А именно с этим у многих учёных, и даже у целых областей науки,
02:45
have run into trouble.
48
165913
1458
возникают трудности.
02:47
Most real studies are more complex than the tea experiment.
49
167538
3458
Большинство настоящих исследований куда сложнее, чем эксперимент с чаем.
02:51
Scientists can test their research question in multiple ways,
50
171288
3375
Учёные используют в исследовании различные подходы,
02:54
and some of these tests might produce a statistically significant result,
51
174663
4375
и некоторые из них показывают статистически значимые результаты,
в то время как другие — нет.
02:59
while others don’t.
52
179038
1208
03:00
It might seem like a good idea to test every possibility.
53
180454
3167
Может показаться, что использование разных методов — хорошая идея.
03:03
But it’s not, because with each additional test,
54
183913
3083
Но это не так, ведь каждое новое испытание
03:07
the chance of a false positive increases.
55
187163
3208
увеличивает шанс получения ложноположительного результата.
03:10
Searching for a low p-value, and then presenting only that analysis,
56
190996
4500
Целенаправленный поиск низкого p-значения с дальнейшим учётом для анализа его одного
03:15
is often called p-hacking.
57
195496
2750
часто называют вылавливанием данных.
03:18
It’s like throwing darts until you hit a bullseye
58
198246
2750
Это как бросать дротики пока не попадёте в «яблочко»,
03:20
and then saying you only threw the dart that hit the bull’s eye.
59
200996
3333
а потом заявить, что бросили всего один дротик и сразу попали в центр мишени.
03:24
This is exactly what the music researchers did.
60
204746
3208
Именно это и сделали в музыкальном исследовании.
03:28
They played three groups of participants each a different song
61
208079
3709
Участникам в каждой из трёх групп включали разные песни,
03:31
and collected lots of information about them.
62
211788
2500
после чего собирали о них многочисленную информацию.
03:34
The analysis they published included only two out of the three groups.
63
214288
4250
В опубликованных результатах учитывались лишь две группы из трёх.
03:38
Of all the information they collected,
64
218538
2208
Из всей собранной информации
03:40
their analysis only used participants’ fathers’ age—
65
220746
3542
использовался только возраст отцов участников,
03:44
to “control for variation in baseline age across participants.”
66
224288
4541
так как это позволяло «сократить возрастной разброс».
03:49
They also paused their experiment after every ten participants,
67
229246
4208
Вдобавок после каждого десятого участника проверялось p-значение:
03:53
and continued if the p-value was above .05,
68
233454
4459
если оно было выше 0,05 — эксперимент продолжали,
03:57
but stopped when it dipped below .05.
69
237913
3291
а если ниже — его останавливали.
04:01
They found that participants who heard one song were 1.5 years younger
70
241746
5208
Было обнаружено, что те, кто прослушал одну из песен, были на 1,5 года моложе
04:06
than those who heard the other song, with a p-value of .04.
71
246954
4375
тех, кто прослушал другую песню — с p-значением равным 0,04.
04:12
Usually it’s much tougher to spot p-hacking,
72
252163
2833
Обычно обнаружить вылавливание данных куда сложнее,
04:14
because we don’t know the results are impossible:
73
254996
2667
ведь мы не знаем, какие результаты получить невозможно:
04:17
the whole point of doing experiments is to learn something new.
74
257663
3416
эксперименты проводят как раз для того, чтобы открыть что-то новое.
04:21
Fortunately, there’s a simple way to make p-values more reliable:
75
261329
4209
К счастью, есть простой способ повышения надёжности p-значения:
04:25
pre-registering a detailed plan for the experiment and analysis
76
265913
4708
заранее расписать процедуру исследования и анализа
04:30
beforehand that others can check,
77
270621
2458
и сделать этот протокол доступным для проверки,
04:33
so researchers can’t keep trying different analyses
78
273079
3417
чтобы учёные не могли прибегать к дополнительным методам
04:36
until they find a significant result.
79
276496
2125
вплоть до получения значимого результата.
04:38
And, in the true spirit of scientific inquiry,
80
278788
2458
Вот так на волне истинного научного знания
04:41
there’s even a new field that’s basically science doing science on itself:
81
281246
5375
появилась новая область науки, занимающаяся изучением самой себя:
04:46
studying scientific practices in order to improve them.
82
286621
3667
она исследует научные методы с целью их улучшения.
Об этом сайте

Этот сайт познакомит вас с видеороликами YouTube, полезными для изучения английского языка. Вы увидите уроки английского языка, преподаваемые высококлассными учителями со всего мира. Дважды щелкните по английским субтитрам, отображаемым на каждой странице видео, чтобы воспроизвести видео оттуда. Субтитры прокручиваются синхронно с воспроизведением видео. Если у вас есть какие-либо комментарии или пожелания, пожалуйста, свяжитесь с нами, используя эту контактную форму.

https://forms.gle/WvT1wiN1qDtmnspy7