The method that can "prove" almost anything - James A. Smith

816,442 views ・ 2021-08-05

TED-Ed


下の英語字幕をダブルクリックすると動画を再生できます。

翻訳: Yoshiaki Yamagami 校正: Tomoyuki Suzuki
00:06
In 2011, a group of researchers conducted a scientific study
0
6371
4167
2011年に ある研究者のグループが 科学的な研究を実施し
00:10
to find an impossible result:
1
10538
2125
ありえない結果を得ました
00:12
that listening to certain songs can make you younger.
2
12663
3500
ある歌を聴くと若返るという結果です
00:16
Their study involved real people, truthfully reported data,
3
16663
3625
彼らの研究は 本物の人々 正直に報告されたデータ
00:20
and commonplace statistical analyses.
4
20288
3000
普通の統計分析で行われました
では その研究結果は どのようにして得られたのでしょうか
00:23
So how did they do it?
5
23288
1416
00:24
The answer lies in a statistical method scientists often use
6
24704
4125
その答えは 結果に何らかの意味があるのか あるいは 単なるランダムノイズなのかを
00:28
to try to figure out whether their results mean something or if they’re random noise.
7
28829
4875
科学者が見極めるときに よく用いる統計学的手法の中にあります
00:33
In fact, the whole point of the music study
8
33704
2625
実際 先ほどの音楽の研究の核心は
00:36
was to point out ways this method can be misused.
9
36329
3917
この手法が誤用される事例を 指摘することでした
00:40
A famous thought experiment explains the method:
10
40746
2791
有名な思考実験が この手法を 明らかにします
00:43
there are eight cups of tea,
11
43746
1750
ミルクティーのカップが8個あります
00:45
four with the milk added first, and four with the tea added first.
12
45496
4416
4個は ミルクを最初に注いだもので 残りの4個は 紅茶を最初に注いだものです
00:50
A participant must determine which are which according to taste.
13
50162
3625
被験者は それぞれのカップが どちらかを味をみて 判定します
00:53
There are 70 different ways the cups can be sorted into two groups of four,
14
53871
4583
8個のカップを 4個ずつの2つのグループに 分ける分け方は70通りで
00:58
and only one is correct.
15
58454
2000
その中のひとつだけが正解です
01:00
So, can she taste the difference?
16
60662
2584
被験者は 味の違いが判るでしょうか?
01:03
That’s our research question.
17
63246
1625
それが ここでの研究課題です
01:04
To analyze her choices, we define what’s called a null hypothesis:
18
64871
4625
被験者の選択を分析するため 被験者は区別をつけられないという
01:09
that she can’t distinguish the teas.
19
69496
2167
帰無仮説を立てます
01:11
If she can’t distinguish the teas,
20
71871
2042
被験者が 区別をつけられなくても
01:13
she’ll still get the right answer 1 in 70 times by chance.
21
73913
5166
70回に1回は 偶然 正解する可能性があります
01:19
1 in 70 is roughly .014.
22
79079
3334
70分の1は およそ0.014です
01:22
That single number is called a p-value.
23
82746
3292
この数値は p値と呼ばれます
01:26
In many fields, a p-value of .05 or below is considered statistically significant,
24
86038
6916
様々な分野において 0.05以下のp値は 統計的に有意
01:32
meaning there’s enough evidence to reject the null hypothesis.
25
92954
3792
すなわち 帰無仮説を棄却する 十分な根拠があることを意味します
01:36
Based on a p-value of .014,
26
96996
3375
p値が0.014であることから 研究者たちは
01:40
they’d rule out the null hypothesis that she can’t distinguish the teas.
27
100371
4125
被験者は 紅茶を区別できないとする 帰無仮説を棄却しました
01:44
Though p-values are commonly used by both researchers and journals
28
104913
3916
p値は 研究者や専門誌によって 科学的結果を評価するために
01:48
to evaluate scientific results,
29
108829
2084
一般的に使われていますが
01:50
they’re really confusing, even for many scientists.
30
110913
2958
多くの科学者にとっても 本当に 分かりにくいものです
01:54
That’s partly because all a p-value actually tells us
31
114329
4042
その理由のひとつは いずれの場合もp値は
01:58
is the probability of getting a certain result,
32
118371
3000
帰無仮説を真と仮定した場合に ある特定の結果を得る確率を
02:01
assuming the null hypothesis is true.
33
121371
2917
示しているからです
02:04
So if she correctly sorts the teas,
34
124663
2791
つまり 被験者が 紅茶を正しく選別した場合において
02:07
the p-value is the probability of her doing so
35
127454
3417
p値は 被験者が 実は区別できていなくても
02:10
assuming she can’t tell the difference.
36
130871
2458
正しい選別がなされる確率です
02:13
But the reverse isn’t true:
37
133329
2459
しかし 逆は真ではありません
02:15
the p-value doesn’t tell us the probability
38
135788
2416
p値は 被験者が紅茶を 正しく選別できる確率を
02:18
that she can taste the difference,
39
138204
1625
示しているわけではありませんが
02:19
which is what we’re trying to find out.
40
139829
2084
正しく選別する確率こそ 私たちが 求めているものです
02:22
So if a p-value doesn’t answer the research question,
41
142329
3250
では もし p値が 研究課題の答えにならないのであれば
02:25
why does the scientific community use it?
42
145579
2292
科学界は なぜ p値を使うのでしょうか?
02:28
Well, because even though a p-value doesn’t directly state the probability
43
148329
4709
なぜなら p値は 結果が偶然である可能性を
02:33
that the results are due to random chance,
44
153038
2500
直接 示すわけではありませんが
02:35
it usually gives a pretty reliable indication.
45
155538
3333
通常 かなり確かな示唆を提供します
02:39
At least, it does when used correctly.
46
159204
2792
少なくとも 正しく使われた場合は そうです
02:41
And that’s where many researchers, and even whole fields,
47
161996
3917
そして まさにここに 多くの科学者 さらには 専門領域全体が
02:45
have run into trouble.
48
165913
1458
陥る問題点があります
02:47
Most real studies are more complex than the tea experiment.
49
167538
3458
たいていの実際の研究は 先ほどの 紅茶の実験より複雑です
02:51
Scientists can test their research question in multiple ways,
50
171288
3375
科学者は 研究課題を複数の手法で検証します
02:54
and some of these tests might produce a statistically significant result,
51
174663
4375
そして 統計的に有意な結果が いくつかの手法で得られる一方 他の手法では
02:59
while others don’t.
52
179038
1208
得られないかもしれません
03:00
It might seem like a good idea to test every possibility.
53
180454
3167
全ての可能性を検証することは よい考えのように思えます
03:03
But it’s not, because with each additional test,
54
183913
3083
しかし そうではありません なぜなら 追加検証するごとに
03:07
the chance of a false positive increases.
55
187163
3208
誤って真であると判断する可能性が 高まるからです
03:10
Searching for a low p-value, and then presenting only that analysis,
56
190996
4500
低いp値を探し出し その分析のみを提示することは
03:15
is often called p-hacking.
57
195496
2750
しばしば p値ハッキングと呼ばれます
03:18
It’s like throwing darts until you hit a bullseye
58
198246
2750
これは まるで ど真ん中に命中するまでダーツを投げた後
03:20
and then saying you only threw the dart that hit the bull’s eye.
59
200996
3333
投げたのは ど真ん中に当たったダーツだけと 主張するようなものです
03:24
This is exactly what the music researchers did.
60
204746
3208
これが まさに 冒頭の音楽の研究者が行ったことです
03:28
They played three groups of participants each a different song
61
208079
3709
研究者たちは 3つの被験者のグループに 別々の歌を聴かせて
03:31
and collected lots of information about them.
62
211788
2500
たくさんの情報を集めました
03:34
The analysis they published included only two out of the three groups.
63
214288
4250
研究者が公表した分析には3グループのうち 2グループしか含まれていませんでした
03:38
Of all the information they collected,
64
218538
2208
集めた全ての情報のうち
03:40
their analysis only used participants’ fathers’ age—
65
220746
3542
分析に用いられたのは 被験者の父親の年齢だけでした ―
03:44
to “control for variation in baseline age across participants.”
66
224288
4541
「被験者間の 基準となる年齢の ばらつきを抑える」目的です
03:49
They also paused their experiment after every ten participants,
67
229246
4208
また 研究者たちは 10人の被験者ごとに実験を中断して
03:53
and continued if the p-value was above .05,
68
233454
4459
p値が0.05より大きければ 実験を継続し
03:57
but stopped when it dipped below .05.
69
237913
3291
0.05を下回ったときに 実験を停止しました
04:01
They found that participants who heard one song were 1.5 years younger
70
241746
5208
研究者たちは ある歌を聴いた被験者は 別の歌を聴いた被験者より
04:06
than those who heard the other song, with a p-value of .04.
71
246954
4375
1.5歳若く p値は0.04となることを 発見しました
04:12
Usually it’s much tougher to spot p-hacking,
72
252163
2833
一般的には p値ハッキングを見破ることは さらに困難です
04:14
because we don’t know the results are impossible:
73
254996
2667
その結果が あり得ないことだとは 知りようがなく
04:17
the whole point of doing experiments is to learn something new.
74
257663
3416
そもそも 実験の本質は 何か新しいことを 知ろうとすることだからです
04:21
Fortunately, there’s a simple way to make p-values more reliable:
75
261329
4209
幸い p値を もっと信頼できるものにする 簡単な方法があります
04:25
pre-registering a detailed plan for the experiment and analysis
76
265913
4708
実験と分析方法の詳細な計画を
あらかじめ 第三者がチェックできるよう 事前登録します
04:30
beforehand that others can check,
77
270621
2458
04:33
so researchers can’t keep trying different analyses
78
273079
3417
こうすれば研究者が 有意な結果が得られるまでの間に
分析方法を変えながら 試行を続けることはできません
04:36
until they find a significant result.
79
276496
2125
04:38
And, in the true spirit of scientific inquiry,
80
278788
2458
さらに 科学研究の本来の精神にのっとって
04:41
there’s even a new field that’s basically science doing science on itself:
81
281246
5375
基本的に科学を自ら科学する 新しい領域があります
04:46
studying scientific practices in order to improve them.
82
286621
3667
それは 科学的手法を改善するための 科学的手法の研究です
このウェブサイトについて

このサイトでは英語学習に役立つYouTube動画を紹介します。世界中の一流講師による英語レッスンを見ることができます。各ビデオのページに表示される英語字幕をダブルクリックすると、そこからビデオを再生することができます。字幕はビデオの再生と同期してスクロールします。ご意見・ご要望がございましたら、こちらのお問い合わせフォームよりご連絡ください。

https://forms.gle/WvT1wiN1qDtmnspy7