下の英語字幕をダブルクリックすると動画を再生できます。
翻訳: Yoshiaki Yamagami
校正: Tomoyuki Suzuki
00:06
In 2011, a group of researchers conducted
a scientific study
0
6371
4167
2011年に ある研究者のグループが
科学的な研究を実施し
00:10
to find an impossible result:
1
10538
2125
ありえない結果を得ました
00:12
that listening to certain songs
can make you younger.
2
12663
3500
ある歌を聴くと若返るという結果です
00:16
Their study involved real people,
truthfully reported data,
3
16663
3625
彼らの研究は 本物の人々
正直に報告されたデータ
00:20
and commonplace statistical analyses.
4
20288
3000
普通の統計分析で行われました
では その研究結果は
どのようにして得られたのでしょうか
00:23
So how did they do it?
5
23288
1416
00:24
The answer lies in a statistical method
scientists often use
6
24704
4125
その答えは 結果に何らかの意味があるのか
あるいは 単なるランダムノイズなのかを
00:28
to try to figure out whether their results
mean something or if they’re random noise.
7
28829
4875
科学者が見極めるときに
よく用いる統計学的手法の中にあります
00:33
In fact, the whole point
of the music study
8
33704
2625
実際 先ほどの音楽の研究の核心は
00:36
was to point out ways
this method can be misused.
9
36329
3917
この手法が誤用される事例を
指摘することでした
00:40
A famous thought experiment
explains the method:
10
40746
2791
有名な思考実験が この手法を
明らかにします
00:43
there are eight cups of tea,
11
43746
1750
ミルクティーのカップが8個あります
00:45
four with the milk added first,
and four with the tea added first.
12
45496
4416
4個は ミルクを最初に注いだもので
残りの4個は 紅茶を最初に注いだものです
00:50
A participant must determine
which are which according to taste.
13
50162
3625
被験者は それぞれのカップが
どちらかを味をみて 判定します
00:53
There are 70 different ways the cups
can be sorted into two groups of four,
14
53871
4583
8個のカップを 4個ずつの2つのグループに
分ける分け方は70通りで
00:58
and only one is correct.
15
58454
2000
その中のひとつだけが正解です
01:00
So, can she taste the difference?
16
60662
2584
被験者は 味の違いが判るでしょうか?
01:03
That’s our research question.
17
63246
1625
それが ここでの研究課題です
01:04
To analyze her choices, we define
what’s called a null hypothesis:
18
64871
4625
被験者の選択を分析するため
被験者は区別をつけられないという
01:09
that she can’t distinguish the teas.
19
69496
2167
帰無仮説を立てます
01:11
If she can’t distinguish the teas,
20
71871
2042
被験者が 区別をつけられなくても
01:13
she’ll still get the right answer
1 in 70 times by chance.
21
73913
5166
70回に1回は
偶然 正解する可能性があります
01:19
1 in 70 is roughly .014.
22
79079
3334
70分の1は およそ0.014です
01:22
That single number is called a p-value.
23
82746
3292
この数値は p値と呼ばれます
01:26
In many fields, a p-value of .05 or below
is considered statistically significant,
24
86038
6916
様々な分野において 0.05以下のp値は
統計的に有意
01:32
meaning there’s enough evidence to reject
the null hypothesis.
25
92954
3792
すなわち 帰無仮説を棄却する
十分な根拠があることを意味します
01:36
Based on a p-value of .014,
26
96996
3375
p値が0.014であることから
研究者たちは
01:40
they’d rule out the null hypothesis
that she can’t distinguish the teas.
27
100371
4125
被験者は 紅茶を区別できないとする
帰無仮説を棄却しました
01:44
Though p-values are commonly
used by both researchers and journals
28
104913
3916
p値は 研究者や専門誌によって
科学的結果を評価するために
01:48
to evaluate scientific results,
29
108829
2084
一般的に使われていますが
01:50
they’re really confusing,
even for many scientists.
30
110913
2958
多くの科学者にとっても
本当に 分かりにくいものです
01:54
That’s partly because all a p-value
actually tells us
31
114329
4042
その理由のひとつは
いずれの場合もp値は
01:58
is the probability of getting
a certain result,
32
118371
3000
帰無仮説を真と仮定した場合に
ある特定の結果を得る確率を
02:01
assuming the null hypothesis is true.
33
121371
2917
示しているからです
02:04
So if she correctly sorts the teas,
34
124663
2791
つまり 被験者が
紅茶を正しく選別した場合において
02:07
the p-value is the probability
of her doing so
35
127454
3417
p値は 被験者が
実は区別できていなくても
02:10
assuming she can’t tell the difference.
36
130871
2458
正しい選別がなされる確率です
02:13
But the reverse isn’t true:
37
133329
2459
しかし 逆は真ではありません
02:15
the p-value doesn’t tell us
the probability
38
135788
2416
p値は 被験者が紅茶を
正しく選別できる確率を
02:18
that she can taste the difference,
39
138204
1625
示しているわけではありませんが
02:19
which is what we’re trying to find out.
40
139829
2084
正しく選別する確率こそ 私たちが
求めているものです
02:22
So if a p-value doesn’t answer
the research question,
41
142329
3250
では もし p値が
研究課題の答えにならないのであれば
02:25
why does the scientific community use it?
42
145579
2292
科学界は なぜ p値を使うのでしょうか?
02:28
Well, because even though a p-value
doesn’t directly state the probability
43
148329
4709
なぜなら p値は
結果が偶然である可能性を
02:33
that the results are due to random chance,
44
153038
2500
直接 示すわけではありませんが
02:35
it usually gives a pretty
reliable indication.
45
155538
3333
通常 かなり確かな示唆を提供します
02:39
At least, it does when used correctly.
46
159204
2792
少なくとも
正しく使われた場合は そうです
02:41
And that’s where many researchers,
and even whole fields,
47
161996
3917
そして まさにここに
多くの科学者 さらには 専門領域全体が
02:45
have run into trouble.
48
165913
1458
陥る問題点があります
02:47
Most real studies are more complex
than the tea experiment.
49
167538
3458
たいていの実際の研究は
先ほどの 紅茶の実験より複雑です
02:51
Scientists can test their research
question in multiple ways,
50
171288
3375
科学者は
研究課題を複数の手法で検証します
02:54
and some of these tests might produce
a statistically significant result,
51
174663
4375
そして 統計的に有意な結果が
いくつかの手法で得られる一方 他の手法では
02:59
while others don’t.
52
179038
1208
得られないかもしれません
03:00
It might seem like a good idea
to test every possibility.
53
180454
3167
全ての可能性を検証することは
よい考えのように思えます
03:03
But it’s not,
because with each additional test,
54
183913
3083
しかし そうではありません
なぜなら 追加検証するごとに
03:07
the chance of a false positive increases.
55
187163
3208
誤って真であると判断する可能性が
高まるからです
03:10
Searching for a low p-value,
and then presenting only that analysis,
56
190996
4500
低いp値を探し出し
その分析のみを提示することは
03:15
is often called p-hacking.
57
195496
2750
しばしば p値ハッキングと呼ばれます
03:18
It’s like throwing darts
until you hit a bullseye
58
198246
2750
これは まるで
ど真ん中に命中するまでダーツを投げた後
03:20
and then saying you only threw the dart
that hit the bull’s eye.
59
200996
3333
投げたのは ど真ん中に当たったダーツだけと
主張するようなものです
03:24
This is exactly what the
music researchers did.
60
204746
3208
これが まさに
冒頭の音楽の研究者が行ったことです
03:28
They played three groups of participants
each a different song
61
208079
3709
研究者たちは 3つの被験者のグループに
別々の歌を聴かせて
03:31
and collected lots of information
about them.
62
211788
2500
たくさんの情報を集めました
03:34
The analysis they published included only
two out of the three groups.
63
214288
4250
研究者が公表した分析には3グループのうち
2グループしか含まれていませんでした
03:38
Of all the information they collected,
64
218538
2208
集めた全ての情報のうち
03:40
their analysis only used
participants’ fathers’ age—
65
220746
3542
分析に用いられたのは
被験者の父親の年齢だけでした ―
03:44
to “control for variation in baseline
age across participants.”
66
224288
4541
「被験者間の 基準となる年齢の
ばらつきを抑える」目的です
03:49
They also paused their experiment
after every ten participants,
67
229246
4208
また 研究者たちは
10人の被験者ごとに実験を中断して
03:53
and continued if the p-value
was above .05,
68
233454
4459
p値が0.05より大きければ
実験を継続し
03:57
but stopped when it dipped
below .05.
69
237913
3291
0.05を下回ったときに
実験を停止しました
04:01
They found that participants who heard
one song were 1.5 years younger
70
241746
5208
研究者たちは ある歌を聴いた被験者は
別の歌を聴いた被験者より
04:06
than those who heard the other song,
with a p-value of .04.
71
246954
4375
1.5歳若く p値は0.04となることを
発見しました
04:12
Usually it’s much tougher to spot
p-hacking,
72
252163
2833
一般的には p値ハッキングを見破ることは
さらに困難です
04:14
because we don’t know the results
are impossible:
73
254996
2667
その結果が あり得ないことだとは
知りようがなく
04:17
the whole point of doing experiments
is to learn something new.
74
257663
3416
そもそも 実験の本質は 何か新しいことを
知ろうとすることだからです
04:21
Fortunately, there’s a simple way
to make p-values more reliable:
75
261329
4209
幸い p値を もっと信頼できるものにする
簡単な方法があります
04:25
pre-registering a detailed plan
for the experiment and analysis
76
265913
4708
実験と分析方法の詳細な計画を
あらかじめ 第三者がチェックできるよう
事前登録します
04:30
beforehand that others can check,
77
270621
2458
04:33
so researchers can’t keep trying
different analyses
78
273079
3417
こうすれば研究者が
有意な結果が得られるまでの間に
分析方法を変えながら
試行を続けることはできません
04:36
until they find a significant result.
79
276496
2125
04:38
And, in the true spirit
of scientific inquiry,
80
278788
2458
さらに 科学研究の本来の精神にのっとって
04:41
there’s even a new field that’s basically
science doing science on itself:
81
281246
5375
基本的に科学を自ら科学する
新しい領域があります
04:46
studying scientific practices
in order to improve them.
82
286621
3667
それは 科学的手法を改善するための
科学的手法の研究です
New videos
このウェブサイトについて
このサイトでは英語学習に役立つYouTube動画を紹介します。世界中の一流講師による英語レッスンを見ることができます。各ビデオのページに表示される英語字幕をダブルクリックすると、そこからビデオを再生することができます。字幕はビデオの再生と同期してスクロールします。ご意見・ご要望がございましたら、こちらのお問い合わせフォームよりご連絡ください。