The method that can "prove" almost anything - James A. Smith

832,599 views ・ 2021-08-05

TED-Ed


아래 영문자막을 더블클릭하시면 영상이 재생됩니다.

번역: Soohyun Park 검토: JY Kang
00:06
In 2011, a group of researchers conducted a scientific study
0
6371
4167
2011년 한 연구진은
과학적인 연구를 통해 말도 안되는 결론을 도출했습니다.
00:10
to find an impossible result:
1
10538
2125
00:12
that listening to certain songs can make you younger.
2
12663
3500
특정 노래를 들으면 젊어진다는 것이었습니다.
00:16
Their study involved real people, truthfully reported data,
3
16663
3625
이들의 연구는 실제 사람, 있는 그대로 수집된 데이터,
00:20
and commonplace statistical analyses.
4
20288
3000
일반적인 통계 분석으로 이루어졌습니다.
00:23
So how did they do it?
5
23288
1416
어떻게 그런 결론을 얻은 것일까요?
00:24
The answer lies in a statistical method scientists often use
6
24704
4125
답은 과학자들이 사용한 통계적 방법에 있습니다.
00:28
to try to figure out whether their results mean something or if they’re random noise.
7
28829
4875
결과가 유의미한 것인지 불규칙적인 노이즈인지 분석하는 것이죠.
00:33
In fact, the whole point of the music study
8
33704
2625
사실 음악 실험의 핵심은
00:36
was to point out ways this method can be misused.
9
36329
3917
통계적 방법이 잘못 사용될 수 있음을 지적하는 것이었습니다.
00:40
A famous thought experiment explains the method:
10
40746
2791
이 방법을 설명해주는 유명한 사고 실험이 있습니다.
00:43
there are eight cups of tea,
11
43746
1750
여기에 8잔의 차가 있습니다.
00:45
four with the milk added first, and four with the tea added first.
12
45496
4416
4개는 우유를 먼저 넣고 다른 4개에는 차를 먼저 넣습니다.
00:50
A participant must determine which are which according to taste.
13
50162
3625
참가자는 맛으로 이들을 구분해야 합니다.
00:53
There are 70 different ways the cups can be sorted into two groups of four,
14
53871
4583
8잔을 4개씩 2개 묶음으로 나누는 데는 70가지의 방법이 있고
00:58
and only one is correct.
15
58454
2000
그 중의 하나만이 정답입니다.
01:00
So, can she taste the difference?
16
60662
2584
참가자는 맛의 차이를 느낄 수 있을까요?
01:03
That’s our research question.
17
63246
1625
이것이 우리의 연구 과제입니다.
01:04
To analyze her choices, we define what’s called a null hypothesis:
18
64871
4625
참가자의 선택을 분석하기 위해 다음과 같은 귀무가설을 정의합니다.
01:09
that she can’t distinguish the teas.
19
69496
2167
가설 : 참가자는 맛을 구분할 수 없다.
01:11
If she can’t distinguish the teas,
20
71871
2042
만약 맛을 구분할 수 없다고 하더라도
01:13
she’ll still get the right answer 1 in 70 times by chance.
21
73913
5166
참가자는 70번에 1번 꼴로 우연히 정답을 맞출 수도 있습니다.
01:19
1 in 70 is roughly .014.
22
79079
3334
70번에 1번이면 약 0.014 이고,
01:22
That single number is called a p-value.
23
82746
3292
이 숫자를 p-값이라고 합니다.
01:26
In many fields, a p-value of .05 or below is considered statistically significant,
24
86038
6916
많은 분야에서 0.05 이하의 p-값은 통계적으로 유의미한 것으로 간주되며
01:32
meaning there’s enough evidence to reject the null hypothesis.
25
92954
3792
이는 귀무가설이 틀렸음을 입증하기에 충분하다는 걸 의미합니다.
01:36
Based on a p-value of .014,
26
96996
3375
우리는 0.014의 p-값에 근거해
01:40
they’d rule out the null hypothesis that she can’t distinguish the teas.
27
100371
4125
참가자가 맛을 구분하지 못 한다는 귀무가설이 틀렸다고 할 수 있는 거죠.
01:44
Though p-values are commonly used by both researchers and journals
28
104913
3916
연구자와 학술지 모두 과학적 결과를 평가하기 위해
01:48
to evaluate scientific results,
29
108829
2084
p-값을 흔하게 이용하지만
01:50
they’re really confusing, even for many scientists.
30
110913
2958
많은 과학자들에게도 p-값은 매우 헷갈리는 것입니다.
01:54
That’s partly because all a p-value actually tells us
31
114329
4042
p-값이 실제로 우리에게 알려주는 것은
01:58
is the probability of getting a certain result,
32
118371
3000
귀무가설이 참이라고 가정할 때
02:01
assuming the null hypothesis is true.
33
121371
2917
특정 결과를 얻을 확률이기 때문입니다.
02:04
So if she correctly sorts the teas,
34
124663
2791
따라서 만약에 참가자가 차를 정확하게 분류한다면,
02:07
the p-value is the probability of her doing so
35
127454
3417
p-값은 참가자가 맛을 구분할 수 없다는 가정하에서
02:10
assuming she can’t tell the difference.
36
130871
2458
맛을 구분할 확률을 의미합니다.
02:13
But the reverse isn’t true:
37
133329
2459
하지만 이것의 반대는 참이 아닙니다.
02:15
the p-value doesn’t tell us the probability
38
135788
2416
p-값은 우리가 알고자 하는 것
02:18
that she can taste the difference,
39
138204
1625
즉, 참가자가 맛을 구분할 확률을 알려주지 않습니다.
02:19
which is what we’re trying to find out.
40
139829
2084
02:22
So if a p-value doesn’t answer the research question,
41
142329
3250
p-값이 연구 문제에 답을 주지 못 한다면
02:25
why does the scientific community use it?
42
145579
2292
과학계는 왜 p-값을 사용하는 걸까요?
02:28
Well, because even though a p-value doesn’t directly state the probability
43
148329
4709
결과가 무작위한 우연에 의한 것일 확률을
02:33
that the results are due to random chance,
44
153038
2500
p-값이 직접적으로 나타내지는 않더라도
02:35
it usually gives a pretty reliable indication.
45
155538
3333
p-값은 일반적으로 꽤 신뢰할만한 지표가 됩니다.
02:39
At least, it does when used correctly.
46
159204
2792
적어도 올바르게 사용될 때에는 말이죠.
02:41
And that’s where many researchers, and even whole fields,
47
161996
3917
그리고 이 지점에서 모든 분야의 많은 연구자들은 문제에 봉착합니다.
02:45
have run into trouble.
48
165913
1458
02:47
Most real studies are more complex than the tea experiment.
49
167538
3458
대부분의 실제 연구는 차 실험보다 훨씬 복잡합니다.
02:51
Scientists can test their research question in multiple ways,
50
171288
3375
과학자들은 연구 문제를 여러 방법으로 실험해 볼 수 있습니다.
02:54
and some of these tests might produce a statistically significant result,
51
174663
4375
이들 중 일부만 통계적으로 유의미한 결과를 보이고
02:59
while others don’t.
52
179038
1208
나머지는 의미 없을 수도 있죠.
03:00
It might seem like a good idea to test every possibility.
53
180454
3167
모든 가능성을 실험해 보는 것이 좋은 생각처럼 보일 수도 있습니다.
03:03
But it’s not, because with each additional test,
54
183913
3083
하지만 그렇지 않습니다.
추가적인 실험을 할 때마다 거짓 양성의 가능성이 커지기 때문이죠.
03:07
the chance of a false positive increases.
55
187163
3208
03:10
Searching for a low p-value, and then presenting only that analysis,
56
190996
4500
낮은 p-값을 찾고 해당 분석만을 제시하는 것을
03:15
is often called p-hacking.
57
195496
2750
흔히 p-해킹이라고 합니다.
03:18
It’s like throwing darts until you hit a bullseye
58
198246
2750
이것은 마치 과녁의 정중앙을 맞힐 때까지 다트를 던지고는
03:20
and then saying you only threw the dart that hit the bull’s eye.
59
200996
3333
그 다트 하나만을 던졌다고 말하는 것과 같습니다.
03:24
This is exactly what the music researchers did.
60
204746
3208
이것이 바로 음악 실험의 연구자들이 한 일입니다.
03:28
They played three groups of participants each a different song
61
208079
3709
그들은 세 그룹의 참가자들에게 각각 다른 음악을 들려주었고
03:31
and collected lots of information about them.
62
211788
2500
참가자들에 대한 많은 정보를 수집했습니다.
03:34
The analysis they published included only two out of the three groups.
63
214288
4250
이들이 발표한 분석에는 세 그룹 중 두 그룹만이 포함되어 있었고
03:38
Of all the information they collected,
64
218538
2208
수집한 많은 정보들 중에서
03:40
their analysis only used participants’ fathers’ age—
65
220746
3542
참가자들의 아버지 나이만을 분석에 적용함으로써
03:44
to “control for variation in baseline age across participants.”
66
224288
4541
참가자 간 기준 연령 편차를 조절했죠..
03:49
They also paused their experiment after every ten participants,
67
229246
4208
또한 10명의 참가자가 추가될 때마다 실험을 잠시 중지한 후
03:53
and continued if the p-value was above .05,
68
233454
4459
p-값이 0.05를 넘으면 실험을 계속했지만
03:57
but stopped when it dipped below .05.
69
237913
3291
p-값이 0.05 아래로 떨어지면 실험을 중단했습니다.
04:01
They found that participants who heard one song were 1.5 years younger
70
241746
5208
그들은 특정 음악을 들은 참가자들이
다른 음악을 들은 참가자들보다 1.5살 어리다는 것을 발견했는데
04:06
than those who heard the other song, with a p-value of .04.
71
246954
4375
이때의 p-값은 0.04였습니다.
04:12
Usually it’s much tougher to spot p-hacking,
72
252163
2833
일반적으로 p-해킹을 잡아내기는 상당히 어렵습니다.
04:14
because we don’t know the results are impossible:
73
254996
2667
우리는 결과가 불가능한 것인지 알 수 없기 때문입니다.
04:17
the whole point of doing experiments is to learn something new.
74
257663
3416
실험을 하는 이유는 새로운 것을 알기 위해서입니다.
04:21
Fortunately, there’s a simple way to make p-values more reliable:
75
261329
4209
다행히 p-값의 신뢰도를 높이는 간단한 방법이 있습니다.
04:25
pre-registering a detailed plan for the experiment and analysis
76
265913
4708
실험과 분석에 대한 자세한 계획을 사전에 등록하게 하여
04:30
beforehand that others can check,
77
270621
2458
다른 사람이 확인할 수 있도록 하면
04:33
so researchers can’t keep trying different analyses
78
273079
3417
연구자들은 유의미한 결과를 발견할 때까지
04:36
until they find a significant result.
79
276496
2125
계속해서 다른 분석을 시도하는 행위를 할 수 없게 됩니다.
04:38
And, in the true spirit of scientific inquiry,
80
278788
2458
참된 과학적 연구 정신에는
04:41
there’s even a new field that’s basically science doing science on itself:
81
281246
5375
근본적으로 과학 스스로 과학을 행하여 과학적 관행을 연구하고 개선시키는
04:46
studying scientific practices in order to improve them.
82
286621
3667
새로운 분야도 있습니다.
이 웹사이트 정보

이 사이트는 영어 학습에 유용한 YouTube 동영상을 소개합니다. 전 세계 최고의 선생님들이 가르치는 영어 수업을 보게 될 것입니다. 각 동영상 페이지에 표시되는 영어 자막을 더블 클릭하면 그곳에서 동영상이 재생됩니다. 비디오 재생에 맞춰 자막이 스크롤됩니다. 의견이나 요청이 있는 경우 이 문의 양식을 사용하여 문의하십시오.

https://forms.gle/WvT1wiN1qDtmnspy7