The method that can "prove" almost anything - James A. Smith

816,442 views ・ 2021-08-05

TED-Ed


Vui lòng nhấp đúp vào phụ đề tiếng Anh bên dưới để phát video.

Translator: Nhung Nguyễn Reviewer: Ngoc Nguyen
00:06
In 2011, a group of researchers conducted a scientific study
0
6371
4167
Vào năm 2011, một nhóm các nhà khoa học thực hiện một nghiên cứu
00:10
to find an impossible result:
1
10538
2125
để chứng minh một điều không tưởng:
00:12
that listening to certain songs can make you younger.
2
12663
3500
một vài bài hát có thể khiến bạn trẻ hơn.
00:16
Their study involved real people, truthfully reported data,
3
16663
3625
Nghiên cứu có sự tham gia của người thật, số liệu khách quan,
00:20
and commonplace statistical analyses.
4
20288
3000
dùng các phân tích thống kê phổ biến.
00:23
So how did they do it?
5
23288
1416
Họ đã làm thế nào?
00:24
The answer lies in a statistical method scientists often use
6
24704
4125
Đáp án nằm trong phương pháp thống kê các nhà khoa học thường dùng
00:28
to try to figure out whether their results mean something or if they’re random noise.
7
28829
4875
để kiểm tra kết quả có ý nghĩa gì không hay chỉ là những giá trị ngẫu nhiên.
00:33
In fact, the whole point of the music study
8
33704
2625
Trên thực tế, mục đích của nghiên cứu này
00:36
was to point out ways this method can be misused.
9
36329
3917
để chỉ ra phương pháp trên có thể bị dùng sai.
00:40
A famous thought experiment explains the method:
10
40746
2791
Thí nghiệm tưởng tượng nổi tiếng sau giải thích nguyên tắc hoạt động của nó:
00:43
there are eight cups of tea,
11
43746
1750
có tám tách trà sữa,
00:45
four with the milk added first, and four with the tea added first.
12
45496
4416
4 tách cho sữa vào trước, 4 tách cho trà vào trước.
00:50
A participant must determine which are which according to taste.
13
50162
3625
Người tham gia thí nghiệm dựa vào hương vị phân biệt cách pha.
00:53
There are 70 different ways the cups can be sorted into two groups of four,
14
53871
4583
Có 70 cách chia trà sữa hai nhóm, mỗi nhóm bốn tách
00:58
and only one is correct.
15
58454
2000
nhưng chỉ có một cách phân loại đúng.
01:00
So, can she taste the difference?
16
60662
2584
Có thể nếm được chăng?
01:03
That’s our research question.
17
63246
1625
Đó là câu hỏi được nghiên cứu.
01:04
To analyze her choices, we define what’s called a null hypothesis:
18
64871
4625
Để phân tích các lựa chọn, cần định nghĩa “giả thuyết không”:
01:09
that she can’t distinguish the teas.
19
69496
2167
tức là không thể nếm được sự khác biệt.
01:11
If she can’t distinguish the teas,
20
71871
2042
Nếu không nếm được vị,
01:13
she’ll still get the right answer 1 in 70 times by chance.
21
73913
5166
xếp ngẫu nhiên, khả năng phân loại đúng sẽ là 1/70.
01:19
1 in 70 is roughly .014.
22
79079
3334
1/70 là khoảng 0.014.
01:22
That single number is called a p-value.
23
82746
3292
Con số này được gọi là trị số P.
01:26
In many fields, a p-value of .05 or below is considered statistically significant,
24
86038
6916
trong nhiều lĩnh vực, trị số P bé hơn hoặc bằng 0.05
thì ta xem kết quả nghiên cứu đó có ý nghĩa thống kê,
01:32
meaning there’s enough evidence to reject the null hypothesis.
25
92954
3792
nghĩa là có đủ bằng chứng để bác bỏ giả thuyết không.
01:36
Based on a p-value of .014,
26
96996
3375
Do trị số P bằng 0.014,
01:40
they’d rule out the null hypothesis that she can’t distinguish the teas.
27
100371
4125
giả thuyết không thể nếm được bị loại trừ.
01:44
Though p-values are commonly used by both researchers and journals
28
104913
3916
Dù trị số P thường được các nhà khoa học và tập san sử dụng
01:48
to evaluate scientific results,
29
108829
2084
để đánh giá kết quả nghiên cứu,
01:50
they’re really confusing, even for many scientists.
30
110913
2958
nhưng chúng cũng khá rối, kể cả đối với nhiều nhà khoa học.
01:54
That’s partly because all a p-value actually tells us
31
114329
4042
Một phần là vì trị số P thật ra cho biết
01:58
is the probability of getting a certain result,
32
118371
3000
xác suất nhận được một kết quả nhất định,
02:01
assuming the null hypothesis is true.
33
121371
2917
giả sử giả thuyết không đúng.
02:04
So if she correctly sorts the teas,
34
124663
2791
Nếu phân loại cách pha chính xác,
02:07
the p-value is the probability of her doing so
35
127454
3417
thì trị số P là xác suất phân loại chính xác,
02:10
assuming she can’t tell the difference.
36
130871
2458
giả sử không nếm được vị.
02:13
But the reverse isn’t true:
37
133329
2459
Nhưng điều ngược lại không đúng:
02:15
the p-value doesn’t tell us the probability
38
135788
2416
trị số P không cho biết xác suất
02:18
that she can taste the difference,
39
138204
1625
nếm được vị,
02:19
which is what we’re trying to find out.
40
139829
2084
điều ta đang cố tìm ra.
02:22
So if a p-value doesn’t answer the research question,
41
142329
3250
Nếu trị số P không giải thích được câu hỏi trên,
02:25
why does the scientific community use it?
42
145579
2292
tại sao giới khoa học lại sử dụng nó?
02:28
Well, because even though a p-value doesn’t directly state the probability
43
148329
4709
Vì dù trị số P không trực tiếp chỉ ra
02:33
that the results are due to random chance,
44
153038
2500
xác suất kết quả nhận được là ngẫu nhiên,
02:35
it usually gives a pretty reliable indication.
45
155538
3333
nó thường cho một chỉ dẫn tương đối đáng tin cậy.
02:39
At least, it does when used correctly.
46
159204
2792
Ít nhất là trong trường hợp được sử dụng đúng.
02:41
And that’s where many researchers, and even whole fields,
47
161996
3917
Đó là lý do khiến nhiều nhà khoa học, thậm chí, mọi lĩnh vực,
02:45
have run into trouble.
48
165913
1458
đều gặp khó khăn.
02:47
Most real studies are more complex than the tea experiment.
49
167538
3458
Hầu hết các nghiên cứu trong đời thực đều phức tạp hơn thí nghiệm trên.
02:51
Scientists can test their research question in multiple ways,
50
171288
3375
Các nhà khoa học có thể dùng nhiều cách nghiên cứu,
02:54
and some of these tests might produce a statistically significant result,
51
174663
4375
và một số nghiên cứu có thể cho ra kết quả có ý nghĩa thống kê,
02:59
while others don’t.
52
179038
1208
số còn lại thì không.
03:00
It might seem like a good idea to test every possibility.
53
180454
3167
Việc kiểm tra mọi khả năng có vẻ như là một ý hay.
03:03
But it’s not, because with each additional test,
54
183913
3083
Nhưng không, vì thêm một thí nghiệm,
03:07
the chance of a false positive increases.
55
187163
3208
khả năng nhận được kết quả dương tính giả tăng lên.
03:10
Searching for a low p-value, and then presenting only that analysis,
56
190996
4500
Tìm kiếm trị số P nhỏ, rồi chỉ đưa ra kết quả thống kê đó,
03:15
is often called p-hacking.
57
195496
2750
thường được gọi là nạo vét dữ liệu.
03:18
It’s like throwing darts until you hit a bullseye
58
198246
2750
Giống như việc ném phi tiêu cho tới khi trúng hồng tâm
03:20
and then saying you only threw the dart that hit the bull’s eye.
59
200996
3333
rồi nói chỉ ném chiếc phi tiêu trúng hồng tâm.
03:24
This is exactly what the music researchers did.
60
204746
3208
Đây là điều các nhà khoa học làm trong thí nghiệm âm nhạc.
03:28
They played three groups of participants each a different song
61
208079
3709
Họ chia người tham gia thành ba nhóm, mỗi nhóm nghe một bài hát khác nhau
03:31
and collected lots of information about them.
62
211788
2500
và thu thập rất nhiều thông tin.
03:34
The analysis they published included only two out of the three groups.
63
214288
4250
Phân tích thống kê của họ chỉ chứa hai trong ba nhóm.
03:38
Of all the information they collected,
64
218538
2208
Toàn bộ thông tin thu thập,
03:40
their analysis only used participants’ fathers’ age—
65
220746
3542
thống kê chỉ sử dụng người tuổi trung niên
03:44
to “control for variation in baseline age across participants.”
66
224288
4541
để “kiểm soát mốc biến thiên độ tuổi của người tham gia.”
03:49
They also paused their experiment after every ten participants,
67
229246
4208
Đồng thời, cứ sau mười người lại dừng nghiên cứu,
03:53
and continued if the p-value was above .05,
68
233454
4459
và tiếp tục khi trị số P lớn hơn 0.05,
03:57
but stopped when it dipped below .05.
69
237913
3291
và dừng lại khi nhỏ hơn 0.05.
04:01
They found that participants who heard one song were 1.5 years younger
70
241746
5208
Họ tìm ra rằng những người nghe một bài hát giúp trẻ hơn 1.5 tuổi
04:06
than those who heard the other song, with a p-value of .04.
71
246954
4375
so với những người nghe các bài khác, có trị số P là 0.04.
04:12
Usually it’s much tougher to spot p-hacking,
72
252163
2833
Thông thường rất khó phát hiện nạo vét dữ liệu,
04:14
because we don’t know the results are impossible:
73
254996
2667
vì ta không biết liệu kết quả có quá hoang đường:
04:17
the whole point of doing experiments is to learn something new.
74
257663
3416
mục đích của thí nghiệm là tìm ra cái mới.
04:21
Fortunately, there’s a simple way to make p-values more reliable:
75
261329
4209
May thay, có một cách đơn giản khiến trị số P đáng tin hơn:
04:25
pre-registering a detailed plan for the experiment and analysis
76
265913
4708
tạo ra trước một bản kế hoạch chi tiết thí nghiệm và phân tích
04:30
beforehand that others can check,
77
270621
2458
để mọi người có thể kiểm tra,
04:33
so researchers can’t keep trying different analyses
78
273079
3417
để các nhà nghiên cứu không thể dùng các phân tích khác
04:36
until they find a significant result.
79
276496
2125
tới khi tìm ra kết quả có ý nghĩa thống kê.
04:38
And, in the true spirit of scientific inquiry,
80
278788
2458
Trên tinh thần thực nghiên cứu khoa học,
04:41
there’s even a new field that’s basically science doing science on itself:
81
281246
5375
có một lĩnh vực mới, về cơ bản, là khoa học tự nghiên cứu chính nó:
04:46
studying scientific practices in order to improve them.
82
286621
3667
nghiên cứu những hoạt động khoa học để cải tiến chúng.
Về trang web này

Trang web này sẽ giới thiệu cho bạn những video YouTube hữu ích cho việc học tiếng Anh. Bạn sẽ thấy các bài học tiếng Anh được giảng dạy bởi các giáo viên hàng đầu từ khắp nơi trên thế giới. Nhấp đúp vào phụ đề tiếng Anh hiển thị trên mỗi trang video để phát video từ đó. Phụ đề cuộn đồng bộ với phát lại video. Nếu bạn có bất kỳ nhận xét hoặc yêu cầu nào, vui lòng liên hệ với chúng tôi bằng biểu mẫu liên hệ này.

https://forms.gle/WvT1wiN1qDtmnspy7