3 ways to spot a bad statistic | Mona Chalabi

249,321 views ・ 2017-04-17

TED


Vui lòng nhấp đúp vào phụ đề tiếng Anh bên dưới để phát video.

Translator: Thuy Nguyen Thanh Reviewer: Kien Vu Duy
00:12
I'm going to be talking about statistics today.
0
12704
2763
Hôm nay, tôi sẽ nói về số liệu thống kê.
00:15
If that makes you immediately feel a little bit wary, that's OK,
1
15491
3138
Nếu nó làm bạn cảm thấy có phần đề phòng, điều đó rất bình thường,
00:18
that doesn't make you some kind of crazy conspiracy theorist,
2
18653
2859
đó không khiến bạn trở thành người theo thuyết âm mưu,
00:21
it makes you skeptical.
3
21536
1296
mà khiến bạn trở nên hoài nghi.
00:22
And when it comes to numbers, especially now, you should be skeptical.
4
22856
3886
Và khi nói về các con số, nhất là bây giờ, bạn nên nghi ngờ.
00:26
But you should also be able to tell which numbers are reliable
5
26766
3011
Nhưng bạn cũng có thể chỉ ra số liệu nào đáng tin cậy,
00:29
and which ones aren't.
6
29801
1160
và cái nào thì không.
00:30
So today I want to try to give you some tools to be able to do that.
7
30985
3206
Vậy nên hôm nay, tôi sẽ đưa ra một số công cụ để làm điều đó.
00:34
But before I do,
8
34215
1169
Nhưng trước khi làm vậy,
00:35
I just want to clarify which numbers I'm talking about here.
9
35408
2839
tôi muốn chỉ rõ loại số liệu tôi đang đề cập ở đây
00:38
I'm not talking about claims like,
10
38271
1635
Tôi không nói về khẳng định như là
00:39
"9 out of 10 women recommend this anti-aging cream."
11
39930
2449
"9/10 phụ nữ khuyên dùng loại kem chống lão hóa này"
00:42
I think a lot of us always roll our eyes at numbers like that.
12
42403
2972
Tôi nghĩ rất nhiều người chán ngấy những con số kiểu như vậy.
00:45
What's different now is people are questioning statistics like,
13
45399
2984
Điều khác biệt là mọi người phân vân về những số liệu như
00:48
"The US unemployment rate is five percent."
14
48407
2014
"Tỉ lệ thất nghiệp ở Mỹ là 5%"
00:50
What makes this claim different is it doesn't come from a private company,
15
50445
3516
Điều khiến phát biểu này khác biệt là nó không đến từ một công ty tư nhân,
00:53
it comes from the government.
16
53985
1388
mà nó đến từ chính phủ.
00:55
About 4 out of 10 Americans distrust the economic data
17
55397
3336
Khoảng 4/10 người Mỹ không tin vào các số liệu kinh tế
00:58
that gets reported by government.
18
58757
1573
được đưa ra bởi chính phủ.
01:00
Among supporters of President Trump it's even higher;
19
60354
2491
Với người ủng hộ Tổng thống Trump tỉ lệ còn cao hơn;
01:02
it's about 7 out of 10.
20
62869
1633
Nó vào khoảng 7/10.
01:04
I don't need to tell anyone here
21
64526
1804
Tôi không cần nói với bất kỳ ai ở đây
01:06
that there are a lot of dividing lines in our society right now,
22
66354
3011
rằng có rất nhiều ranh giới trong xã hội của chúng ta ngày nay,
01:09
and a lot of them start to make sense,
23
69389
1825
và nhiều trong số chúng bắt đầu hợp lý
01:11
once you understand people's relationships with these government numbers.
24
71238
3687
một khi bạn hiểu mối quan hệ của người dân với những số liệu của chính phủ.
01:14
On the one hand, there are those who say these statistics are crucial,
25
74949
3336
Mặt khác, có một số người nói rằng những số liệu này là cần thiết,
01:18
that we need them to make sense of society as a whole
26
78309
2630
và chúng ta cần chúng để hiểu xã hội một cách toàn vẹn
01:20
in order to move beyond emotional anecdotes
27
80963
2164
để vượt qua những thông tin có tính cảm xúc
01:23
and measure progress in an [objective] way.
28
83151
2410
và đo đạc sự phát triển một cách khách quan.
01:25
And then there are the others,
29
85585
1467
Và rồi có những người khác
01:27
who say that these statistics are elitist,
30
87076
2156
cho rằng những số liệu này là độc quyền
01:29
maybe even rigged;
31
89256
1208
và thậm chí bị lũng loạn;
01:30
they don't make sense and they don't really reflect
32
90488
2394
chúng không có lý và thường không phản ánh
01:32
what's happening in people's everyday lives.
33
92906
2296
những gì đang xảy ra trong cuộc sống của chúng ta
01:35
It kind of feels like that second group is winning the argument right now.
34
95226
3487
Có vẻ như nhóm người thứ hai đang thắng thế trong cuộc tranh luận này.
01:38
We're living in a world of alternative facts,
35
98737
2108
Ta sống ở thế giới mà sự thật có thể thay thế
01:40
where people don't find statistics this kind of common ground,
36
100869
2935
nơi mà con người không nhìn số liệu với cùng một tiêu chuẩn,
01:43
this starting point for debate.
37
103828
1636
điểm bắt đầu của cuộc tranh luận.
01:45
This is a problem.
38
105488
1286
Đó chính là vấn đề.
01:46
There are actually moves in the US right now
39
106798
2067
Hiện nay đã có những tiến bộ trong xã hội Mỹ
01:48
to get rid of some government statistics altogether.
40
108889
2861
để loại bỏ một số số liệu của chính phủ.
01:51
Right now there's a bill in congress about measuring racial inequality.
41
111774
3387
Bây giờ có một dự luật từ Quốc hội đánh giá sự bất bình đẳng chủng tộc.
01:55
The draft law says that government money should not be used
42
115185
2801
Dự thảo luật cho rằng tiền của chính phủ không nên sử dụng
01:58
to collect data on racial segregation.
43
118010
1902
để thu thập số liệu phân biệt chủng tộc.
01:59
This is a total disaster.
44
119936
1885
Đó là một thảm họa.
02:01
If we don't have this data,
45
121845
1748
Nếu ta không có những số liệu này,
02:03
how can we observe discrimination,
46
123617
1778
làm sao có thể hiểu sự kỳ thị,
02:05
let alone fix it?
47
125419
1278
chưa nói đến sửa chữa nó?
02:06
In other words:
48
126721
1188
Nói cách khác;
02:07
How can a government create fair policies
49
127933
2059
Sao có thể đưa ra chính sách công bằng
02:10
if they can't measure current levels of unfairness?
50
130016
2771
nếu chính phủ không thể đánh giá mức độ bất công?
02:12
This isn't just about discrimination,
51
132811
1794
Nó không chỉ gói gọn trong kỳ thị mà
02:14
it's everything -- think about it.
52
134629
1670
liên quan đến mọi thứ. Hãy nghĩ xem
02:16
How can we legislate on health care
53
136323
1690
Sao ta làm luật chăm sóc sức khỏe
02:18
if we don't have good data on health or poverty?
54
138037
2271
nếu không có số liệu về sức khỏe hay nghèo đói?
02:20
How can we have public debate about immigration
55
140332
2198
Sao ta có những cuộc tranh luận về nhập cư
02:22
if we can't at least agree
56
142554
1250
khi ta không thể đồng ý
02:23
on how many people are entering and leaving the country?
57
143828
2643
về số người đang nhập cảnh và xuất cảnh?
02:26
Statistics come from the state; that's where they got their name.
58
146495
3058
Số liệu đến từ nhà nước; và đó là chỗ chúng có cái tên số liệu.
02:29
The point was to better measure the population
59
149577
2157
Mục đích là đánh giá tốt hơn về dân chúng
02:31
in order to better serve it.
60
151758
1357
để phục vụ họ tốt hơn.
02:33
So we need these government numbers,
61
153139
1725
Vậy ta cần số liệu từ chính phủ này,
02:34
but we also have to move beyond either blindly accepting
62
154888
2647
nhưng ta cũng cần đi xa hơn chấp nhận một cách mù quáng
02:37
or blindly rejecting them.
63
157559
1268
hay mù quáng từ chối chúng
02:38
We need to learn the skills to be able to spot bad statistics.
64
158851
2997
Chúng ta cần học kỹ năng để có thể xác định số liệu sai lệch.
02:41
I started to learn some of these
65
161872
1528
Tôi bắt đầu học được kỹ năng ấy
02:43
when I was working in a statistical department
66
163424
2166
khi tôi làm việc tại một cục thống kê
02:45
that's part of the United Nations.
67
165614
1643
ở trong Liên Hợp Quốc.
02:47
Our job was to find out how many Iraqis had been forced from their homes
68
167281
3406
Công việc của tôi là tìm hiểu số người Iraq bị buộc rời khỏi gia đình
02:50
as a result of the war,
69
170711
1158
bởi vì chiến tranh,
02:51
and what they needed.
70
171893
1158
và những gì họ cần.
02:53
It was really important work, but it was also incredibly difficult.
71
173075
3178
Đó là một công việc quan trọng nhưng nó thật sự khó khăn.
02:56
Every single day, we were making decisions
72
176277
2018
Mỗi ngày, chúng tôi đưa ra quyết định
02:58
that affected the accuracy of our numbers --
73
178319
2157
liên quan đến sự chính xác của những con số--
03:00
decisions like which parts of the country we should go to,
74
180500
2744
quyết định như chúng tôi nên đến vùng nào của đất nước,
03:03
who we should speak to,
75
183268
1156
nên nói chuyện với ai,
03:04
which questions we should ask.
76
184448
1568
câu hỏi nào chúng tôi nên đưa ra.
03:06
And I started to feel really disillusioned with our work,
77
186040
2680
Và tôi bắt đầu cảm thấy thật sự vỡ mộng về công việc này,
03:08
because we thought we were doing a really good job,
78
188744
2518
bởi vì chúng tôi nghĩ chúng tôi đã làm tốt
03:11
but the one group of people who could really tell us were the Iraqis,
79
191286
3278
nhưng những người thật sự có thể trả lời chúng tôi là những người Iraq
03:14
and they rarely got the chance to find our analysis, let alone question it.
80
194588
3540
và họ không hề biết đến thống kê này, không nói đến việc đưa ra câu hỏi.
03:18
So I started to feel really determined
81
198152
1831
Vậy nên tôi bắt đầu xác định rõ
03:20
that the one way to make numbers more accurate
82
200007
2311
chỉ có một cách để khiến con số trở nên chính xác
03:22
is to have as many people as possible be able to question them.
83
202342
3053
là tìm được thật nhiều người có thể đặt câu hỏi với chúng.
03:25
So I became a data journalist.
84
205419
1434
Vì vậy tổ trở thành một nhà báo thu thập số liệu.
03:26
My job is finding these data sets and sharing them with the public.
85
206877
3904
Công việc của tôi là tìm những bộ số liệu và chia sẻ chúng đến với mọi người.
03:30
Anyone can do this, you don't have to be a geek or a nerd.
86
210805
3173
Mọi người đều có thể làm việc này, bạn không cần là một kẻ lập dị.
03:34
You can ignore those words; they're used by people
87
214002
2355
Bạn có thể lờ nó đi; những từ dùng bởi những người
03:36
trying to say they're smart while pretending they're humble.
88
216381
2822
cố tỏ ra thông minh và giả bộ khiêm tốn.
03:39
Absolutely anyone can do this.
89
219227
1589
Chắc chắn ai cũng có thể làm được
03:40
I want to give you guys three questions
90
220840
2067
Tôi muốn hỏi các bạn 3 câu hỏi
03:42
that will help you be able to spot some bad statistics.
91
222931
3005
để giúp các bạn có khả năng xác định những số liệu tồi.
03:45
So, question number one is: Can you see uncertainty?
92
225960
3507
Câu hỏi đầu tiên là: "Bạn có thể nhận ra sự không chắc chắn?"
03:49
One of things that's really changed people's relationship with numbers,
93
229491
3364
Có một điều thay đổi mối quan hệ của con người với con số,
03:52
and even their trust in the media,
94
232879
1641
thậm chí lòng tin vào truyền thông,
03:54
has been the use of political polls.
95
234544
2258
là việc sử dụng các cuộc thăm dò chính trị.
03:56
I personally have a lot of issues with political polls
96
236826
2538
Cá nhân tôi có nhiều vấn đề với các cuộc thăm dò này.
03:59
because I think the role of journalists is actually to report the facts
97
239388
3376
vì tôi cho rằng vai trò của nhà báo là tường thuật sự thật
04:02
and not attempt to predict them,
98
242788
1553
và không cố để dự đoán chúng,
04:04
especially when those predictions can actually damage democracy
99
244365
2996
và nhất là khi những dự đoán ấy có thể phá hủy nền dân chủ
04:07
by signaling to people: don't bother to vote for that guy,
100
247385
2732
bằng cách ra hiệu: đừng quan tâm đến việc bầu cho ông ta,
04:10
he doesn't have a chance.
101
250141
1205
không có cơ hội đâu.
04:11
Let's set that aside for now and talk about the accuracy of this endeavor.
102
251370
3654
Hãy bỏ việc đó qua một bên và bàn luận về sự chính xác của việc này.
04:15
Based on national elections in the UK, Italy, Israel
103
255048
4608
Dựa trên những cuộc bầu cử ở Anh, Ý, Israel
04:19
and of course, the most recent US presidential election,
104
259680
2764
và tất nhiên, cuộc bầu cử tổng thống Mỹ gần đây,
04:22
using polls to predict electoral outcomes
105
262468
2137
sử dụng thăm dò ý kiến để dự đoán kết quả
04:24
is about as accurate as using the moon to predict hospital admissions.
106
264629
3812
có kết quả chính xác giống như sử dụng mặt trăng để dự đoán số lượng nhập viện.
04:28
No, seriously, I used actual data from an academic study to draw this.
107
268465
4200
Nghiêm túc đó, tôi đã sử dụng số liệu thực từ nghiên cứu để đưa ra kết luận ấy.
04:32
There are a lot of reasons why polling has become so inaccurate.
108
272689
3727
Có rất nhiều lí do vì sao thăm dò ý kiến trở nên không chính xác.
04:36
Our societies have become really diverse,
109
276440
1970
Xã hội của chúng ta đang trở nên đa dạng,
04:38
which makes it difficult for pollsters to get a really nice representative sample
110
278434
3821
khiến các nhà thăm dò ý kiến khó có thể có được mẫu số liệu đại diện thực sự tốt
04:42
of the population for their polls.
111
282279
1627
cho toàn bộ dân số.
04:43
People are really reluctant to answer their phones to pollsters,
112
283930
3006
Mọi người thường không sẵn lòng trả lời điện thoại của người thăm dò,
04:46
and also, shockingly enough, people might lie.
113
286960
2276
và còn kinh ngạc hơn là người ta có thể nói dối.
04:49
But you wouldn't necessarily know that to look at the media.
114
289260
2811
Nhưng bạn sẽ không biết điều ấy khi nhìn vào truyền thông.
04:52
For one thing, the probability of a Hillary Clinton win
115
292095
2761
Như trường hợp, khả năng chiến thắng của Hillary Clinton
04:54
was communicated with decimal places.
116
294880
2791
được công bố đến hàng thập phân.
04:57
We don't use decimal places to describe the temperature.
117
297695
2621
Chúng ta không dùng hàng thập phân để nói về nhiệt độ.
05:00
How on earth can predicting the behavior of 230 million voters in this country
118
300340
4228
Làm sao có thể dự đoán hành vi của 230 triệu cử tri trên đất nước này
05:04
be that precise?
119
304592
1829
chính xác đến vậy?
05:06
And then there were those sleek charts.
120
306445
2002
Và sau đó có những biểu đồ thật đẹp.
05:08
See, a lot of data visualizations will overstate certainty, and it works --
121
308471
3973
Nhìn này, nhiều biểu diễn trực quan số liệu sẽ phóng đại sự chắc chắn,
05:12
these charts can numb our brains to criticism.
122
312468
2620
những biểu đồ này làm đơ bộ não chúng ta với chỉ trích.
05:15
When you hear a statistic, you might feel skeptical.
123
315112
2558
Khi bạn nghe về 1 số liệu, bạn sẽ cảm thấy hoài nghi.
05:17
As soon as it's buried in a chart,
124
317694
1635
Tức thì nó được ẩn dưới 1 biểu đồ,
05:19
it feels like some kind of objective science,
125
319353
2129
nó trở thành một dạng khoa học khách quan,
05:21
and it's not.
126
321506
1249
nhưng thật ra thì không.
05:22
So I was trying to find ways to better communicate this to people,
127
322779
3103
Rồi tôi cố gắng tìm cách để truyền tải điều này đến mọi người,
05:25
to show people the uncertainty in our numbers.
128
325906
2504
cho họ thấy được sự không chắc chắn trong các con số.
05:28
What I did was I started taking real data sets,
129
328434
2246
Và tôi bắt đầu thu thập những tập số liệu thực,
05:30
and turning them into hand-drawn visualizations,
130
330704
2652
và chuyển chúng thành những hình vẽ tay trực quan,
05:33
so that people can see how imprecise the data is;
131
333380
2672
để mọi người thấy các số liệu sai lệch đến mức nào;
05:36
so people can see that a human did this,
132
336076
1996
để họ thấy cách người ta đưa ra số liệu,
05:38
a human found the data and visualized it.
133
338096
1972
cách tìm thấy dữ liệu và vẽ trực quan nó.
05:40
For example, instead of finding out the probability
134
340092
2672
Ví dụ, thay vì tìm xác suất
05:42
of getting the flu in any given month,
135
342788
2126
mắc cúm trong một tháng bất kỳ,
05:44
you can see the rough distribution of flu season.
136
344938
2792
bạn có thể xem dữ liệu về sự phân bố thô mùa dịch cúm.
05:47
This is --
137
347754
1167
Nó cho thấy --
05:48
(Laughter)
138
348945
1018
(Cười lớn)
05:49
a bad shot to show in February.
139
349987
1486
một hình ảnh xấu ở tháng 2.
05:51
But it's also more responsible data visualization,
140
351497
2455
Nhưng nó cũng là một biểu đồ đáng tin cậy hơn,
05:53
because if you were to show the exact probabilities,
141
353976
2455
vì nếu nó đưa ra con số xác suất chính xác,
05:56
maybe that would encourage people to get their flu jabs
142
356455
2592
và có thể khuyến khích mọi người tiêm phòng cúm
05:59
at the wrong time.
143
359071
1456
sai thời điểm.
06:00
The point of these shaky lines
144
360983
1693
Qua đó, ý muốn nói
06:02
is so that people remember these imprecisions,
145
362700
2911
là mọi người nhớ chú ý những sai lệch đó,
06:05
but also so they don't necessarily walk away with a specific number,
146
365635
3227
nhưng họ cũng không nhất thiết ra về với một con số cụ thể,
06:08
but they can remember important facts.
147
368886
1866
nhưng cần nhớ các dữ kiện quan trọng.
06:10
Facts like injustice and inequality leave a huge mark on our lives.
148
370776
4024
Các dữ kiện như bất công và bất bình đẳng để lại những dấu ấn to lớn trong cuộc đời.
06:14
Facts like Black Americans and Native Americans have shorter life expectancies
149
374824
4189
Các dữ kiện như người Mỹ bản xứ và người Mỹ da đen có tuổi thọ thấp hơn
06:19
than those of other races,
150
379037
1400
so với các sắc dân khác,
06:20
and that isn't changing anytime soon.
151
380461
2138
và sẽ không thay đổi ngay được.
06:22
Facts like prisoners in the US can be kept in solitary confinement cells
152
382623
3901
Các dữ kiện như tù nhân ở Mỹ có thể bị giữ trong các phòng biệt giam
06:26
that are smaller than the size of an average parking space.
153
386548
3342
có kích thước nhỏ hơn một chỗ đỗ xe trung bình.
06:30
The point of these visualizations is also to remind people
154
390355
3335
Mục đích của sự trực quan hóa này cũng là để nhắc nhở mọi người
06:33
of some really important statistical concepts,
155
393714
2350
về một số khái niệm thống kê thực sự quan trọng,
06:36
concepts like averages.
156
396088
1636
Các khái niệm như trung bình.
06:37
So let's say you hear a claim like,
157
397748
1668
Khi ta nghe một tuyên bố kiểu như,
06:39
"The average swimming pool in the US contains 6.23 fecal accidents."
158
399440
4434
"Bể bơi ở Mỹ trung bình có 6.23 vụ đi vệ sinh luôn trong hồ."
06:43
That doesn't mean every single swimming pool in the country
159
403898
2797
Điều đó không có nghĩa mỗi hồ bơi ở đất nước này
06:46
contains exactly 6.23 turds.
160
406719
2194
đều có chính xác 6.23 cục phân.
06:48
So in order to show that,
161
408937
1417
Do vậy để diễn đạt điều đó,
06:50
I went back to the original data, which comes from the CDC,
162
410378
2841
Tôi quay lại với dữ liệu gốc, được lấy từ CDC,
06:53
who surveyed 47 swimming facilities.
163
413243
2065
người đã khảo sát 47 cơ sở bơi.
06:55
And I just spent one evening redistributing poop.
164
415332
2391
Và tôi chỉ bỏ ra 1 buổi tối để phân phối lại phân.
06:57
So you can kind of see how misleading averages can be.
165
417747
2682
Giờ bạn phần nào thấy con số trung bình sai lệch ra sao.
07:00
(Laughter)
166
420453
1282
(Cười)
07:01
OK, so the second question that you guys should be asking yourselves
167
421759
3901
Vâng, câu hỏi thứ 2 là các bạn nên hỏi chính mình
07:05
to spot bad numbers is:
168
425684
1501
để nhận ra các con số sai là:
07:07
Can I see myself in the data?
169
427209
1967
Tôi có nhìn thấy mình trong dữ liệu không?
07:09
This question is also about averages in a way,
170
429200
2913
Câu hỏi này cũng là về khái niệm trung bình theo nghĩa nào đó,
07:12
because part of the reason why people are so frustrated
171
432137
2605
Bởi vì một phần nguyên nhân khiến mọi người chán nản
07:14
with these national statistics,
172
434766
1495
với những thống kê quốc gia này,
07:16
is they don't really tell the story of who's winning and who's losing
173
436285
3273
là nó không thực sự kể cho ta câu chuyện ai thắng và ai thua
07:19
from national policy.
174
439582
1156
từ chính sách quốc gia.
07:20
It's easy to understand why people are frustrated with global averages
175
440762
3318
Dễ hiểu được lý do người ta lại chán nản với các con số trung bình
07:24
when they don't match up with their personal experiences.
176
444104
2679
khi nó không khớp với những kinh nghiệm cá nhân của họ.
07:26
I wanted to show people the way data relates to their everyday lives.
177
446807
3263
Tôi sẽ cho bạn thấy sự liên quan của dữ liệu đến cuộc sống hằng ngày.
07:30
I started this advice column called "Dear Mona,"
178
450094
2246
Tôi đưa ra cột góp ý này gọi là "Kính gửi Mona,"
07:32
where people would write to me with questions and concerns
179
452364
2726
nơi bạn có thể viết cho tôi các câu hỏi và mối quan tâm
07:35
and I'd try to answer them with data.
180
455114
1784
và tôi sẽ trả lời bằng dữ liệu.
07:36
People asked me anything.
181
456922
1200
Có thể hỏi tôi mọi thứ.
07:38
questions like, "Is it normal to sleep in a separate bed to my wife?"
182
458146
3261
Các câu hỏi như, "có bình thường không khi ngủ khác giường với vợ?"
07:41
"Do people regret their tattoos?"
183
461431
1591
"Có hối hận khi xăm hình không?"
07:43
"What does it mean to die of natural causes?"
184
463046
2164
"Chết do các lý do tự nhiên có ý nghĩa gì?"
07:45
All of these questions are great, because they make you think
185
465234
2966
Tất cả các câu hỏi này đều rất tốt, vì nó khiến bạn nghĩ đến
07:48
about ways to find and communicate these numbers.
186
468224
2336
các cách để tìm và chuyển tải các con số này.
07:50
If someone asks you, "How much pee is a lot of pee?"
187
470584
2503
Nếu có ai hỏi bạn, "Đi tiểu bao nhiêu là nhiều?"
07:53
which is a question that I got asked,
188
473111
2458
Đó cũng là một câu hỏi tôi nhận được,
07:55
you really want to make sure that the visualization makes sense
189
475593
2980
bạn thực sự muốn chắc chắn rằng hình vẽ trực quan này có nghĩa
07:58
to as many people as possible.
190
478597
1747
với càng nhiều người càng tốt.
08:00
These numbers aren't unavailable.
191
480368
1575
Những con số này không tồn tại.
08:01
Sometimes they're just buried in the appendix of an academic study.
192
481967
3507
Đôi khi nó được ẩn trong phần phụ lục của một nghiên cứu khoa học.
08:05
And they're certainly not inscrutable;
193
485498
1839
Và chắc chắn là chúng không khó hiểu;
08:07
if you really wanted to test these numbers on urination volume,
194
487361
2975
nếu bạn muốn kiểm tra các con số này với lượng nước tiểu,
08:10
you could grab a bottle and try it for yourself.
195
490360
2257
bạn có thể cầm một cái chai và tự làm thử đi.
08:12
(Laughter)
196
492641
1008
(Cười)
08:13
The point of this isn't necessarily
197
493673
1694
Điểm mấu chốt là không nhất thiết
08:15
that every single data set has to relate specifically to you.
198
495391
2877
mỗi tập dữ liệu đều phải liên quan cụ thể đến bạn.
08:18
I'm interested in how many women were issued fines in France
199
498292
2880
Tôi quan tâm đến bao nhiêu phụ nữ bị phạt ở Pháp
08:21
for wearing the face veil, or the niqab,
200
501196
1959
do mang khăn, hoặc mạng che mặt,
08:23
even if I don't live in France or wear the face veil.
201
503179
2618
ngay cả khi tôi không sống ở Pháp hoặc đeo khăn che mặt.
08:25
The point of asking where you fit in is to get as much context as possible.
202
505821
3835
Mấu chốt của việc hỏi xem nơi bạn phù hợp là để nắm được ngữ cảnh nhiều nhất.
08:29
So it's about zooming out from one data point,
203
509680
2191
Mục đích là thu nhỏ lại thành một điểm dữ liệu,
08:31
like the unemployment rate is five percent,
204
511895
2104
kiểu như tỷ lệ thất nghiệp là năm phần trăm,
08:34
and seeing how it changes over time,
205
514023
1757
và xem nó sẽ thay đổi theo thời gian,
08:35
or seeing how it changes by educational status --
206
515804
2650
hoặc theo trình độ học vấn ra sao --
08:38
this is why your parents always wanted you to go to college --
207
518478
3104
đây là lý do cha mẹ luôn muốn bạn phải vào đại học--
08:41
or seeing how it varies by gender.
208
521606
2032
hoặc xem nó thay đổi theo giới tính ra sao.
08:43
Nowadays, male unemployment rate is higher
209
523662
2127
Ngày nay, tỷ lệ thất nghiệp nam giới cao hơn
08:45
than the female unemployment rate.
210
525813
1700
tỷ lệ thất nghiệp nữ giới.
08:47
Up until the early '80s, it was the other way around.
211
527537
2695
Cho đến đầu những năm 80, tình hình đã đảo ngược.
08:50
This is a story of one of the biggest changes
212
530256
2117
Đây là 01 câu chuyện về một thay đổi lớn
08:52
that's happened in American society,
213
532397
1720
đã xảy ra trong xã hội Mỹ,
08:54
and it's all there in that chart, once you look beyond the averages.
214
534141
3276
tất cả nằm trong biểu đồ đó nếu ta nhìn xa hơn các con số trung bình.
08:57
The axes are everything;
215
537441
1165
Các trục chứa tất cả;
08:58
once you change the scale, you can change the story.
216
538630
2669
một khi thay đổi thước đo, bạn có thể thay đổi câu chuyện
09:01
OK, so the third and final question that I want you guys to think about
217
541323
3380
Vâng, còn câu hỏi thứ 3 và cuối cùng mà tôi muốn các bạn suy nghĩ đến
09:04
when you're looking at statistics is:
218
544727
1819
khi bạn đang nhìn vào các thống kê là:
09:06
How was the data collected?
219
546570
1873
Dữ liệu được thu thập như thế nào?
09:09
So far, I've only talked about the way data is communicated,
220
549487
2939
Nãy giờ, tôi chỉ nói về cách chuyển tải dữ liệu,
09:12
but the way it's collected matters just as much.
221
552450
2276
nhưng cách thu thập cũng quan trọng không kém.
09:14
I know this is tough,
222
554750
1167
Tôi biết điều này là khó,
09:15
because methodologies can be opaque and actually kind of boring,
223
555941
3081
bởi vì phương pháp luận có thể là rối rắm và thực sự nhàm chán,
09:19
but there are some simple steps you can take to check this.
224
559046
2873
nhưng có một số bước đơn giản để kiểm tra điều này.
09:21
I'll use one last example here.
225
561943
1839
Tôi sẽ đưa ra một ví dụ cuối cùng.
09:24
One poll found that 41 percent of Muslims in this country support jihad,
226
564129
3887
Một cuộc thăm dò cho thấy 41% người Hồi giáo ủng hộ thánh chiến,
09:28
which is obviously pretty scary,
227
568040
1525
điều này rõ ràng đáng quan ngại,
09:29
and it was reported everywhere in 2015.
228
569589
2642
và được thông báo khắp mọi nơi năm 2015.
09:32
When I want to check a number like that,
229
572255
2615
Khi tôi muốn kiểm tra một con số như vậy,
09:34
I'll start off by finding the original questionnaire.
230
574894
2501
Tôi sẽ bắt đầu bằng cách tìm bảng câu hỏi gốc.
09:37
It turns out that journalists who reported on that statistic
231
577419
2926
Nó chỉ ra rằng các nhà báo mà thực hiện các thống kê đó
09:40
ignored a question lower down on the survey
232
580369
2231
đã bỏ qua một câu hỏi làm hạ thấp cuộc khảo sát
09:42
that asked respondents how they defined "jihad."
233
582624
2346
đó là hỏi cách người ta đinh nghĩa "thánh chiến."
09:44
And most of them defined it as,
234
584994
1981
Và hầu hết đều định nghĩa như sau,
09:46
"Muslims' personal, peaceful struggle to be more religious."
235
586999
3942
"Sự đấu tranh hòa bình, cá nhân của mỗi người Hồi giáo để tín ngưỡng tốt hơn."
09:50
Only 16 percent defined it as, "violent holy war against unbelievers."
236
590965
4194
Chỉ 16% đính nghĩa, "Cuộc chiến tranh bạo lực chống lại người không tín ngưỡng."
09:55
This is the really important point:
237
595183
2430
Điểm này thực sự quan trọng:
09:57
based on those numbers, it's totally possible
238
597637
2155
dựa trên các con số đó, hoàn toàn có khả năng
09:59
that no one in the survey who defined it as violent holy war
239
599816
3105
không có ai được khảo sát xem "thánh chiến" là cuộc chiến bạo lực
10:02
also said they support it.
240
602945
1332
cũng như nói ủng hộ nó.
10:04
Those two groups might not overlap at all.
241
604301
2208
Hai nhóm đó không trùng lắp nhau gì cả.
10:06
It's also worth asking how the survey was carried out.
242
606942
2637
Cũng cần hỏi xem cuộc khảo sát đã được thực hiện ra sao.
10:09
This was something called an opt-in poll,
243
609603
1998
Đây được gọi là cuộc thăm dò "qua mạng",
10:11
which means anyone could have found it on the internet and completed it.
244
611625
3402
bất kỳ ai bắt gặp nó trên internet đều có thể tham gia.
10:15
There's no way of knowing if those people even identified as Muslim.
245
615051
3339
Chẳng có cách nào để biết rằng họ có phải là người Hồi giáo hay không.
10:18
And finally, there were 600 respondents in that poll.
246
618414
2612
Và cuối cùng, có 600 người tham gia cuộc thăm dò.
10:21
There are roughly three million Muslims in this country,
247
621050
2654
Có khoảng 3 triệu người Hồi giáo ở đất nước này,
10:23
according to Pew Research Center.
248
623728
1607
theo Trung tâm nghiên cứu Pew.
10:25
That means the poll spoke to roughly one in every 5,000 Muslims
249
625359
2993
Có nghĩa là đã thực hiện thăm dò với tỷ lệ 1/5000 người Hồi giáo
10:28
in this country.
250
628376
1168
ở đất nước này.
10:29
This is one of the reasons
251
629568
1266
Đây là một trong các lý do
10:30
why government statistics are often better than private statistics.
252
630858
3607
khiến các thống kê của chính phủ thường tốt hơn các thống kế tư nhân.
10:34
A poll might speak to a couple hundred people, maybe a thousand,
253
634489
3035
01 cuộc thăm dò có thể thực hiện với vài trăm đến 1 nghìn người,
10:37
or if you're L'Oreal, trying to sell skin care products in 2005,
254
637548
3058
hoặc nếu bạn là L'Oreal, đang bán sản phẩm chăm sóc da năm 2005,
10:40
then you spoke to 48 women to claim that they work.
255
640630
2417
bạn khảo sát 48 phụ nữ và khẳng định nó rất tốt.
10:43
(Laughter)
256
643071
1026
(Cười)
10:44
Private companies don't have a huge interest in getting the numbers right,
257
644121
3556
Các công ty tư nhân không quan tâm nhiều đến việc tìm ra các con số đúng,
10:47
they just need the right numbers.
258
647701
1755
họ chỉ cần các con số đúng.
10:49
Government statisticians aren't like that.
259
649480
2020
Các nhà thống kê chính phủ không làm vậy.
10:51
In theory, at least, they're totally impartial,
260
651524
2447
Theo lý thuyết, ít nhất, họ hoàn toàn vô tư,
10:53
not least because most of them do their jobs regardless of who's in power.
261
653995
3501
đặc biệt vì hầu hết trong số họ làm việc bất kể ai đang nắm quyền
10:57
They're civil servants.
262
657520
1162
Họ là những công chức.
10:58
And to do their jobs properly,
263
658706
1964
Và để làm tốt công việc của mình,
11:00
they don't just speak to a couple hundred people.
264
660694
2363
họ không chỉ khảo sát vài trăm người.
11:03
Those unemployment numbers I keep on referencing
265
663081
2318
Những con số thất nghiệp mà tôi đang nói đến
11:05
come from the Bureau of Labor Statistics,
266
665423
2004
được lấy từ Cục Thống kê Lao động,
11:07
and to make their estimates,
267
667451
1335
và để đưa ra các ước tính,
11:08
they speak to over 140,000 businesses in this country.
268
668810
3489
họ đã khảo sát trên 140,000 doanh nghiệp trên cả nước.
11:12
I get it, it's frustrating.
269
672323
1725
Tôi hiểu, đúng là bực bội.
11:14
If you want to test a statistic that comes from a private company,
270
674072
3115
Nếu bạn muốn thẩm tra một thống kê lấy từ một công ty tư nhân,
11:17
you can buy the face cream for you and a bunch of friends, test it out,
271
677211
3361
bạn có thể mua kem xoa mặt cho mình và một nhóm bạn, làm thử đi,
11:20
if it doesn't work, you can say the numbers were wrong.
272
680596
2591
Nếu không làm được, bạn có thể nói các con số bị sai.
11:23
But how do you question government statistics?
273
683211
2146
Nhưng làm sao kiểm tra các thống kê chính phủ?
11:25
You just keep checking everything.
274
685381
1630
Bạn chỉ cần kiểm tra mọi thứ.
11:27
Find out how they collected the numbers.
275
687035
1913
Tìm hiểu họ thu thập số liệu như thế nào.
11:28
Find out if you're seeing everything on the chart you need to see.
276
688972
3125
Hãy tìm hiểu nếu bạn đang xem mọi thứ trên biểu đồ mà bạn cần xem.
11:32
But don't give up on the numbers altogether, because if you do,
277
692121
2965
Nhưng không từ bỏ bất kỳ con số nào, bởi vì nếu bạn làm vậy,
11:35
we'll be making public policy decisions in the dark,
278
695110
2439
ta sẽ đưa ra các quyết định chính sách từ bóng tối.
11:37
using nothing but private interests to guide us.
279
697573
2262
chỉ sử dụng các quan tâm riêng để dẫn dắt mình.
11:39
Thank you.
280
699859
1166
Cám ơn.
11:41
(Applause)
281
701049
2461
(Vỗ tay)
Về trang web này

Trang web này sẽ giới thiệu cho bạn những video YouTube hữu ích cho việc học tiếng Anh. Bạn sẽ thấy các bài học tiếng Anh được giảng dạy bởi các giáo viên hàng đầu từ khắp nơi trên thế giới. Nhấp đúp vào phụ đề tiếng Anh hiển thị trên mỗi trang video để phát video từ đó. Phụ đề cuộn đồng bộ với phát lại video. Nếu bạn có bất kỳ nhận xét hoặc yêu cầu nào, vui lòng liên hệ với chúng tôi bằng biểu mẫu liên hệ này.

https://forms.gle/WvT1wiN1qDtmnspy7