Peter Donnelly: How stats fool juries

243,473 views ・ 2007-01-12

TED


Vui lòng nhấp đúp vào phụ đề tiếng Anh bên dưới để phát video.

Reviewer: 24 Anh
Như các diễn giả khác đã nói,
diễn thuyết trước đám đông thế này là một trải nghiệm đặc biệt khó khăn.
Nhưng không giống họ,
tôi sẽ không nói về bí ẩn vũ trụ hay sự kì diệu của tạo hóa,
hay những cách thức rất cấp tiến và thông minh
mà người ta dùng để công kích những bất bình đẳng lớn trên thế giới.
Hoặc thậm chí là những thách thức mà các quốc gia gặp phải
trong bối cảnh kinh tế toàn cầu hiện đại.
00:25
As other speakers have said, it's a rather daunting experience --
0
25000
2000
Như vừa giới thiệu, tôi sẽ nói về chủ đề số liệu thống kê,
00:27
a particularly daunting experience -- to be speaking in front of this audience.
1
27000
3000
và cụ thể hơn, là vài điều thú vị về nó.
00:30
But unlike the other speakers, I'm not going to tell you about
2
30000
3000
(Tiếng cười)
00:33
the mysteries of the universe, or the wonders of evolution,
3
33000
2000
Có vẻ hơi khó khăn hơn
00:35
or the really clever, innovative ways people are attacking
4
35000
4000
so với tất cả diễn giả đến trước hoặc sau tôi.
(Tiếng cười)
00:39
the major inequalities in our world.
5
39000
2000
Khi tôi mới chập chững vào nghề, một vị đồng nghiệp lâu năm bảo với tôi,
00:41
Or even the challenges of nation-states in the modern global economy.
6
41000
5000
với vẻ khá tự hào,
00:46
My brief, as you've just heard, is to tell you about statistics --
7
46000
4000
rằng các chuyên gia thống kê là những kẻ thích số má
nhưng không có kỹ năng cá nhân để trở thành kế toán.
00:50
and, to be more precise, to tell you some exciting things about statistics.
8
50000
3000
(Tiếng cười)
00:53
And that's --
9
53000
1000
00:54
(Laughter)
10
54000
1000
Và còn một trò đùa khác trong giới thống kê là,
00:55
-- that's rather more challenging
11
55000
2000
00:57
than all the speakers before me and all the ones coming after me.
12
57000
2000
“Làm sao để phân biệt nhà thống kê hướng nội hay hướng ngoại?”
00:59
(Laughter)
13
59000
1000
01:01
One of my senior colleagues told me, when I was a youngster in this profession,
14
61000
5000
Câu trả lời là,
“Nhà thống kê hướng ngoại là người luôn nhìn vào giày người khác.”
01:06
rather proudly, that statisticians were people who liked figures
15
66000
4000
(Tiếng cười)
01:10
but didn't have the personality skills to become accountants.
16
70000
3000
Nhưng tôi muốn nói điều gì đó hữu ích, vậy nên hãy tập trung nhé, đến rồi đây.
01:13
(Laughter)
17
73000
2000
01:15
And there's another in-joke among statisticians, and that's,
18
75000
3000
Tối nay có một buổi lễ tại Bảo tàng Lịch sử Tự nhiên của Trường.
01:18
"How do you tell the introverted statistician from the extroverted statistician?"
19
78000
3000
Tôi mong bạn sẽ thấy bố trí ở đó tuyệt vời
và biểu trưng tuyệt vời cho truyền thống thời Victoria tốt đẹp nhất.
01:21
To which the answer is,
20
81000
2000
01:23
"The extroverted statistician's the one who looks at the other person's shoes."
21
83000
5000
Rất khó xảy ra-- trong buổi lễ đặc biệt như thế, với tập hợp những người này--
01:28
(Laughter)
22
88000
3000
bạn lỡ gặp một người khiến bạn hối hận vì bắt chuyện với họ.
01:31
But I want to tell you something useful -- and here it is, so concentrate now.
23
91000
5000
Khi đó bạn làm như sau.
Khi họ hỏi bạn, “Bạn làm nghề gì?“. Bạn trả lời, “Tôi là nhà thống kê.”
01:36
This evening, there's a reception in the University's Museum of Natural History.
24
96000
3000
01:39
And it's a wonderful setting, as I hope you'll find,
25
99000
2000
(Tiếng cười)
Ừ thì, trừ khi họ đã được cảnh báo trước, và họ sẽ biết bạn đang dựng chuyện.
01:41
and a great icon to the best of the Victorian tradition.
26
101000
5000
Một trong hai điều sau sẽ xảy ra.
01:46
It's very unlikely -- in this special setting, and this collection of people --
27
106000
5000
Họ bỗng thấy vị họ hàng xa ở góc phòng và chạy tới trò chuyện với người đó.
Hoặc họ đột nhiên thấy khát hoặc đói, hoặc thông thường là cả hai,
01:51
but you might just find yourself talking to someone you'd rather wish that you weren't.
28
111000
3000
và vội chạy đi tìm chút đồ ăn thức uống.
01:54
So here's what you do.
29
114000
2000
Và bạn sẽ được yên thân để nói chuyện với người bạn thực sự thích.
01:56
When they say to you, "What do you do?" -- you say, "I'm a statistician."
30
116000
4000
Trong ngành của chúng tôi, thật khó để giải thích việc chúng tôi làm.
02:00
(Laughter)
31
120000
1000
02:01
Well, except they've been pre-warned now, and they'll know you're making it up.
32
121000
4000
Chúng tôi không hẳn là những vị khách ưu tiên cho buổi tiệc tối và trò chuyện.
02:05
And then one of two things will happen.
33
125000
2000
Tôi chưa từng có đáp án thích đáng cho câu hỏi ấy.
02:07
They'll either discover their long-lost cousin in the other corner of the room
34
127000
2000
02:09
and run over and talk to them.
35
129000
2000
Nhưng vợ tôi, hồi còn là bạn gái tôi, giải quyết vấn đề dễ dàng hơn rất nhiều.
02:11
Or they'll suddenly become parched and/or hungry -- and often both --
36
131000
3000
02:14
and sprint off for a drink and some food.
37
134000
2000
Nhiều năm trước, giai đoạn mới quen, cô ấy làm ở đài BBC Anh,
02:16
And you'll be left in peace to talk to the person you really want to talk to.
38
136000
4000
còn tôi lúc đó làm việc ở Mỹ.
02:20
It's one of the challenges in our profession to try and explain what we do.
39
140000
3000
Tôi trở lại thăm cô ấy.
Cô ấy trả lời câu hỏi từ một đồng nghiệp, “Bạn trai của bạn làm nghề gì?”
02:23
We're not top on people's lists for dinner party guests and conversations and so on.
40
143000
5000
Sarah nghĩ khá lâu về những điều tôi đã giải thích
02:28
And it's something I've never really found a good way of doing.
41
148000
2000
02:30
But my wife -- who was then my girlfriend --
42
150000
3000
và thời đó, cô ấy vẫn tập trung lắng nghe tôi.
02:33
managed it much better than I've ever been able to.
43
153000
3000
(Tiếng cười)
02:36
Many years ago, when we first started going out, she was working for the BBC in Britain,
44
156000
3000
Đừng kể với cô ấy tôi nói thế nhé.
Cô ấy nghĩ về các mô hình toán học mà tôi phát triển
02:39
and I was, at that stage, working in America.
45
159000
2000
02:41
I was coming back to visit her.
46
161000
2000
để tìm hiểu quá trình tiến hóa và di truyền học hiện đại.
02:43
She told this to one of her colleagues, who said, "Well, what does your boyfriend do?"
47
163000
6000
Thế nên khi người ta hỏi, "Anh ấy làm gì?"
Cô ấy ngập ngừng, rồi trả lời: “Anh ấy làm mô hình.”
02:49
Sarah thought quite hard about the things I'd explained --
48
169000
2000
02:51
and she concentrated, in those days, on listening.
49
171000
4000
(Tiếng cười)
Rồi đồng nghiệp cô ấy đột nhiên tỏ ra thích thú hơn mong đợi của tôi
02:55
(Laughter)
50
175000
2000
và tiếp tục hỏi, “Anh ấy làm mô hình gì?”
02:58
Don't tell her I said that.
51
178000
2000
03:00
And she was thinking about the work I did developing mathematical models
52
180000
4000
Chà, Sarah nghĩ ngợi thêm một chút về công việc của tôi và nói: “Gen.”
03:04
for understanding evolution and modern genetics.
53
184000
3000
(Tiếng cười)
03:07
So when her colleague said, "What does he do?"
54
187000
3000
"Anh ấy tạo hình gen."
03:10
She paused and said, "He models things."
55
190000
4000
Tình đầu của tôi đấy, tôi chỉ kể một chút vậy thôi.
Nói chung, điều tôi muốn các bạn làm là suy nghĩ về những điều chưa chắc chắn,
03:14
(Laughter)
56
194000
1000
03:15
Well, her colleague suddenly got much more interested than I had any right to expect
57
195000
4000
03:19
and went on and said, "What does he model?"
58
199000
3000
ngẫu nhiên và tình cờ trong thế giới này,
và cách ta phản ứng với chúng, và ta có nghĩ về chúng đúng hướng không.
03:22
Well, Sarah thought a little bit more about my work and said, "Genes."
59
202000
3000
03:25
(Laughter)
60
205000
4000
Từ đầu đến giờ các bạn khá thoải mải, vài trận cười, vài kiến thức về hẹn hò.
03:29
"He models genes."
61
209000
2000
Bạn cần động não, và tôi sẽ bắt đầu hỏi một số câu.
03:31
That is my first love, and that's what I'll tell you a little bit about.
62
211000
4000
Đây là bối cảnh cho câu hỏi đầu tiên.
03:35
What I want to do more generally is to get you thinking about
63
215000
4000
Thử tưởng tượng bạn tung đồng xu liên tục nhé?
Vì vài lý do, dù chúng rất mơ hồ,
03:39
the place of uncertainty and randomness and chance in our world,
64
219000
3000
ta để tâm đến một thứ tự cụ thể.
03:42
and how we react to that, and how well we do or don't think about it.
65
222000
5000
Lần một ngửa, sau đó sấp, rồi lại sấp.
Giả sử chúng ta tung đồng xu liên tục.
03:47
So you've had a pretty easy time up till now --
66
227000
2000
03:49
a few laughs, and all that kind of thing -- in the talks to date.
67
229000
2000
Thứ tự ngửa - sấp - sấp mà ta đột nhiên chú ý đến xảy ra tại đây.
03:51
You've got to think, and I'm going to ask you some questions.
68
231000
3000
03:54
So here's the scene for the first question I'm going to ask you.
69
234000
2000
Bạn có thể đếm: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10--
03:56
Can you imagine tossing a coin successively?
70
236000
3000
Nó xảy ra vào lần tung thứ 10.
03:59
And for some reason -- which shall remain rather vague --
71
239000
3000
Chắc bạn nghĩ còn điều gì đó thú vị hơn, nhưng xin hãy chiều lòng tôi chút.
04:02
we're interested in a particular pattern.
72
242000
2000
Tưởng tượng nửa số khán giả có đồng xu này trong tay, và tung lên
04:04
Here's one -- a head, followed by a tail, followed by a tail.
73
244000
3000
cho tới khi họ thấy cụm ngửa - sấp - sấp.
04:07
So suppose we toss a coin repeatedly.
74
247000
3000
Lần đầu, chuỗi này có thể xuất hiện ở lần tung 10.
04:10
Then the pattern, head-tail-tail, that we've suddenly become fixated with happens here.
75
250000
5000
Lần thứ hai, có thể sau lần tung thứ 4. Lần tiếp theo, sau lần tung thứ 15.
04:15
And you can count: one, two, three, four, five, six, seven, eight, nine, 10 --
76
255000
4000
Bạn tung rất nhiều lần, rồi tính trung bình của các con số đó.
04:19
it happens after the 10th toss.
77
259000
2000
Nửa bên này tôi muốn các bạn nghĩ về viễn cảnh đó.
04:21
So you might think there are more interesting things to do, but humor me for the moment.
78
261000
3000
Nửa số khán giả còn lại không thích thứ tự ngửa - sấp - sấp,
04:24
Imagine this half of the audience each get out coins, and they toss them
79
264000
4000
họ nghĩ, vì lý do văn hóa, kiểu đó nhàm chán --
và họ thích một chuỗi thứ tự khác: ngửa - sấp - ngửa.
04:28
until they first see the pattern head-tail-tail.
80
268000
3000
Nên phía này, các bạn lấy đồng xu và cứ tung rồi lại tung.
04:31
The first time they do it, maybe it happens after the 10th toss, as here.
81
271000
2000
Bạn đếm cho đến khi thứ tự ngửa - sấp - ngửa xuất hiện
04:33
The second time, maybe it's after the fourth toss.
82
273000
2000
04:35
The next time, after the 15th toss.
83
275000
2000
và tính trung bình.
04:37
So you do that lots and lots of times, and you average those numbers.
84
277000
3000
Ok?
Vậy phía bên này, bạn có con số --
04:40
That's what I want this side to think about.
85
280000
3000
bạn đã tung nhiều lần nên con số chính xác --
tức là trung bình số lần tung xu cho đến khi gặp ngửa - sấp - sấp.
04:43
The other half of the audience doesn't like head-tail-tail --
86
283000
2000
04:45
they think, for deep cultural reasons, that's boring --
87
285000
3000
Phía bên này là trung bình số lần tung cho đến khi gặp thứ tự ngửa - sấp - ngửa.
04:48
and they're much more interested in a different pattern -- head-tail-head.
88
288000
3000
Một sự thật về toán học thuần túy là
04:51
So, on this side, you get out your coins, and you toss and toss and toss.
89
291000
3000
nếu bạn tìm ra hai con số, một trong ba điều sau luôn đúng.
04:54
And you count the number of times until the pattern head-tail-head appears
90
294000
3000
Hoặc là chúng bằng nhau, hoặc số này lớn hơn số kia,
04:57
and you average them. OK?
91
297000
3000
hoặc số kia lớn hơn số này.
05:00
So on this side, you've got a number --
92
300000
2000
Vậy, chuyện gì đang xảy ra?
05:02
you've done it lots of times, so you get it accurately --
93
302000
2000
Các bạn phải cùng suy nghĩ và biểu quyết, và ta sẽ không chuyển mục đâu.
05:04
which is the average number of tosses until head-tail-tail.
94
304000
3000
Tôi không muốn dành hai phút im lặng
05:07
On this side, you've got a number -- the average number of tosses until head-tail-head.
95
307000
4000
để các bạn có thêm thời gian suy nghĩ tới khi ai cũng bày tỏ quan điểm. Ok?
05:11
So here's a deep mathematical fact --
96
311000
2000
Điều ta cần làm là so sánh số lần tung đồng xu trung bình
05:13
if you've got two numbers, one of three things must be true.
97
313000
3000
tới khi lần đầu gặp hai thứ tự nêu trên.
05:16
Either they're the same, or this one's bigger than this one,
98
316000
3000
05:19
or this one's bigger than that one.
99
319000
1000
05:20
So what's going on here?
100
320000
3000
Ai nghĩ A đúng rằng
trung bình số lần tung ngửa - sấp - ngửa lớn hơn ngửa - sấp - sấp?
05:23
So you've all got to think about this, and you've all got to vote --
101
323000
2000
05:25
and we're not moving on.
102
325000
1000
05:26
And I don't want to end up in the two-minute silence
103
326000
2000
Ai nghĩ B đúng rằng chúng bằng nhau?
05:28
to give you more time to think about it, until everyone's expressed a view. OK.
104
328000
4000
Ai nghĩ C đúng, tính trung bình,
ta sẽ gặp thứ tự ngửa - sấp - ngửa sớm hơn ngửa - sấp - sấp?
05:32
So what you want to do is compare the average number of tosses until we first see
105
332000
4000
Ai chưa chọn nào? Như vậy là hư lắm nhé. Tôi đã bảo phải chọn mà.
05:36
head-tail-head with the average number of tosses until we first see head-tail-tail.
106
336000
4000
(Tiếng cười)
Vậy, phần lớn chọn B đúng.
05:41
Who thinks that A is true --
107
341000
2000
05:43
that, on average, it'll take longer to see head-tail-head than head-tail-tail?
108
343000
4000
Bạn sẽ thấy nhẹ nhõm khi biết ngay cả các nhà toán học lỗi lạc cũng nghĩ thế.
05:47
Who thinks that B is true -- that on average, they're the same?
109
347000
3000
Nhưng không phải.
A mới đúng.
05:51
Who thinks that C is true -- that, on average, it'll take less time
110
351000
2000
Trung bình nó mất nhiều thời gian hơn.
05:53
to see head-tail-head than head-tail-tail?
111
353000
3000
Thực tế, trung bình lần tung ngửa - sấp - ngửa là 10
còn trung bình lần tung sấp ngửa - sấp - sấp là 8.
05:57
OK, who hasn't voted yet? Because that's really naughty -- I said you had to.
112
357000
3000
06:00
(Laughter)
113
360000
1000
Sao có thể như thế?
06:02
OK. So most people think B is true.
114
362000
3000
Có gì khác biệt giữa hai thứ tự không?
06:05
And you might be relieved to know even rather distinguished mathematicians think that.
115
365000
3000
06:08
It's not. A is true here.
116
368000
4000
Có đấy.
Ngửa - sấp - ngửa có vòng lặp.
06:12
It takes longer, on average.
117
372000
2000
Nếu bạn tung ra ngửa - sấp - ngửa - sấp - ngửa,
06:14
In fact, the average number of tosses till head-tail-head is 10
118
374000
2000
06:16
and the average number of tosses until head-tail-tail is eight.
119
376000
5000
bạn có thể dễ thấy thứ tự này xuất hiện hai lần chỉ trong năm lần tung.
Ngửa - sấp - sấp không có kiểu lặp lại đó.
06:21
How could that be?
120
381000
2000
Điều đó thế mà lại quan trọng.
06:24
Anything different about the two patterns?
121
384000
3000
Có hai lối suy nghĩ việc này. Tôi sẽ nói cho các bạn một lối nghĩ.
Tưởng tượng-- giả sử ta đang tung đồng xu.
06:30
There is. Head-tail-head overlaps itself.
122
390000
5000
Hãy nhớ phía này hứng thú với ngửa - sấp - sấp;
còn với các bạn là ngửa - sấp - ngửa.
Chúng ta tung đồng xu, và nhận được mặt ngửa
06:35
If you went head-tail-head-tail-head, you can cunningly get two occurrences
123
395000
4000
và các bạn háo hức mong chờ
06:39
of the pattern in only five tosses.
124
399000
3000
bởi vì điều gì đó kì tích có thể sắp xảy ra.
06:42
You can't do that with head-tail-tail.
125
402000
2000
Lần tung tiếp là sấp, bạn cực kì hào hứng.
06:44
That turns out to be important.
126
404000
2000
06:46
There are two ways of thinking about this.
127
406000
2000
Rượu sâm banh đã sẵn sàng, bạn chỉ cần rót vào ly để ăn mừng.
06:48
I'll give you one of them.
128
408000
2000
06:50
So imagine -- let's suppose we're doing it.
129
410000
2000
Bạn nín thở chờ đợi lần tung cuối.
06:52
On this side -- remember, you're excited about head-tail-tail;
130
412000
2000
Và, nếu là mặt ngửa thì tuyệt vời. Xong xuôi, và bạn ăn mừng.
06:54
you're excited about head-tail-head.
131
414000
2000
06:56
We start tossing a coin, and we get a head --
132
416000
3000
Nếu là sấp-- chà, hơi thất vọng, bạn cất ly và cả sâm banh.
06:59
and you start sitting on the edge of your seat
133
419000
1000
Bạn tiếp tục tung, đợi tới khi được mặt ngửa để tiếp tục hào hứng.
07:00
because something great and wonderful, or awesome, might be about to happen.
134
420000
5000
Bên này lại có một trải nghiệm khác.
07:05
The next toss is a tail -- you get really excited.
135
425000
2000
Cả hai lần tung đầu đều như nhau.
07:07
The champagne's on ice just next to you; you've got the glasses chilled to celebrate.
136
427000
4000
Bạn vui mừng một chút khi thấy mặt ngửa ở lần đầu,
và vui mừng hơn khi thấy nó ở lần hai.
07:11
You're waiting with bated breath for the final toss.
137
431000
2000
07:13
And if it comes down a head, that's great.
138
433000
2000
Rồi bạn tung đồng xu.
Nếu là mặt sấp, bạn khui rượu sâm banh.
07:15
You're done, and you celebrate.
139
435000
2000
07:17
If it's a tail -- well, rather disappointedly, you put the glasses away
140
437000
2000
Nếu là ngửa, bạn thất vọng.
07:19
and put the champagne back.
141
439000
2000
Nhưng bạn vẫn đang ở 1/3 quãng đường để lại thấy thứ tự mong muốn.
07:21
And you keep tossing, to wait for the next head, to get excited.
142
441000
3000
Đó là một cách đơn giản để trình bày về lý do có sự khác biệt.
07:25
On this side, there's a different experience.
143
445000
2000
07:27
It's the same for the first two parts of the sequence.
144
447000
3000
Cách còn lại--
Nếu ta tung đồng xu tám triệu lần,
07:30
You're a little bit excited with the first head --
145
450000
2000
ta chờ mong một triệu lần ngửa - sấp - ngửa
07:32
you get rather more excited with the next tail.
146
452000
2000
và một triệu ngửa - sấp - sấp,
07:34
Then you toss the coin.
147
454000
2000
nhưng ngửa - sấp - ngửa có thể xuất hiện theo cụm.
07:36
If it's a tail, you crack open the champagne.
148
456000
3000
07:39
If it's a head you're disappointed,
149
459000
2000
Nếu bạn muốn phân tán một triệu món đồ giữa tám triệu vị trí
07:41
but you're still a third of the way to your pattern again.
150
461000
3000
và bạn có thể xếp vài món trùng nhau,
07:44
And that's an informal way of presenting it -- that's why there's a difference.
151
464000
4000
thì các cụm sẽ xa nhau hơn.
Đó là một cách khác để nhìn nhận trực giác.
07:48
Another way of thinking about it --
152
468000
2000
Điều tôi muốn ở đây là gì?
07:50
if we tossed a coin eight million times,
153
470000
2000
Đây là một ví dụ rất đơn giản, một câu hỏi dễ giải thích về xác suất,
07:52
then we'd expect a million head-tail-heads
154
472000
2000
07:54
and a million head-tail-tails -- but the head-tail-heads could occur in clumps.
155
474000
7000
mà ai trong tình huống tương tự cũng trả lời sai.
Hơi lái sang đam mê thật sự về gen của tôi một chút.
08:01
So if you want to put a million things down amongst eight million positions
156
481000
2000
Ngửa - sấp - ngửa và ngửa - sấp - sấp có một mối liên kết trong di truyền,
08:03
and you can have some of them overlapping, the clumps will be further apart.
157
483000
5000
cụ thể như sau.
08:08
It's another way of getting the intuition.
158
488000
2000
Khi tung đồng xu, bạn sẽ thấy một chuỗi ngửa và sấp.
08:10
What's the point I want to make?
159
490000
2000
Khi nhìn vào DNA, không chỉ đơn thuần là chuỗi sấp và ngửa
08:12
It's a very, very simple example, an easily stated question in probability,
160
492000
4000
mà là bốn chữ cái: A, G, C, T.
08:16
which every -- you're in good company -- everybody gets wrong.
161
496000
3000
Có một chất hóa học tựa như cái kéo, gọi là enzyme giới hạn,
08:19
This is my little diversion into my real passion, which is genetics.
162
499000
4000
chúng cắt DNA mỗi khi bắt gặp những thứ tự nhất định.
Và chúng là một công cụ vô cùng hữu ích trong sinh học phân tử hiện đại.
08:23
There's a connection between head-tail-heads and head-tail-tails in genetics,
163
503000
3000
08:26
and it's the following.
164
506000
3000
Thay cho câu hỏi “Mất bao lâu để thấy ngửa - sấp - ngửa?”,
08:29
When you toss a coin, you get a sequence of heads and tails.
165
509000
3000
ta nghĩ, “Các chuỗi sẽ rộng tới đâu
khi dùng enzymes giới hạn cắt ngang mỗi khi chuỗi G - A - A - G xuất hiện?
08:32
When you look at DNA, there's a sequence of not two things -- heads and tails --
166
512000
3000
08:35
but four letters -- As, Gs, Cs and Ts.
167
515000
3000
Chuỗi ấy sẽ dài bao nhiêu?"
08:38
And there are little chemical scissors, called restriction enzymes
168
518000
3000
Ấy là một điểm giao khá nhỏ giữa xác suất và di truyền.
08:41
which cut DNA whenever they see particular patterns.
169
521000
2000
08:43
And they're an enormously useful tool in modern molecular biology.
170
523000
4000
Có mối quan hệ sâu sắc hơn, mà tôi không có thời gian để đào sâu,
đó là di truyền học hiện đại, một lĩnh vực rất thú vị của khoa học.
08:48
And instead of asking the question, "How long until I see a head-tail-head?" --
171
528000
3000
Ta sẽ nghe vài bài trình bày trong hội thảo cụ thể về chuyên đề đó.
08:51
you can ask, "How big will the chunks be when I use a restriction enzyme
172
531000
3000
Nhưng hóa ra mở khóa những bí mật trong các thông tin được tạo ra bởi
08:54
which cuts whenever it sees G-A-A-G, for example?
173
534000
4000
công nghệ thí nghiệm, một phần then chốt khá phức tạp--
08:58
How long will those chunks be?"
174
538000
2000
09:00
That's a rather trivial connection between probability and genetics.
175
540000
5000
Bạn sẽ nhẹ nhõm khi biết rằng tôi làm điều hữu ích trong công việc,
09:05
There's a much deeper connection, which I don't have time to go into
176
545000
3000
còn phức tạp hơn câu chuyện ngửa - sấp - ngửa...
09:08
and that is that modern genetics is a really exciting area of science.
177
548000
3000
Như là mô hình điện toán khá phức tạp và mô hình toán học
09:11
And we'll hear some talks later in the conference specifically about that.
178
551000
4000
và kỹ thuật thống kê hiện đại.
Và tôi sẽ đưa cho bạn hai trích đoạn nhỏ - hai ví dụ
09:15
But it turns out that unlocking the secrets in the information generated by modern
179
555000
4000
về những dự án chúng tôi đang làm ở Oxford,
09:19
experimental technologies, a key part of that has to do with fairly sophisticated --
180
559000
5000
tôi nghĩ cả hai đều khá thú vị.
Bạn hẳn đã biết Dự án Hệ gen Người.
Dự án với mục đích đọc bản sao của gen người.
09:24
you'll be relieved to know that I do something useful in my day job,
181
564000
3000
09:27
rather more sophisticated than the head-tail-head story --
182
567000
2000
09:29
but quite sophisticated computer modelings and mathematical modelings
183
569000
4000
Việc làm dĩ nhiên sau khi bạn hoàn thành--
Là dự án này, Dự án HapMap Quốc tế,
09:33
and modern statistical techniques.
184
573000
2000
đó là sự hợp tác giữa các phòng thí nghiệm của năm, sáu quốc gia khác nhau.
09:35
And I will give you two little snippets -- two examples --
185
575000
3000
09:38
of projects we're involved in in my group in Oxford,
186
578000
3000
Dự án Hệ gen Người là nghiên cứu về những điểm chung của ta,
09:41
both of which I think are rather exciting.
187
581000
2000
và Dự án HapMap nhằm tìm hiểu
09:43
You know about the Human Genome Project.
188
583000
2000
nơi có sự khác biệt giữa những người khác nhau.
09:45
That was a project which aimed to read one copy of the human genome.
189
585000
4000
Tại sao ta quan tâm việc đó? Có rất nhiều lý do.
Mà cấp thiết nhất là ta muốn biết làm sao một số khác biệt ấy
09:51
The natural thing to do after you've done that --
190
591000
2000
09:53
and that's what this project, the International HapMap Project,
191
593000
2000
09:55
which is a collaboration between labs in five or six different countries.
192
595000
5000
khiến vài người dễ mắc bệnh, ví dụ tiểu đường tuýp 2
và khiến vài người khác dễ bị bệnh tim,
10:00
Think of the Human Genome Project as learning what we've got in common,
193
600000
4000
hoặc đột quỵ, tự kỷ và nhiều nữa.
10:04
and the HapMap Project is trying to understand
194
604000
2000
10:06
where there are differences between different people.
195
606000
2000
Đó là một dự án lớn.
10:08
Why do we care about that?
196
608000
2000
Có dự án lớn thứ hai,
được tài trợ bởi Quỹ Wellcome ở quốc gia này,
10:10
Well, there are lots of reasons.
197
610000
2000
liên quan đến các nghiên cứu rất rộng--
10:12
The most pressing one is that we want to understand how some differences
198
612000
4000
hàng ngàn người, mắc một trong tám căn bệnh khác nhau,
10:16
make some people susceptible to one disease -- type-2 diabetes, for example --
199
616000
4000
bệnh thông thường như tiểu đường tuýp 1 và tuýp 2 và bệnh tim mạch vành,
10:20
and other differences make people more susceptible to heart disease,
200
620000
5000
rối loạn lưỡng cực và nhiều nữa,
để cố hiểu được di truyền.
10:25
or stroke, or autism and so on.
201
625000
2000
Để thứ tìm hiểu điều gì trong khác biệt di truyền đã gây ra các bệnh.
10:27
That's one big project.
202
627000
2000
10:29
There's a second big project,
203
629000
2000
Sao chúng tôi muốn làm thế?
Bởi vì ta hiểu rất ít về các bệnh của con người.
10:31
recently funded by the Wellcome Trust in this country,
204
631000
2000
Ta không biết nguyên nhân gây bệnh.
10:33
involving very large studies --
205
633000
2000
Và nếu ta đi từ căn nguyên và hiểu được di truyền học,
10:35
thousands of individuals, with each of eight different diseases,
206
635000
3000
ta sẽ nhận thức cách hoạt động của bệnh tật,
10:38
common diseases like type-1 and type-2 diabetes, and coronary heart disease,
207
638000
4000
cũng như cách thức mới để chữa trị bệnh, biện pháp ngăn ngừa, vân vân.
10:42
bipolar disease and so on -- to try and understand the genetics.
208
642000
4000
Vậy, như đã nói, đó là đôi chút chia sẻ thêm về đề tài tôi đam mê.
10:46
To try and understand what it is about genetic differences that causes the diseases.
209
646000
3000
Quay lại các vấn đề trần tục hơn là suy nghĩ về sự hoài nghi.
10:49
Why do we want to do that?
210
649000
2000
10:51
Because we understand very little about most human diseases.
211
651000
3000
Và đây là câu hỏi mẹo khác cho các bạn.
10:54
We don't know what causes them.
212
654000
2000
Giả sử ta nhận được xét nghiệm bệnh,
10:56
And if we can get in at the bottom and understand the genetics,
213
656000
2000
kết quả có thể sai nhưng lại tốt.
10:58
we'll have a window on the way the disease works,
214
658000
3000
Khả năng chính xác của nó lên đến 99%.
11:01
and a whole new way about thinking about disease therapies
215
661000
2000
Tôi chọn một người ở đây, hoặc một người trên phố,
11:03
and preventative treatment and so on.
216
663000
3000
tôi xét nghiệm xem họ có mang bệnh không.
11:06
So that's, as I said, the little diversion on my main love.
217
666000
3000
Giả sử đó là xét nghiệm HIV, loại virus gây AIDS
11:09
Back to some of the more mundane issues of thinking about uncertainty.
218
669000
5000
và kết quả dương tính.
11:14
Here's another quiz for you --
219
674000
2000
Khả năng mắc bệnh họ là bao nhiêu?
11:16
now suppose we've got a test for a disease
220
676000
2000
Kết quả đúng 99% mọi lúc.
11:18
which isn't infallible, but it's pretty good.
221
678000
2000
Nên câu trả lời mặc nhiên là 99%.
11:20
It gets it right 99 percent of the time.
222
680000
3000
Ai thích câu trả lời đó nào?
11:23
And I take one of you, or I take someone off the street,
223
683000
3000
Thôi nào-- mọi người tham gia đi.
11:26
and I test them for the disease in question.
224
686000
2000
Các bạn không tin tôi nữa à.
(Tiếng cười)
11:28
Let's suppose there's a test for HIV -- the virus that causes AIDS --
225
688000
4000
Chà, các bạn hoài nghi cũng phải thôi, vì đó không phải là câu trả lời.
11:32
and the test says the person has the disease.
226
692000
3000
Đó là điều mà bạn nghĩ.
Đó không là câu trả lời, và không phải vì nó chỉ là một phần câu chuyện.
11:35
What's the chance that they do?
227
695000
3000
Thật ra nó phụ thuộc vào độ phổ biến hay hiếm gặp của căn bệnh.
11:38
The test gets it right 99 percent of the time.
228
698000
2000
11:40
So a natural answer is 99 percent.
229
700000
4000
Nên tôi sẽ cố gắng minh họa nó.
Đây là tranh biếm họa nhỏ về một triệu cá thể.
11:44
Who likes that answer?
230
704000
2000
11:46
Come on -- everyone's got to get involved.
231
706000
1000
11:47
Don't think you don't trust me anymore.
232
707000
2000
Nghĩ về một căn bệnh mà nó ảnh hưởng--
nó khá hiếm gặp, chỉ có ở 1 trong số 10.000 người.
11:49
(Laughter)
233
709000
1000
11:50
Well, you're right to be a bit skeptical, because that's not the answer.
234
710000
3000
Trong số triệu người, phần lớn đều khỏe mạnh
11:53
That's what you might think.
235
713000
2000
và một vài người sẽ mắc bệnh.
11:55
It's not the answer, and it's not because it's only part of the story.
236
715000
3000
Và thực tế, với mức độ nhiễm bệnh này,
11:58
It actually depends on how common or how rare the disease is.
237
718000
3000
khoảng 100 người sẽ mắc bệnh, số người còn lại thì không.
12:01
So let me try and illustrate that.
238
721000
2000
Giả sử ta xét nghiệm tất cả mọi người.
12:03
Here's a little caricature of a million individuals.
239
723000
4000
Chuyện gì sẽ xảy ra?
Chà, trong số 100 người mắc bệnh,
12:07
So let's think about a disease that affects --
240
727000
3000
xét nghiệm luôn đúng 99%, nên sẽ có 99 người dương tính.
12:10
it's pretty rare, it affects one person in 10,000.
241
730000
2000
12:12
Amongst these million individuals, most of them are healthy
242
732000
3000
Trong số những người không mắc bệnh, xét nghiệm cũng chính xác đến 99%
12:15
and some of them will have the disease.
243
735000
2000
12:17
And in fact, if this is the prevalence of the disease,
244
737000
3000
và khả năng sai là 1%.
Nhưng có rất nhiều người, nên sẽ có nhiều kết quả dương tính giả.
12:20
about 100 will have the disease and the rest won't.
245
740000
3000
12:23
So now suppose we test them all.
246
743000
2000
Hay nói cách khác,
12:25
What happens?
247
745000
2000
trong số những người dương tính-- họ ở đây, những người có liên quan--
12:27
Well, amongst the 100 who do have the disease,
248
747000
2000
12:29
the test will get it right 99 percent of the time, and 99 will test positive.
249
749000
5000
chưa đến 1 trên tổng 100 người thực sự mắc bệnh.
12:34
Amongst all these other people who don't have the disease,
250
754000
2000
12:36
the test will get it right 99 percent of the time.
251
756000
3000
Nên mặc dù ta nghĩ xét nghiệm chính xác,
phần quan trọng của câu chuyện là ta cần thêm một ít thông tin khác.
12:39
It'll only get it wrong one percent of the time.
252
759000
2000
12:41
But there are so many of them that there'll be an enormous number of false positives.
253
761000
4000
Và đây là trực giác quan trọng.
12:45
Put that another way --
254
765000
2000
Điều chúng ta cần làm, khi đã biết kết quả dương tính
12:47
of all of them who test positive -- so here they are, the individuals involved --
255
767000
5000
là cân nhắc độ hợp lý, hay khả năng xảy ra của hai cách giải thích đối nghịch nhau.
12:52
less than one in 100 actually have the disease.
256
772000
5000
Mỗi cách giải thích đó đều có một chút khả thi và không khả thi.
12:57
So even though we think the test is accurate, the important part of the story is
257
777000
4000
Cách giải thích rằng người đó không mắc bệnh,
điều này rất có thể xảy ra nếu bạn chọn ngẫu nhiên một người--
13:01
there's another bit of information we need.
258
781000
3000
13:04
Here's the key intuition.
259
784000
2000
nhưng kết quả xét nghiệm lại sai, điều mà khó xảy ra.
13:07
What we have to do, once we know the test is positive,
260
787000
3000
Một giải thích khác là người đó mắc bệnh,
13:10
is to weigh up the plausibility, or the likelihood, of two competing explanations.
261
790000
6000
điều khó có thể xảy ra,
nhưng kết quả lại đúng, điều có khả năng xảy ra cao.
Và con số cuối cùng chúng ta có được,
13:16
Each of those explanations has a likely bit and an unlikely bit.
262
796000
3000
con số nhỏ hơn 1/100 một chút
13:19
One explanation is that the person doesn't have the disease --
263
799000
3000
thể hiện khả năng hai cách giải thích có liên quan đến nhau.
13:22
that's overwhelmingly likely, if you pick someone at random --
264
802000
3000
Khả năng hai cách giải thích xảy ra đồng thời là không cao.
13:25
but the test gets it wrong, which is unlikely.
265
805000
3000
Đây là một ví dụ tương tự mang tính thời sự hơn.
13:29
The other explanation is that the person does have the disease -- that's unlikely --
266
809000
3000
Trong số các bạn ai là người Anh ắt sẽ biết về một vụ việc khá nổi tiếng
13:32
but the test gets it right, which is likely.
267
812000
3000
13:35
And the number we end up with --
268
815000
2000
về một phụ nữ tên Sally Clark, có hai người con bị đột tử.
13:37
that number which is a little bit less than one in 100 --
269
817000
3000
13:40
is to do with how likely one of those explanations is relative to the other.
270
820000
6000
Và ban đầu, người ta nghĩ chúng qua đời vì cái gọi là “chết trong nôi”,
hay gọi chính thức là “Hội chứng Đột tử ở Trẻ sơ sinh”.
13:46
Each of them taken together is unlikely.
271
826000
2000
Vì nhiều lý do, cô ấy sau đó bị kết án giết người.
13:49
Here's a more topical example of exactly the same thing.
272
829000
3000
Tại phiên xét xử cô ấy, một bác sĩ nhi khoa lỗi lạc đã làm chứng
13:52
Those of you in Britain will know about what's become rather a celebrated case
273
832000
4000
rằng khả năng của hai cái chết trong nôi này, cái chết vô tội,
13:56
of a woman called Sally Clark, who had two babies who died suddenly.
274
836000
5000
trong những gia đình như của cô ấy,
tức là có nghề nghiệp ổn định và không hút thuốc,
là 1 trong 73 triệu.
14:01
And initially, it was thought that they died of what's known informally as "cot death,"
275
841000
4000
Để rút ngắn câu chuyện, cô ấy bị kết án tại thời điểm đó.
14:05
and more formally as "Sudden Infant Death Syndrome."
276
845000
3000
Sau đó, chỉ mới đây, cô ấy được tha bổng-- thực tế, trong lần kháng cáo thứ hai.
14:08
For various reasons, she was later charged with murder.
277
848000
2000
14:10
And at the trial, her trial, a very distinguished pediatrician gave evidence
278
850000
4000
Và đặt vào tình huống đó, hãy tưởng tượng khủng khiếp đến nhường nào
14:14
that the chance of two cot deaths, innocent deaths, in a family like hers --
279
854000
5000
khi một người mất một và rồi hai đứa con,
14:19
which was professional and non-smoking -- was one in 73 million.
280
859000
6000
nếu họ vô tội nhưng lại bị kết án giết hại con mình.
Trải qua căng thẳng của phiên tòa, bị kết tội giết hại con
và nếm cảnh lao tù tại trại giam nữ,
nơi các tù nhân khác nghĩ rằng bạn giết hại con ruột.
14:26
To cut a long story short, she was convicted at the time.
281
866000
3000
Quả là điều khủng khiếp với một ai đó.
14:29
Later, and fairly recently, acquitted on appeal -- in fact, on the second appeal.
282
869000
5000
Và lỗi ở đây xảy ra phần lớn bởi vì
14:34
And just to set it in context, you can imagine how awful it is for someone
283
874000
4000
chuyên gia đã thống kê sai hoàn toàn,
14:38
to have lost one child, and then two, if they're innocent,
284
878000
3000
theo hai cách khác nhau.
Vậy từ đâu mà ông ấy có được con số 1 phần 73 triệu?
14:41
to be convicted of murdering them.
285
881000
2000
14:43
To be put through the stress of the trial, convicted of murdering them --
286
883000
2000
Ông dựa vào vài nghiên cứu, theo đó khả năng đột tử của một đứa trẻ
14:45
and to spend time in a women's prison, where all the other prisoners
287
885000
3000
trong gia đình như của Sally Clark
14:48
think you killed your children -- is a really awful thing to happen to someone.
288
888000
5000
là 1 phần 8.500.
Vì thế ông ấy đã nói, “Tôi sẽ giả sử rằng trong gia đình có một đứa trẻ đột tử,
14:53
And it happened in large part here because the expert got the statistics
289
893000
5000
khả năng đứa trẻ thứ hai bị đột tử cũng không thay đổi.”
14:58
horribly wrong, in two different ways.
290
898000
3000
Đó là những gì mà các nhà thống kê gọi là giả thiết độc lập.
15:01
So where did he get the one in 73 million number?
291
901000
4000
Nó giống như, “Nếu bạn tung một đồng xu và lần đầu xuất hiện mặt ngửa,
15:05
He looked at some research, which said the chance of one cot death in a family
292
905000
3000
sẽ không ảnh hưởng khả năng ta sẽ thấy mặt ngửa ở lần thứ hai.”
15:08
like Sally Clark's is about one in 8,500.
293
908000
5000
Vì thế nếu bạn tung đồng xu hai lần,
xác suất thu về hai mặt ngửa
là một nửa (xác suất của lần đầu tiên) nhân với một nửa (xác suất ở lần hai),
15:13
So he said, "I'll assume that if you have one cot death in a family,
294
913000
4000
Vì thế ông ấy nói, “Tôi giả sử rằng những ca đột tử này độc lập với nhau.
15:17
the chance of a second child dying from cot death aren't changed."
295
917000
4000
15:21
So that's what statisticians would call an assumption of independence.
296
921000
3000
Khi bạn nhân hai lần 8.500 với nhau,
bạn được khoảng 73 triệu.”
15:24
It's like saying, "If you toss a coin and get a head the first time,
297
924000
2000
Và chẳng có giả thiết nào được phát biểu tại tòa
15:26
that won't affect the chance of getting a head the second time."
298
926000
3000
hay trình bày trước bồi thẩm đoàn theo cách như thế.
15:29
So if you toss a coin twice, the chance of getting a head twice are a half --
299
929000
5000
Nhưng rủi thay-- và, thật sự đáng tiếc,
trước hết, các tình huống tương tự phải được kiểm chứng bằng thực nghiệm.
15:34
that's the chance the first time -- times a half -- the chance a second time.
300
934000
3000
15:37
So he said, "Here,
301
937000
2000
Và thứ hai, nó sai rõ ràng.
15:39
I'll assume that these events are independent.
302
939000
4000
Có nhiều và rất nhiều thứ mà chúng ta không biết về chứng đột tử ở trẻ em.
15:43
When you multiply 8,500 together twice,
303
943000
2000
15:45
you get about 73 million."
304
945000
2000
Có thể có những yếu tố do môi trường mà chúng ta không nhận ra,
15:47
And none of this was stated to the court as an assumption
305
947000
2000
và rất có khả năng xảy ra trường hợp có các yếu tố di truyền mà ta không biết.
15:49
or presented to the jury that way.
306
949000
2000
15:52
Unfortunately here -- and, really, regrettably --
307
952000
3000
Vậy nếu một gia đình có trẻ em đột tử, bạn nên đặt họ vào nhóm có nguy cơ cao.
15:55
first of all, in a situation like this you'd have to verify it empirically.
308
955000
4000
Họ có thể bị tác động bởi yếu tố rủi ro từ môi trường
và/hoặc nguy cơ từ di truyền mà ta không biết.
15:59
And secondly, it's palpably false.
309
959000
2000
Và để biện luận, việc ngó lơ thông tin kia khi tính xác suất ca đột tử thứ hai
16:02
There are lots and lots of things that we don't know about sudden infant deaths.
310
962000
5000
thật sự ngu xuẩn.
16:07
It might well be that there are environmental factors that we're not aware of,
311
967000
3000
Còn tệ hại hơn cả ngu xuẩn-- quả thật là nguỵ biện khoa học.
16:10
and it's pretty likely to be the case that there are
312
970000
2000
Dù sao, đó là cách nó được trình bày,
16:12
genetic factors we're not aware of.
313
972000
2000
và tại phiên tòa, không ai phản biện điều đó.
16:14
So if a family suffers from one cot death, you'd put them in a high-risk group.
314
974000
3000
Đó là vấn đề đầu tiên.
16:17
They've probably got these environmental risk factors
315
977000
2000
Vấn đề thứ hai là, con số 1 phần 73 triệu có ý nghĩa gì?
16:19
and/or genetic risk factors we don't know about.
316
979000
3000
Vậy, sau khi Sally Clark bị kết án,
16:22
And to argue, then, that the chance of a second death is as if you didn't know
317
982000
3000
bạn có thể tưởng tượng, sự việc tạo ra một sự bùng nổ trong cộng đồng.
16:25
that information is really silly.
318
985000
3000
16:28
It's worse than silly -- it's really bad science.
319
988000
4000
Một trong những nhà báo từ toà soạn danh tiếng tại Anh đã viết
16:32
Nonetheless, that's how it was presented, and at trial nobody even argued it.
320
992000
5000
về những gì chuyên gia này đã nói là,
“Khả năng mà cô ấy vô tội là 1 phần 73 triệu.”
16:37
That's the first problem.
321
997000
2000
16:39
The second problem is, what does the number of one in 73 million mean?
322
999000
4000
Đó là một lỗi logic.
16:43
So after Sally Clark was convicted --
323
1003000
2000
Hoàn toàn tương tự sự phi logic khi nghĩ rằng
16:45
you can imagine, it made rather a splash in the press --
324
1005000
4000
sau lần xét nghiệm bệnh có độ chính xác 99%,
16:49
one of the journalists from one of Britain's more reputable newspapers wrote that
325
1009000
7000
khả năng mắc bệnh là 99%.
Trong ví dụ về bệnh, ta đã nghĩ đến hai điều,
16:56
what the expert had said was,
326
1016000
2000
một là khả năng xét nghiệm đúng hoặc sai.
16:58
"The chance that she was innocent was one in 73 million."
327
1018000
5000
Và điều còn lại là khả năng, tiên nghiệm, người đó có mắc bệnh hay không.
17:03
Now, that's a logical error.
328
1023000
2000
Điều này cũng tương tự trong tình huống này.
17:05
It's exactly the same logical error as the logical error of thinking that
329
1025000
3000
17:08
after the disease test, which is 99 percent accurate,
330
1028000
2000
Có hai điều liên quan, hai phần của lời giải thích.
17:10
the chance of having the disease is 99 percent.
331
1030000
4000
Ta muốn biết hai cách giải thích khác nhau có khả năng, hoặc tương đối ra sao.
17:14
In the disease example, we had to bear in mind two things,
332
1034000
4000
Một trong số đó là Sally Clark vô tội --
17:18
one of which was the possibility that the test got it right or not.
333
1038000
4000
chính là tiên nghiệm, rất có khả năng xảy ra,
hầu hết các bà mẹ không giết con mình.
17:22
And the other one was the chance, a priori, that the person had the disease or not.
334
1042000
4000
Và phần thứ hai của lời giải thích
là cô ấy trải qua một sự kiện cực kỳ khó xảy ra.
17:26
It's exactly the same in this context.
335
1046000
3000
Không phải là 1 phần 73 triệu, nhưng dù sao cũng khá khó xảy ra.
17:29
There are two things involved -- two parts to the explanation.
336
1049000
4000
Một giải thích khác là cô ấy có tội.
17:33
We want to know how likely, or relatively how likely, two different explanations are.
337
1053000
4000
Ta có lẽ nghĩ tiên nghiệm này khó xảy ra.
17:37
One of them is that Sally Clark was innocent --
338
1057000
3000
Và ta chắc chắn nên suy xét trong bối cảnh vụ án hình sự,
17:40
which is, a priori, overwhelmingly likely --
339
1060000
2000
rằng việc đó khó xảy ra, dựa vào suy đoán vô tội.
17:42
most mothers don't kill their children.
340
1062000
3000
Và nếu có ý định giết con mình, cô ấy đã thành công.
17:45
And the second part of the explanation
341
1065000
2000
Vì thế khả năng cô ấy vô tội không phải là 1 phần 73 triệu.
17:47
is that she suffered an incredibly unlikely event.
342
1067000
3000
17:50
Not as unlikely as one in 73 million, but nonetheless rather unlikely.
343
1070000
4000
Ta không biết con số cụ thể.
Cần cân nhắc những bằng chứng chống lại cô ấy
17:54
The other explanation is that she was guilty.
344
1074000
2000
17:56
Now, we probably think a priori that's unlikely.
345
1076000
2000
và bằng chứng có thống kê.
17:58
And we certainly should think in the context of a criminal trial
346
1078000
3000
Ta biết những đứa trẻ đã chết.
18:01
that that's unlikely, because of the presumption of innocence.
347
1081000
3000
Bất kể hai giải thích này có khả năng hoặc liên quan đến nhau hay không.
18:04
And then if she were trying to kill the children, she succeeded.
348
1084000
4000
Và cả hai đều không hợp lý.
18:08
So the chance that she's innocent isn't one in 73 million.
349
1088000
4000
Có trường hợp các sai sót trong thống kê
18:12
We don't know what it is.
350
1092000
2000
gây ra những hậu quả thực sự nghiêm trọng và rất đáng tiếc.
18:14
It has to do with weighing up the strength of the other evidence against her
351
1094000
4000
Thực tế, có hai phụ nữ khác đã bị kết tội
18:18
and the statistical evidence.
352
1098000
2000
dựa trên lời khai của bác sĩ nhi khoa này, họ chỉ được tuyên trắng án sau kháng cáo.
18:20
We know the children died.
353
1100000
2000
18:22
What matters is how likely or unlikely, relative to each other,
354
1102000
4000
Nhiều vụ án đã được xem xét lại.
Và sự việc rất được quan tâm
vì ông ấy hiện phải đối mặt với cáo buộc tai tiếng
18:26
the two explanations are.
355
1106000
2000
18:28
And they're both implausible.
356
1108000
2000
tại Hội đồng Y khoa của Anh.
18:31
There's a situation where errors in statistics had really profound
357
1111000
4000
Để kết luận, thông điệp đáng nhớ từ chuyện này là gì?
18:35
and really unfortunate consequences.
358
1115000
3000
Chà, ta biết sự ngẫu nhiên và không chắc chắn và tình cờ
18:38
In fact, there are two other women who were convicted on the basis of the
359
1118000
2000
là một phần rất đỗi thông thường trong đời sống hằng ngày.
18:40
evidence of this pediatrician, who have subsequently been released on appeal.
360
1120000
4000
Cũng đúng-- và, mặc dù,
18:44
Many cases were reviewed.
361
1124000
2000
tập thể các bạn rất đặc biệt theo nhiều cách,
18:46
And it's particularly topical because he's currently facing a disrepute charge
362
1126000
4000
việc các bạn trả lời sai các ví dụ của tôi là hoàn toàn bình thường.
18:50
at Britain's General Medical Council.
363
1130000
3000
Có nhiều nghiên cứu cho thấy con người mắc sai lầm.
18:53
So just to conclude -- what are the take-home messages from this?
364
1133000
4000
Trong các tình huống không chắc chắn, mọi người mắc lỗi logic.
18:57
Well, we know that randomness and uncertainty and chance
365
1137000
4000
Ta có thể xuất sắc đương đầu với sự tinh tế của ngôn ngữ
19:01
are very much a part of our everyday life.
366
1141000
3000
và đặt các câu hỏi có tính xây dựng thú vị về quá trình tiến hóa của mình.
Ta lại không giỏi suy đoán những sự không chắc chắn.
19:04
It's also true -- and, although, you, as a collective, are very special in many ways,
367
1144000
5000
Đó là vấn đề hằng ngày của ta.
Như các bạn đã nghe từ nhiều bài nói,
19:09
you're completely typical in not getting the examples I gave right.
368
1149000
4000
thống kê là cơ sở cho một lượng lớn các nghiên cứu
19:13
It's very well documented that people get things wrong.
369
1153000
3000
về khoa học, xã hội học, y học và tất nhiên, khá nhiều ngành công nghiệp.
19:16
They make errors of logic in reasoning with uncertainty.
370
1156000
3000
Tất cả kiểm định chất lượng, có tác động lớn đến quy trình công nghiệp,
19:20
We can cope with the subtleties of language brilliantly --
371
1160000
2000
đều lấy cơ sở từ số liệu thống kê.
19:22
and there are interesting evolutionary questions about how we got here.
372
1162000
3000
Đó là lĩnh vực ta vẫn chưa làm tốt.
19:25
We are not good at reasoning with uncertainty.
373
1165000
3000
Ít nhất ta nên thừa nhận điều đó, nhưng ta không muốn làm thế.
19:28
That's an issue in our everyday lives.
374
1168000
2000
Trở lại vấn đề luật pháp,
19:30
As you've heard from many of the talks, statistics underpins an enormous amount
375
1170000
3000
tại phiên xét xử Sally Clark,
tất cả luật sư đều chấp nhận những gì chuyên gia nhi khoa nói.
19:33
of research in science -- in social science, in medicine
376
1173000
3000
19:36
and indeed, quite a lot of industry.
377
1176000
2000
Vậy nếu một bác sĩ nhi khoa bước ra và nói với bồi thẩm đoàn,
19:38
All of quality control, which has had a major impact on industrial processing,
378
1178000
4000
“Tôi biết cách xây cầu. Tôi đã xây một cây cầu phía xa kia.
Hãy lái xe băng qua cầu để về nhà nhé,”
19:42
is underpinned by statistics.
379
1182000
2000
họ sẽ nói, “Chà, bác sĩ nhi khoa không biết xây cầu.
19:44
It's something we're bad at doing.
380
1184000
2000
Đó là việc của các kỹ sư."
19:46
At the very least, we should recognize that, and we tend not to.
381
1186000
3000
Mặt khác, ông ta đến và tích cực phát biểu hoặc áp đặt,
19:49
To go back to the legal context, at the Sally Clark trial
382
1189000
4000
“Tôi biết giải thích sự không chắc chắn. Tôi biết cách thống kê.”
Và mọi người nói, “Chà, ổn rồi. Ông ta là một chuyên gia.”
19:53
all of the lawyers just accepted what the expert said.
383
1193000
4000
Vì thế ta cần hiểu chuyên môn của mình là gì.
19:57
So if a pediatrician had come out and said to a jury,
384
1197000
2000
19:59
"I know how to build bridges. I've built one down the road.
385
1199000
3000
Các vấn đề tương tự nảy sinh trong thời kỳ đầu của thử nghiệm DNA,
20:02
Please drive your car home over it,"
386
1202000
2000
khi các nhà khoa học, và luật sư và đôi khi là các thẩm phán,
20:04
they would have said, "Well, pediatricians don't know how to build bridges.
387
1204000
2000
20:06
That's what engineers do."
388
1206000
2000
liên tục giải thích sai các bằng chứng.
20:08
On the other hand, he came out and effectively said, or implied,
389
1208000
3000
Thường thì họ không cố ý ngó lơ các chứng cứ, hy vọng là thế.
20:11
"I know how to reason with uncertainty. I know how to do statistics."
390
1211000
3000
Các nhà khoa học pháp y nói,
20:14
And everyone said, "Well, that's fine. He's an expert."
391
1214000
3000
“Khả năng người này vô tội là 1 phần 1 triệu.”
20:17
So we need to understand where our competence is and isn't.
392
1217000
3000
Thậm chí nếu bạn tin con số này, giống như tỉ lệ 1 phần 73 triệu,
20:20
Exactly the same kinds of issues arose in the early days of DNA profiling,
393
1220000
4000
chuyện không hẳn vậy đâu.
Và vì thế mới có những vụ kháng cáo nổi tiếng tại Anh và những nơi khác.
20:24
when scientists, and lawyers and in some cases judges,
394
1224000
4000
Và để kết thúc trong ngữ cảnh hệ thống luật pháp.
20:28
routinely misrepresented evidence.
395
1228000
3000
Nói rằng “Hãy cố gắng hết sức để đưa ra bằng chứng” cũng tuyệt đấy.
20:32
Usually -- one hopes -- innocently, but misrepresented evidence.
396
1232000
3000
Nhưng hơn thế nữa, khi thử nghiệm DNA, đây là trường hợp khác--
20:35
Forensic scientists said, "The chance that this guy's innocent is one in three million."
397
1235000
5000
ta mong đợi bồi thẩm đoàn, họ là những người dân bình thường,
20:40
Even if you believe the number, just like the 73 million to one,
398
1240000
2000
mà rõ ràng họ không có chuyên môn cao,
ta mong đợi bồi thẩm đoàn có thể hiểu được một loạt lập luận được đưa ra.
20:42
that's not what it meant.
399
1242000
2000
20:44
And there have been celebrated appeal cases
400
1244000
2000
Trong các lĩnh vực khác của cuộc sống, nếu mọi người tranh luận
20:46
in Britain and elsewhere because of that.
401
1246000
2000
20:48
And just to finish in the context of the legal system.
402
1248000
3000
à, ngoại trừ đối với chính trị--
nhưng trong lĩnh vực khác, nếu mọi người tranh luận vô lý,
20:51
It's all very well to say, "Let's do our best to present the evidence."
403
1251000
4000
ta sẽ cho đó không phải điều tốt.
20:55
But more and more, in cases of DNA profiling -- this is another one --
404
1255000
3000
Các chính trị gia thường tranh luận vô lý và ta không hy vọng hơn thế.
20:58
we expect juries, who are ordinary people --
405
1258000
3000
Trong trường hợp không chắc chắn, chúng ta luôn phạm sai lầm --
21:01
and it's documented they're very bad at this --
406
1261000
2000
và ít nhất, ta nên nhận thức điều đó,
21:03
we expect juries to be able to cope with the sorts of reasoning that goes on.
407
1263000
4000
và lý tưởng nhất, ta có thể thử làm điều gì đó.
Cảm ơn rất nhiều.
21:07
In other spheres of life, if people argued -- well, except possibly for politics --
408
1267000
5000
21:12
but in other spheres of life, if people argued illogically,
409
1272000
2000
21:14
we'd say that's not a good thing.
410
1274000
2000
21:16
We sort of expect it of politicians and don't hope for much more.
411
1276000
4000
21:20
In the case of uncertainty, we get it wrong all the time --
412
1280000
3000
21:23
and at the very least, we should be aware of that,
413
1283000
2000
21:25
and ideally, we might try and do something about it.
414
1285000
2000
21:27
Thanks very much.
415
1287000
1000
Về trang web này

Trang web này sẽ giới thiệu cho bạn những video YouTube hữu ích cho việc học tiếng Anh. Bạn sẽ thấy các bài học tiếng Anh được giảng dạy bởi các giáo viên hàng đầu từ khắp nơi trên thế giới. Nhấp đúp vào phụ đề tiếng Anh hiển thị trên mỗi trang video để phát video từ đó. Phụ đề cuộn đồng bộ với phát lại video. Nếu bạn có bất kỳ nhận xét hoặc yêu cầu nào, vui lòng liên hệ với chúng tôi bằng biểu mẫu liên hệ này.

https://forms.gle/WvT1wiN1qDtmnspy7