Peter Donnelly: How stats fool juries

239,907 views ・ 2007-01-12

TED


Dubbelklik op de Engelse ondertitels hieronder om de video af te spelen.

Vertaald door: Els De Keyser Nagekeken door: Axel Saffran
00:25
As other speakers have said, it's a rather daunting experience --
0
25000
2000
Zoals andere sprekers al zeiden: het is
00:27
a particularly daunting experience -- to be speaking in front of this audience.
1
27000
3000
een schrikbarende ervaring om voor dit publiek te spreken.
00:30
But unlike the other speakers, I'm not going to tell you about
2
30000
3000
In tegenstelling tot andere sprekers ga ik niet praten over
00:33
the mysteries of the universe, or the wonders of evolution,
3
33000
2000
de mysteries van het universum, de wonderen van de evolutie
00:35
or the really clever, innovative ways people are attacking
4
35000
4000
of de slimme, innovatieve manieren waarop mensen
00:39
the major inequalities in our world.
5
39000
2000
de grote ongelijkheden in deze wereld aanpakken.
00:41
Or even the challenges of nation-states in the modern global economy.
6
41000
5000
Zelfs niet over de uitdagingen van natiestaten in de globale economie.
00:46
My brief, as you've just heard, is to tell you about statistics --
7
46000
4000
Mijn opdracht is te vertellen over statistiek.
00:50
and, to be more precise, to tell you some exciting things about statistics.
8
50000
3000
Meer in het bijzonder: spannende dingen over statistiek.
00:53
And that's --
9
53000
1000
Dat is --
00:54
(Laughter)
10
54000
1000
(Gelach)
00:55
-- that's rather more challenging
11
55000
2000
dat is een veel lastiger klus
00:57
than all the speakers before me and all the ones coming after me.
12
57000
2000
dan alle sprekers voor mij en alle sprekers na mij.
00:59
(Laughter)
13
59000
1000
(Gelach)
01:01
One of my senior colleagues told me, when I was a youngster in this profession,
14
61000
5000
Eén van mijn oudere collega's vertelde mij, toen ik nog een groentje was,
01:06
rather proudly, that statisticians were people who liked figures
15
66000
4000
met een zekere trots: statistici zijn mensen die van cijfers houden
01:10
but didn't have the personality skills to become accountants.
16
70000
3000
maar niet de persoonlijkheid hebben om accountants te worden.
01:13
(Laughter)
17
73000
2000
(Gelach)
01:15
And there's another in-joke among statisticians, and that's,
18
75000
3000
Nog een inside joke onder statistici:
01:18
"How do you tell the introverted statistician from the extroverted statistician?"
19
78000
3000
"Hoe zie je het verschil tussen een introverte en een extraverte statisticus?"
01:21
To which the answer is,
20
81000
2000
Het antwoord is:
01:23
"The extroverted statistician's the one who looks at the other person's shoes."
21
83000
5000
"De extraverte statisticus is diegene die naar de schoenen van de ander kijkt."
01:28
(Laughter)
22
88000
3000
(Gelach)
01:31
But I want to tell you something useful -- and here it is, so concentrate now.
23
91000
5000
Ik wil jullie iets nuttigs vertellen. Hier komt het, dus nu even opletten.
01:36
This evening, there's a reception in the University's Museum of Natural History.
24
96000
3000
Vanavond is er een receptie in het Museum of Natural History van de universiteit.
01:39
And it's a wonderful setting, as I hope you'll find,
25
99000
2000
Een prachtig decor, zoals jullie hopelijk zullen ontdekken,
01:41
and a great icon to the best of the Victorian tradition.
26
101000
5000
een icoon uit de beste Victoriaanse traditie.
01:46
It's very unlikely -- in this special setting, and this collection of people --
27
106000
5000
Het is erg onwaarschijnlijk, in deze speciale omgeving, met deze groep mensen,
01:51
but you might just find yourself talking to someone you'd rather wish that you weren't.
28
111000
3000
maar heel misschien raak je aan de praat met iemand met wie je liever niet zou praten.
01:54
So here's what you do.
29
114000
2000
Laat me je een tip geven.
01:56
When they say to you, "What do you do?" -- you say, "I'm a statistician."
30
116000
4000
Als ze je vragen wat voor werk je doet, zeg je: "Ik ben statisticus."
02:00
(Laughter)
31
120000
1000
(Gelach)
02:01
Well, except they've been pre-warned now, and they'll know you're making it up.
32
121000
4000
Helaas zijn ze nu gewaarschuwd, en weten ze dat je het verzint.
02:05
And then one of two things will happen.
33
125000
2000
Dan zal er één van de volgende twee dingen gebeuren.
02:07
They'll either discover their long-lost cousin in the other corner of the room
34
127000
2000
Ofwel ontwaren ze een verloren gewaande neef in de andere hoek van de zaal,
02:09
and run over and talk to them.
35
129000
2000
en gaan ze daar op af voor een praatje.
02:11
Or they'll suddenly become parched and/or hungry -- and often both --
36
131000
3000
Ofwel zijn ze plots heel dorstig of hongerig -- vaak beide --
02:14
and sprint off for a drink and some food.
37
134000
2000
en rennen ze er vandoor voor een drankje en een hapje.
02:16
And you'll be left in peace to talk to the person you really want to talk to.
38
136000
4000
Jij kan dan in alle rust praten met de persoon met wie je echt wil praten.
02:20
It's one of the challenges in our profession to try and explain what we do.
39
140000
3000
Eén van de uitdagingen van mijn beroep is uitleggen wat we doen.
02:23
We're not top on people's lists for dinner party guests and conversations and so on.
40
143000
5000
Wij staan niet bovenaan de lijst van gewilde genodigden en gesprekspartners.
02:28
And it's something I've never really found a good way of doing.
41
148000
2000
Ik heb nooit goed geweten hoe dat moest.
02:30
But my wife -- who was then my girlfriend --
42
150000
3000
Mijn vrouw, die toen mijn vriendin was,
02:33
managed it much better than I've ever been able to.
43
153000
3000
deed dit veel beter dan ik.
02:36
Many years ago, when we first started going out, she was working for the BBC in Britain,
44
156000
3000
Vele jaren geleden, toen we elkaar pas kenden, werkte ze voor de BBC in Engeland.
02:39
and I was, at that stage, working in America.
45
159000
2000
Ik werkte toen in Amerika.
02:41
I was coming back to visit her.
46
161000
2000
Ik kwam terug om haar te bezoeken.
02:43
She told this to one of her colleagues, who said, "Well, what does your boyfriend do?"
47
163000
6000
Ze vertelde dat aan een collega, die vroeg: "Wat doet je vriendje?".
02:49
Sarah thought quite hard about the things I'd explained --
48
169000
2000
Sarah had hard nagedacht over wat ik had uitgelegd --
02:51
and she concentrated, in those days, on listening.
49
171000
4000
en in die tijd deed ze haar best om te luisteren.
02:55
(Laughter)
50
175000
2000
(Gelach)
02:58
Don't tell her I said that.
51
178000
2000
Niet zeggen dat ik dat gezegd heb.
03:00
And she was thinking about the work I did developing mathematical models
52
180000
4000
Ze dacht aan mijn werk, het ontwerpen van wiskundige modellen
03:04
for understanding evolution and modern genetics.
53
184000
3000
om de evolutie en de moderne genetica te begrijpen.
03:07
So when her colleague said, "What does he do?"
54
187000
3000
Toen haar collega zei: "Wat doet hij?"
03:10
She paused and said, "He models things."
55
190000
4000
dacht ze even na en zei: "Hij modelleert dingen."
03:14
(Laughter)
56
194000
1000
(Gelach)
03:15
Well, her colleague suddenly got much more interested than I had any right to expect
57
195000
4000
Haar collega toonde plots meer interesse dan ik mocht verhopen,
03:19
and went on and said, "What does he model?"
58
199000
3000
en zei: "Wat modelleert hij?"
03:22
Well, Sarah thought a little bit more about my work and said, "Genes."
59
202000
3000
Sarah dacht nog wat verder na over mijn werk en zei: "Genen."
03:25
(Laughter)
60
205000
4000
(Gelach)
03:29
"He models genes."
61
209000
2000
"Hij modelleert genen."
03:31
That is my first love, and that's what I'll tell you a little bit about.
62
211000
4000
Dat was mijn eerste liefde, en daar ga ik wat over vertellen.
03:35
What I want to do more generally is to get you thinking about
63
215000
4000
Meer in het algemeen wil ik jullie aan het denken zetten
03:39
the place of uncertainty and randomness and chance in our world,
64
219000
3000
over de plaats van onzekerheid, toeval en geluk in onze wereld,
03:42
and how we react to that, and how well we do or don't think about it.
65
222000
5000
hoe we erop reageren en hoe goed we er al dan niet over nadenken.
03:47
So you've had a pretty easy time up till now --
66
227000
2000
Tot hiertoe hadden jullie het gemakkelijk --
03:49
a few laughs, and all that kind of thing -- in the talks to date.
67
229000
2000
een beetje lachen en zo -- in voorgaande lezingen.
03:51
You've got to think, and I'm going to ask you some questions.
68
231000
3000
Je zult moeten nadenken, en ik ga jullie vragen stellen.
03:54
So here's the scene for the first question I'm going to ask you.
69
234000
2000
Hier is de achtergrond van mijn eerste vraag.
03:56
Can you imagine tossing a coin successively?
70
236000
3000
Beeld je in dat je een paar keer een munt opgooit.
03:59
And for some reason -- which shall remain rather vague --
71
239000
3000
Om een reden -- die eerder vaag zal blijven --
04:02
we're interested in a particular pattern.
72
242000
2000
interesseert ons een bepaald patroon.
04:04
Here's one -- a head, followed by a tail, followed by a tail.
73
244000
3000
Dit hier: kop, gevolgd door munt, gevolgd door munt.
04:07
So suppose we toss a coin repeatedly.
74
247000
3000
Veronderstel dat we herhaaldelijk gooien.
04:10
Then the pattern, head-tail-tail, that we've suddenly become fixated with happens here.
75
250000
5000
Vervolgens doet het patroon zich voor waarop we ons plots concentreren - kop, munt, munt.
04:15
And you can count: one, two, three, four, five, six, seven, eight, nine, 10 --
76
255000
4000
Je kan tellen: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10.
04:19
it happens after the 10th toss.
77
259000
2000
Het gebeurt na de tiende keer.
04:21
So you might think there are more interesting things to do, but humor me for the moment.
78
261000
3000
Misschien denk je dat er wel interessanter bezigheden zijn, maar sta me even toe.
04:24
Imagine this half of the audience each get out coins, and they toss them
79
264000
4000
Beeld je in dat deze helft van het publiek een munt neemt en opgooit,
04:28
until they first see the pattern head-tail-tail.
80
268000
3000
tot ze voor het eerst het kop-munt-munt-patroon zien.
04:31
The first time they do it, maybe it happens after the 10th toss, as here.
81
271000
2000
De eerste keer gebeurt het misschien na de 10de beurt, zoals hier.
04:33
The second time, maybe it's after the fourth toss.
82
273000
2000
De volgende keer misschien na de vierde beurt.
04:35
The next time, after the 15th toss.
83
275000
2000
De volgende keer na de 15de beurt.
04:37
So you do that lots and lots of times, and you average those numbers.
84
277000
3000
Doe dat heel vaak, en maak een gemiddelde van de getallen.
04:40
That's what I want this side to think about.
85
280000
3000
Ik zou deze kant willen vragen daarover na te denken.
04:43
The other half of the audience doesn't like head-tail-tail --
86
283000
2000
De andere helft van het publiek houdt niet van kop-munt-munt --
04:45
they think, for deep cultural reasons, that's boring --
87
285000
3000
om diep-culturele redenen vinden ze dat saai.
04:48
and they're much more interested in a different pattern -- head-tail-head.
88
288000
3000
Zij hebben meer belangstelling voor een ander patroon -- kop-munt-kop.
04:51
So, on this side, you get out your coins, and you toss and toss and toss.
89
291000
3000
Aan deze kant neem je je munten en je gooit en gooit en gooit.
04:54
And you count the number of times until the pattern head-tail-head appears
90
294000
3000
Je telt het aantal keren tot het patroon kop-munt-kop verschijnt
04:57
and you average them. OK?
91
297000
3000
en je maakt een gemiddelde. OK?
05:00
So on this side, you've got a number --
92
300000
2000
Aan deze kant heb je een getal --
05:02
you've done it lots of times, so you get it accurately --
93
302000
2000
je hebt het vaak gedaan, dus het is accuraat --
05:04
which is the average number of tosses until head-tail-tail.
94
304000
3000
het gemiddelde aantal beurten tot je kop-munt-munt krijgt.
05:07
On this side, you've got a number -- the average number of tosses until head-tail-head.
95
307000
4000
Aan deze kant heb je een getal -- het gemiddelde aantal beurten tot je kop-munt-kop krijgt.
05:11
So here's a deep mathematical fact --
96
311000
2000
Hier is een diep wiskundig feit --
05:13
if you've got two numbers, one of three things must be true.
97
313000
3000
als je twee getallen hebt, moet één van deze drie dingen kloppen.
05:16
Either they're the same, or this one's bigger than this one,
98
316000
3000
Ofwel zijn ze gelijk, ofwel is dit getal groter dan dat,
05:19
or this one's bigger than that one.
99
319000
1000
ofwel is dat getal groter dan dit.
05:20
So what's going on here?
100
320000
3000
Wat gebeurt er hier?
05:23
So you've all got to think about this, and you've all got to vote --
101
323000
2000
Denk hier allemaal over na. Iedereen moet stemmen.
05:25
and we're not moving on.
102
325000
1000
We gaan niet verder --
05:26
And I don't want to end up in the two-minute silence
103
326000
2000
en ik doe niet aan twee minuten stilte
05:28
to give you more time to think about it, until everyone's expressed a view. OK.
104
328000
4000
om jullie bedenktijd te geven -- tot iedereen een standpunt heeft ingenomen.
05:32
So what you want to do is compare the average number of tosses until we first see
105
332000
4000
Dus vergelijk nu het gemiddeld aantal beurten tot we kop-munt-kop zien,
05:36
head-tail-head with the average number of tosses until we first see head-tail-tail.
106
336000
4000
met het gemiddeld aantal beurten tot we kop-munt-munt zien.
05:41
Who thinks that A is true --
107
341000
2000
Wie denkt dat A juist is --
05:43
that, on average, it'll take longer to see head-tail-head than head-tail-tail?
108
343000
4000
dat het gemiddeld langer duurt om kop-munt-kop te zien dan kop-munt-munt?
05:47
Who thinks that B is true -- that on average, they're the same?
109
347000
3000
Wie denkt dat B juist is -- dat ze gemiddeld gelijk zijn?
05:51
Who thinks that C is true -- that, on average, it'll take less time
110
351000
2000
Wie denkt dat C juist is -- dat het gemiddeld minder lang duurt
05:53
to see head-tail-head than head-tail-tail?
111
353000
3000
om kop-munt-kop te zien dan kop-munt-munt?
05:57
OK, who hasn't voted yet? Because that's really naughty -- I said you had to.
112
357000
3000
Wie heeft nog niet gestemd? Dat is echt stout -- ik had gezegd dat je moest.
06:00
(Laughter)
113
360000
1000
(Gelach)
06:02
OK. So most people think B is true.
114
362000
3000
OK. De meeste mensen denken dat het B is.
06:05
And you might be relieved to know even rather distinguished mathematicians think that.
115
365000
3000
Het zal jullie opluchten dat zelfs gerespecteerde wiskundigen dat denken.
06:08
It's not. A is true here.
116
368000
4000
Het is niet zo. A is juist.
06:12
It takes longer, on average.
117
372000
2000
Het duurt gemiddeld langer.
06:14
In fact, the average number of tosses till head-tail-head is 10
118
374000
2000
Het gemiddelde aantal beurten tot kop-munt-kop is 10,
06:16
and the average number of tosses until head-tail-tail is eight.
119
376000
5000
en het gemiddeld aantal beurten tot kop-munt-munt is 8.
06:21
How could that be?
120
381000
2000
Hoe kan dat?
06:24
Anything different about the two patterns?
121
384000
3000
Is er een verschil tussen de twee patronen?
06:30
There is. Head-tail-head overlaps itself.
122
390000
5000
Jazeker. Kop-munt-kop overlapt met zichzelf.
06:35
If you went head-tail-head-tail-head, you can cunningly get two occurrences
123
395000
4000
Bij kop-munt-kop-munt-kop, heb je heel slim twee keer
06:39
of the pattern in only five tosses.
124
399000
3000
het patroon in maar 5 beurten.
06:42
You can't do that with head-tail-tail.
125
402000
2000
Dat kan je niet doen met kop-munt-munt.
06:44
That turns out to be important.
126
404000
2000
Dat blijkt belangrijk te zijn.
06:46
There are two ways of thinking about this.
127
406000
2000
Je kan dit op twee manieren bekijken.
06:48
I'll give you one of them.
128
408000
2000
Ik geef je er één.
06:50
So imagine -- let's suppose we're doing it.
129
410000
2000
Beeld je in -- beeld je in dat je het doet.
06:52
On this side -- remember, you're excited about head-tail-tail;
130
412000
2000
Aan deze kant -- herinner je, jullie vinden kop-munt-munt spannend,
06:54
you're excited about head-tail-head.
131
414000
2000
jullie vinden kop-munt-kop spannend.
06:56
We start tossing a coin, and we get a head --
132
416000
3000
We gooien en krijgen kop.
06:59
and you start sitting on the edge of your seat
133
419000
1000
Je gaat op het puntje van je stoel zitten
07:00
because something great and wonderful, or awesome, might be about to happen.
134
420000
5000
omdat iets groots en fantastisch misschien wel op til is.
07:05
The next toss is a tail -- you get really excited.
135
425000
2000
De volgende keer is munt -- het wordt echt spannend.
07:07
The champagne's on ice just next to you; you've got the glasses chilled to celebrate.
136
427000
4000
De champagne staat klaar, je hebt de glazen gekoeld om te vieren.
07:11
You're waiting with bated breath for the final toss.
137
431000
2000
Je wacht met ingehouden adem op de laatste gooi.
07:13
And if it comes down a head, that's great.
138
433000
2000
Als dat kop is, is dat fantastisch.
07:15
You're done, and you celebrate.
139
435000
2000
Je bent klaar, en je viert.
07:17
If it's a tail -- well, rather disappointedly, you put the glasses away
140
437000
2000
Als het munt is, zet je teleurgesteld de glazen weg
07:19
and put the champagne back.
141
439000
2000
en de champagne.
07:21
And you keep tossing, to wait for the next head, to get excited.
142
441000
3000
Je blijft opgooien, je wacht op de volgende kop, en op de spanning.
07:25
On this side, there's a different experience.
143
445000
2000
Aan deze kant is de ervaring anders.
07:27
It's the same for the first two parts of the sequence.
144
447000
3000
Ze loopt gelijk voor de eerste twee delen.
07:30
You're a little bit excited with the first head --
145
450000
2000
Je bent opgewonden bij de eerste kop --
07:32
you get rather more excited with the next tail.
146
452000
2000
de spanning stijgt met de volgende munt.
07:34
Then you toss the coin.
147
454000
2000
Dan gooi je op.
07:36
If it's a tail, you crack open the champagne.
148
456000
3000
Als het munt is, kraak je de fles champagne.
07:39
If it's a head you're disappointed,
149
459000
2000
Als het kop is ben je teleurgesteld,
07:41
but you're still a third of the way to your pattern again.
150
461000
3000
maar je bent nog steeds een derde verwijderd van je patroon.
07:44
And that's an informal way of presenting it -- that's why there's a difference.
151
464000
4000
Dit is een informele voorstellingswijze. Daarom is er een verschil.
07:48
Another way of thinking about it --
152
468000
2000
Een andere manier om ernaar te kijken --
07:50
if we tossed a coin eight million times,
153
470000
2000
als we 8 miljoen keren zouden opgooien,
07:52
then we'd expect a million head-tail-heads
154
472000
2000
zouden we een miljoen keren kop-munt-kop verwachten
07:54
and a million head-tail-tails -- but the head-tail-heads could occur in clumps.
155
474000
7000
en een miljoen keren kop-munt-munt. Maar kop-munt-kop kan in clusters voorkomen.
08:01
So if you want to put a million things down amongst eight million positions
156
481000
2000
Als je een miljoen dingen wil spreiden over acht miljoen posities
08:03
and you can have some of them overlapping, the clumps will be further apart.
157
483000
5000
en sommige kunnen overlappen, dan zullen de clusters verder uiteen liggen.
08:08
It's another way of getting the intuition.
158
488000
2000
Dat is een andere manier om de intuïtie te snappen;
08:10
What's the point I want to make?
159
490000
2000
Wat is mijn punt?
08:12
It's a very, very simple example, an easily stated question in probability,
160
492000
4000
Het is een heel eenvoudig voorbeeld, een gemakkelijk geformuleerde vraag in kansrekening,
08:16
which every -- you're in good company -- everybody gets wrong.
161
496000
3000
die iedereen -- je bent in goed gezelschap -- fout heeft.
08:19
This is my little diversion into my real passion, which is genetics.
162
499000
4000
Nu volgt een kleine omweg naar mijn echte passie, genetica.
08:23
There's a connection between head-tail-heads and head-tail-tails in genetics,
163
503000
3000
Er is een verband tussen kop-munt-kop en kop-munt-munt in genetica,
08:26
and it's the following.
164
506000
3000
namelijk het volgende.
08:29
When you toss a coin, you get a sequence of heads and tails.
165
509000
3000
Als je een munt opgooit, krijg je een sequentie van kop en munt.
08:32
When you look at DNA, there's a sequence of not two things -- heads and tails --
166
512000
3000
Bij DNA is er een sequentie, niet van twee dingen (kop en munt),
08:35
but four letters -- As, Gs, Cs and Ts.
167
515000
3000
maar van vier letters: A, G, C en T.
08:38
And there are little chemical scissors, called restriction enzymes
168
518000
3000
Er bestaan kleine chemische schaartjes, restrictie-enzymen genaamd.
08:41
which cut DNA whenever they see particular patterns.
169
521000
2000
Die knippen DNA telkens als ze een bepaald patroon zien.
08:43
And they're an enormously useful tool in modern molecular biology.
170
523000
4000
Het is een uiterst succesvol gereedschap in de moderne moleculaire biologie.
08:48
And instead of asking the question, "How long until I see a head-tail-head?" --
171
528000
3000
In plaats van te vragen: "Hoe lang nog voor ik kop-munt-kop krijg?"
08:51
you can ask, "How big will the chunks be when I use a restriction enzyme
172
531000
3000
kan je vragen: "Hoe groot zullen de stukken zijn, als ik een restrictie-enzyme gebruik
08:54
which cuts whenever it sees G-A-A-G, for example?
173
534000
4000
dat knipt telkens als het G-A-A-G ziet, bijvoorbeeld?
08:58
How long will those chunks be?"
174
538000
2000
Hoe lang zullen deze stukken zijn?"
09:00
That's a rather trivial connection between probability and genetics.
175
540000
5000
Dat is een eerder triviaal verband tussen kansberekening en genetica.
09:05
There's a much deeper connection, which I don't have time to go into
176
545000
3000
Er is ook een dieper verband. Ik heb geen tijd om erop in te gaan,
09:08
and that is that modern genetics is a really exciting area of science.
177
548000
3000
maar moderne genetica is een echt spannend wetenschappelijk domein.
09:11
And we'll hear some talks later in the conference specifically about that.
178
551000
4000
We horen hier later in deze conferentie specifieke talks over.
09:15
But it turns out that unlocking the secrets in the information generated by modern
179
555000
4000
Het blijkt dat als je de geheimen ontsluit uit de informatie opgeleverd
09:19
experimental technologies, a key part of that has to do with fairly sophisticated --
180
559000
5000
door moderne experimentele technologie, er een sleutelrol is weggelegd voor gecompliceerde --
09:24
you'll be relieved to know that I do something useful in my day job,
181
564000
3000
je zult opgelucht zijn dat ik ook nuttige dingen doe in mijn dagelijks werk,
09:27
rather more sophisticated than the head-tail-head story --
182
567000
2000
veel gecompliceerder dan het verhaal van kop-munt-kop --
09:29
but quite sophisticated computer modelings and mathematical modelings
183
569000
4000
dus echt gecompliceerde computermodellen en wiskundige modellen,
09:33
and modern statistical techniques.
184
573000
2000
en moderne statistische technieken.
09:35
And I will give you two little snippets -- two examples --
185
575000
3000
Ik geef je twee snippers -- twee voorbeelden --
09:38
of projects we're involved in in my group in Oxford,
186
578000
3000
van projecten waar mijn groep in Oxford aan meewerkte.
09:41
both of which I think are rather exciting.
187
581000
2000
Beide volgens mij erg spannend.
09:43
You know about the Human Genome Project.
188
583000
2000
Je kent het Menselijk Genoomproject.
09:45
That was a project which aimed to read one copy of the human genome.
189
585000
4000
Dat project had tot doel één kopie van het menselijke genoom te lezen.
09:51
The natural thing to do after you've done that --
190
591000
2000
De natuurlijke volgende stap is --
09:53
and that's what this project, the International HapMap Project,
191
593000
2000
daarover gaat dit project, het International HapMap Project,
09:55
which is a collaboration between labs in five or six different countries.
192
595000
5000
een samenwerking tussen laboratoria in 5 of 6 verschillende landen.
10:00
Think of the Human Genome Project as learning what we've got in common,
193
600000
4000
Als het Menselijk Genoomproject gaat over begrijpen wat we gemeen hebben,
10:04
and the HapMap Project is trying to understand
194
604000
2000
dan gaat het HapMap Project over begrijpen
10:06
where there are differences between different people.
195
606000
2000
waar de verschillen tussen verschillende mensen zitten.
10:08
Why do we care about that?
196
608000
2000
Waarom vinden we dat belangrijk?
10:10
Well, there are lots of reasons.
197
610000
2000
Om velerlei redenen.
10:12
The most pressing one is that we want to understand how some differences
198
612000
4000
De dringendste is dat we willen begrijpen hoe bepaalde verschillen
10:16
make some people susceptible to one disease -- type-2 diabetes, for example --
199
616000
4000
sommige mensen vatbaar maken voor een ziekte -- bijvoorbeeld diabetes type 2 --
10:20
and other differences make people more susceptible to heart disease,
200
620000
5000
en andere verschillen mensen vatbaar maken voor hartziekten,
10:25
or stroke, or autism and so on.
201
625000
2000
of beroertes, autisme enzovoort.
10:27
That's one big project.
202
627000
2000
Dat is één groot project.
10:29
There's a second big project,
203
629000
2000
Er is een tweede groot project
10:31
recently funded by the Wellcome Trust in this country,
204
631000
2000
dat recent werd gefinancierd door de Wellcome Trust in dit land.
10:33
involving very large studies --
205
633000
2000
Het gaat om zeer omvangrijke studies --
10:35
thousands of individuals, with each of eight different diseases,
206
635000
3000
duizenden individuen, telkens 8 verschillende ziektes,
10:38
common diseases like type-1 and type-2 diabetes, and coronary heart disease,
207
638000
4000
gangbare ziektes zoals diabetes type 1 en type 2, coronaire hartklachten,
10:42
bipolar disease and so on -- to try and understand the genetics.
208
642000
4000
bipolaire stoornissen enzovoort -- om de genetica te begrijpen.
10:46
To try and understand what it is about genetic differences that causes the diseases.
209
646000
3000
Om te begrijpen hoe genetische verschillen ziektes veroorzaken.
10:49
Why do we want to do that?
210
649000
2000
Waarom willen we dat doen?
10:51
Because we understand very little about most human diseases.
211
651000
3000
Omdat we heel weinig verstand hebben van de meeste menselijke ziektes.
10:54
We don't know what causes them.
212
654000
2000
We kennen hun oorzaak niet.
10:56
And if we can get in at the bottom and understand the genetics,
213
656000
2000
Als we onderaan kunnen beginnen en de genetica begrijpen,
10:58
we'll have a window on the way the disease works,
214
658000
3000
geeft dat ons een zicht op hoe de ziekte functioneert.
11:01
and a whole new way about thinking about disease therapies
215
661000
2000
En ook een heel nieuwe kijk op behandeling van ziektes,
11:03
and preventative treatment and so on.
216
663000
3000
preventieve behandeling enzovoort.
11:06
So that's, as I said, the little diversion on my main love.
217
666000
3000
Tot zover de kleine zijsprong over mijn grootste liefde.
11:09
Back to some of the more mundane issues of thinking about uncertainty.
218
669000
5000
Terug naar meer wereldlijke kwesties van onzekerheidsdenken.
11:14
Here's another quiz for you --
219
674000
2000
Ik heb nog een kwis voor jullie.
11:16
now suppose we've got a test for a disease
220
676000
2000
Beeld je in dat we een test hebben voor een ziekte
11:18
which isn't infallible, but it's pretty good.
221
678000
2000
die niet onfeilbaar is, maar wel vrij goed.
11:20
It gets it right 99 percent of the time.
222
680000
3000
Hij is in 99 procent van de gevallen correct.
11:23
And I take one of you, or I take someone off the street,
223
683000
3000
Ik neem hem af bij jou, of bij iemand die ik op straat ontmoet.
11:26
and I test them for the disease in question.
224
686000
2000
Ik test ze op de ziekte in kwestie.
11:28
Let's suppose there's a test for HIV -- the virus that causes AIDS --
225
688000
4000
Laten we zeggen dat het een hiv-test is -- het virus dat aids veroorzaakt.
11:32
and the test says the person has the disease.
226
692000
3000
Volgens de test heeft de persoon de ziekte.
11:35
What's the chance that they do?
227
695000
3000
Hoe groot is de kans dat dat zo is?
11:38
The test gets it right 99 percent of the time.
228
698000
2000
De test is in 99 procent van de gevallen correct.
11:40
So a natural answer is 99 percent.
229
700000
4000
Het natuurlijke antwoord is dus 99 procent.
11:44
Who likes that answer?
230
704000
2000
Wie ziet wel wat in dat antwoord?
11:46
Come on -- everyone's got to get involved.
231
706000
1000
Komaan -- iedereen moet meedoen.
11:47
Don't think you don't trust me anymore.
232
707000
2000
Niet denken dat je mij niet meer vertrouwt.
11:49
(Laughter)
233
709000
1000
(Gelach).
11:50
Well, you're right to be a bit skeptical, because that's not the answer.
234
710000
3000
Je doet er goed aan een beetje sceptisch te zijn, want dat is niet het antwoord.
11:53
That's what you might think.
235
713000
2000
Dat is wat je zou denken.
11:55
It's not the answer, and it's not because it's only part of the story.
236
715000
3000
Het is niet het antwoord, omdat het maar een deel van het verhaal is.
11:58
It actually depends on how common or how rare the disease is.
237
718000
3000
Het hangt af van hoe gangbaar of zeldzaam de ziekte is.
12:01
So let me try and illustrate that.
238
721000
2000
Ik zal proberen dat te illustreren.
12:03
Here's a little caricature of a million individuals.
239
723000
4000
Dit is een karikatuur van een miljoen individuen.
12:07
So let's think about a disease that affects --
240
727000
3000
Stel je voor dat je een ziekte hebt die --
12:10
it's pretty rare, it affects one person in 10,000.
241
730000
2000
een zeldzame ziekte, die één persoon op 10.000 treft.
12:12
Amongst these million individuals, most of them are healthy
242
732000
3000
Van dit miljoen mensen zijn de meesten gezond,
12:15
and some of them will have the disease.
243
735000
2000
en zullen sommigen de ziekte hebben.
12:17
And in fact, if this is the prevalence of the disease,
244
737000
3000
Als de ziekte zo vaak voorkomt,
12:20
about 100 will have the disease and the rest won't.
245
740000
3000
zullen er ongeveer 100 de ziekte hebben en de rest niet.
12:23
So now suppose we test them all.
246
743000
2000
Veronderstel dat we ze allemaal testen.
12:25
What happens?
247
745000
2000
Wat dan?
12:27
Well, amongst the 100 who do have the disease,
248
747000
2000
Van de 100 die de ziekte hebben,
12:29
the test will get it right 99 percent of the time, and 99 will test positive.
249
749000
5000
zal de test dat in 99 procent van de gevallen aangeven: 99 mensen zullen positief testen;
12:34
Amongst all these other people who don't have the disease,
250
754000
2000
Van alle andere mensen die de ziekte niet hebben,
12:36
the test will get it right 99 percent of the time.
251
756000
3000
zal de test dat in 99 procent van de gevallen aangeven.
12:39
It'll only get it wrong one percent of the time.
252
759000
2000
Hij zal maar in één procent van de gevallen fout zijn.
12:41
But there are so many of them that there'll be an enormous number of false positives.
253
761000
4000
Maar omdat ze met zovelen zijn, zal er een enorm aantal vals positieve tests zijn.
12:45
Put that another way --
254
765000
2000
Anders gezegd --
12:47
of all of them who test positive -- so here they are, the individuals involved --
255
767000
5000
van al diegenen die positief testen -- hier zijn ze, de betrokken individuen --
12:52
less than one in 100 actually have the disease.
256
772000
5000
heeft er minder dan één op honderd de ziekte.
12:57
So even though we think the test is accurate, the important part of the story is
257
777000
4000
Zelfs al denken we dat de test accuraat is, dan nog is het belangrijk te weten
13:01
there's another bit of information we need.
258
781000
3000
dat we nog een ander stukje informatie nodig hebben.
13:04
Here's the key intuition.
259
784000
2000
Hier is de basisintuïtie.
13:07
What we have to do, once we know the test is positive,
260
787000
3000
Wat we moeten doen, als we weten dat de test positief is,
13:10
is to weigh up the plausibility, or the likelihood, of two competing explanations.
261
790000
6000
is de geloofwaardigheid, of de waarschijnlijkheid, van twee concurrerende verklaringen afwegen.
13:16
Each of those explanations has a likely bit and an unlikely bit.
262
796000
3000
Elk van deze verklaringen heeft een onwaarschijnlijk en een onwaarschijnlijk deel.
13:19
One explanation is that the person doesn't have the disease --
263
799000
3000
De ene verklaring is dat de persoon de ziekte niet heeft --
13:22
that's overwhelmingly likely, if you pick someone at random --
264
802000
3000
dat is uitermate waarschijnlijk, als je op goed geluk iemand uitkiest --
13:25
but the test gets it wrong, which is unlikely.
265
805000
3000
en dat de test dat fout heeft, wat onwaarschijnlijk is.
13:29
The other explanation is that the person does have the disease -- that's unlikely --
266
809000
3000
De andere verklaring is dat de persoon de ziekte heeft -- dat is onwaarschijnlijk --
13:32
but the test gets it right, which is likely.
267
812000
3000
maar dat de test het goed heeft, wat waarschijnlijk is.
13:35
And the number we end up with --
268
815000
2000
Het getal waarop we uitkomen --
13:37
that number which is a little bit less than one in 100 --
269
817000
3000
dat getal dat een fractie lager is dan één op honderd --
13:40
is to do with how likely one of those explanations is relative to the other.
270
820000
6000
heeft te maken met hoe waarschijnlijk één van die verklaringen is in vergelijking met de andere.
13:46
Each of them taken together is unlikely.
271
826000
2000
Elk van hen is, samen genomen, onwaarschijnlijk.
13:49
Here's a more topical example of exactly the same thing.
272
829000
3000
Hier is een actueler voorbeeld van precies hetzelfde.
13:52
Those of you in Britain will know about what's become rather a celebrated case
273
832000
4000
De Britten onder jullie kennen allicht de beroemd geworden zaak
13:56
of a woman called Sally Clark, who had two babies who died suddenly.
274
836000
5000
van een vrouw genaamd Sally Clark. Ze had twee baby's die plots stierven.
14:01
And initially, it was thought that they died of what's known informally as "cot death,"
275
841000
4000
Oorspronkelijk dacht men dat ze gestorven waren aan wat we in spreektaal "wiegendood" noemen,
14:05
and more formally as "Sudden Infant Death Syndrome."
276
845000
3000
en in vaktaal "syndroom van het plotseling overlijden van een zuigeling".
14:08
For various reasons, she was later charged with murder.
277
848000
2000
Om allerlei redenen werd ze later van moord beschuldigd.
14:10
And at the trial, her trial, a very distinguished pediatrician gave evidence
278
850000
4000
Op haar proces getuigde een zeer gerespecteerd kinderarts
14:14
that the chance of two cot deaths, innocent deaths, in a family like hers --
279
854000
5000
dat de kans op twee gevallen van wiegendood, onschuldige overlijdens, in een gezin als het hare --
14:19
which was professional and non-smoking -- was one in 73 million.
280
859000
6000
professioneel, niet-rokers -- één op 73 miljoen was.
14:26
To cut a long story short, she was convicted at the time.
281
866000
3000
Om kort te gaan, ze werd toentertijd veroordeeld.
14:29
Later, and fairly recently, acquitted on appeal -- in fact, on the second appeal.
282
869000
5000
Later, recentelijk, werd ze in beroep vrijgesproken -- eigenlijk in tweede beroep.
14:34
And just to set it in context, you can imagine how awful it is for someone
283
874000
4000
Om de context mee te geven: je kan je voorstellen hoe vreselijk het is voor iemand
14:38
to have lost one child, and then two, if they're innocent,
284
878000
3000
om één kind verloren te hebben, en dan twee, en dan onschuldig
14:41
to be convicted of murdering them.
285
881000
2000
veroordeeld te worden voor twee moorden.
14:43
To be put through the stress of the trial, convicted of murdering them --
286
883000
2000
Je gaat door de stress van het proces, wordt veroordeeld voor de moorden
14:45
and to spend time in a women's prison, where all the other prisoners
287
885000
3000
en zit in een vrouwengevangenis, waar alle andere gevangenen denken
14:48
think you killed your children -- is a really awful thing to happen to someone.
288
888000
5000
dat je je kinderen hebt vermoord. Dat is een vreselijke beproeving.
14:53
And it happened in large part here because the expert got the statistics
289
893000
5000
Het gebeurde grotendeels omdat de expert de statistieken
14:58
horribly wrong, in two different ways.
290
898000
3000
helemaal fout bekeek, in twee opzichten.
15:01
So where did he get the one in 73 million number?
291
901000
4000
Waar haalde hij het cijfer van één op 73 miljoen?
15:05
He looked at some research, which said the chance of one cot death in a family
292
905000
3000
Hij bekeek wat research, die zei dat de kans op één wiegendood in een familie
15:08
like Sally Clark's is about one in 8,500.
293
908000
5000
als die van Sally Clark ongeveer één op 8.500 is.
15:13
So he said, "I'll assume that if you have one cot death in a family,
294
913000
4000
Dus zei hij: "Ik ga ervan uit dat als je één wiegendood in de familie hebt,
15:17
the chance of a second child dying from cot death aren't changed."
295
917000
4000
de kans onveranderd is dat een tweede kind aan wiegendood sterft."
15:21
So that's what statisticians would call an assumption of independence.
296
921000
3000
Dat is wat statistici een assumptie van onafhankelijkheid noemen.
15:24
It's like saying, "If you toss a coin and get a head the first time,
297
924000
2000
Alsof je zegt: "Als je een munt opgooit en de eerste keer kop hebt,
15:26
that won't affect the chance of getting a head the second time."
298
926000
3000
wijzigt dat je kans niet op een tweede keer kop."
15:29
So if you toss a coin twice, the chance of getting a head twice are a half --
299
929000
5000
Als je twee keer opgooit, is je kans om kop te krijgen 0,5 --
15:34
that's the chance the first time -- times a half -- the chance a second time.
300
934000
3000
dat is je kans de eerste keer -- maal 0,5 -- dat is je kans de tweede keer.
15:37
So he said, "Here,
301
937000
2000
Hij zegt dus: "Laten we veronderstellen --
15:39
I'll assume that these events are independent.
302
939000
4000
ik veronderstel dat deze gebeurtenissen onafhankelijk zijn.
15:43
When you multiply 8,500 together twice,
303
943000
2000
Als je 8.500 maal zichzelf doet,
15:45
you get about 73 million."
304
945000
2000
krijg je ongeveer 73 miljoen."
15:47
And none of this was stated to the court as an assumption
305
947000
2000
Dit werd niet zo voor het hof gesteld,
15:49
or presented to the jury that way.
306
949000
2000
en ook niet zo aan de jury voorgesteld.
15:52
Unfortunately here -- and, really, regrettably --
307
952000
3000
Jammer genoeg -- echt betreurenswaardig --
15:55
first of all, in a situation like this you'd have to verify it empirically.
308
955000
4000
moet je dit ten eerste in zo'n situatie empirisch verifiëren.
15:59
And secondly, it's palpably false.
309
959000
2000
Ten tweede is het manifest fout.
16:02
There are lots and lots of things that we don't know about sudden infant deaths.
310
962000
5000
Er zijn heel veel dingen die we niet weten over wiegendood.
16:07
It might well be that there are environmental factors that we're not aware of,
311
967000
3000
Misschien zijn er omgevingsfactoren waar we ons niet van bewust zijn.
16:10
and it's pretty likely to be the case that there are
312
970000
2000
Het is tamelijk waarschijnlijk dat er
16:12
genetic factors we're not aware of.
313
972000
2000
genetische factoren zijn die we niet kennen.
16:14
So if a family suffers from one cot death, you'd put them in a high-risk group.
314
974000
3000
Dus als een familie één wiegendood kent, zou je ze in een groep met verhoogd risico stoppen.
16:17
They've probably got these environmental risk factors
315
977000
2000
Waarschijnlijk hebben zij deze omgevingsrisicofactoren
16:19
and/or genetic risk factors we don't know about.
316
979000
3000
en/of genetische factoren die we niet kennen.
16:22
And to argue, then, that the chance of a second death is as if you didn't know
317
982000
3000
Dan betogen dat de kans op een tweede dood niet afhangt van je
16:25
that information is really silly.
318
985000
3000
kennis van die informatie, is echt dwaas.
16:28
It's worse than silly -- it's really bad science.
319
988000
4000
Het is erger dan dwaas -- het is echt belabberde wetenschap.
16:32
Nonetheless, that's how it was presented, and at trial nobody even argued it.
320
992000
5000
Niettemin was dat hoe het werd voorgesteld. Op het proces viel niemand erover.
16:37
That's the first problem.
321
997000
2000
Dat is het eerste probleem.
16:39
The second problem is, what does the number of one in 73 million mean?
322
999000
4000
Het tweede probeem is: wat betekent het cijfer van één op 73 miljoen?
16:43
So after Sally Clark was convicted --
323
1003000
2000
Nadat Sally Clark was veroordeeld --
16:45
you can imagine, it made rather a splash in the press --
324
1005000
4000
je kan je voorstellen dat dit nogal ophef maakte in de pers --
16:49
one of the journalists from one of Britain's more reputable newspapers wrote that
325
1009000
7000
schreef één van de journalisten van één van de betere Britse kranten
16:56
what the expert had said was,
326
1016000
2000
dat de expert had gezegd:
16:58
"The chance that she was innocent was one in 73 million."
327
1018000
5000
"De kans dat ze onschuldig is, is één op 73 miljoen."
17:03
Now, that's a logical error.
328
1023000
2000
Dat is een denkfout.
17:05
It's exactly the same logical error as the logical error of thinking that
329
1025000
3000
Het is dezelfde denkfout als de aanname dat je
17:08
after the disease test, which is 99 percent accurate,
330
1028000
2000
op basis van de 99 procent accurate ziektetest,
17:10
the chance of having the disease is 99 percent.
331
1030000
4000
99 procent kans hebt om de ziekte te hebben.
17:14
In the disease example, we had to bear in mind two things,
332
1034000
4000
In het ziektevoorbeeld moesten we twee dingen voor ogen houden,
17:18
one of which was the possibility that the test got it right or not.
333
1038000
4000
waaronder de mogelijkheid dat de test het al dan niet goed had.
17:22
And the other one was the chance, a priori, that the person had the disease or not.
334
1042000
4000
Het andere was de kans, a priori, dat de persoon al dan niet de ziekte had.
17:26
It's exactly the same in this context.
335
1046000
3000
Het is precies hetzelfde in deze context.
17:29
There are two things involved -- two parts to the explanation.
336
1049000
4000
Er spelen twee dingen -- twee delen van de verklaring.
17:33
We want to know how likely, or relatively how likely, two different explanations are.
337
1053000
4000
We willen weten hoe waarschijnlijk, hoe relatief waarschijnlijk, twee verschillende verklaringen zijn.
17:37
One of them is that Sally Clark was innocent --
338
1057000
3000
De eerste is dat Sally Clarke onschuldig is,
17:40
which is, a priori, overwhelmingly likely --
339
1060000
2000
wat a priori uitermate waarschijnlijk is --
17:42
most mothers don't kill their children.
340
1062000
3000
de meeste moeders vermoorden hun kinderen niet.
17:45
And the second part of the explanation
341
1065000
2000
Het tweede deel van de verklaring is
17:47
is that she suffered an incredibly unlikely event.
342
1067000
3000
dat ze slachtoffer was van een zeer onwaarschijnlijke gebeurtenis.
17:50
Not as unlikely as one in 73 million, but nonetheless rather unlikely.
343
1070000
4000
Niet zo onwaarschijnlijk als één op 73 miljoen, maar niettemin erg onwaarschijnlijk.
17:54
The other explanation is that she was guilty.
344
1074000
2000
De tweede verklaring is dat ze schuldig was.
17:56
Now, we probably think a priori that's unlikely.
345
1076000
2000
Dat zullen we a priori als onwaarschijnlijk beschouwen.
17:58
And we certainly should think in the context of a criminal trial
346
1078000
3000
In de context van een strafzaak moeten we dat zeker
18:01
that that's unlikely, because of the presumption of innocence.
347
1081000
3000
als onwaarschijnlijk beschouwen, vanwege het vermoeden van onschuld.
18:04
And then if she were trying to kill the children, she succeeded.
348
1084000
4000
Als ze zou proberen haar kinderen te doden, zou ze erin geslaagd zijn.
18:08
So the chance that she's innocent isn't one in 73 million.
349
1088000
4000
De kans dat ze onschuldig is, is niet één op 73 miljoen.
18:12
We don't know what it is.
350
1092000
2000
We kennen die kans niet.
18:14
It has to do with weighing up the strength of the other evidence against her
351
1094000
4000
Ze heeft te maken met het afwegen van de sterkte van de andere bewijzen tegen haar
18:18
and the statistical evidence.
352
1098000
2000
versus het statistische bewijs.
18:20
We know the children died.
353
1100000
2000
We weten dat de kinderen zijn gestorven.
18:22
What matters is how likely or unlikely, relative to each other,
354
1102000
4000
Van belang is hoe waarschijnlijk of onwaarschijnlijk
18:26
the two explanations are.
355
1106000
2000
de twee verklaringen zijn, relatief ten opzichte van elkaar.
18:28
And they're both implausible.
356
1108000
2000
Ze zijn allebei onwaarschijnlijk.
18:31
There's a situation where errors in statistics had really profound
357
1111000
4000
Dit is een situatie waarin statistische fouten diepgaande
18:35
and really unfortunate consequences.
358
1115000
3000
en echt ellendige gevolgen hadden.
18:38
In fact, there are two other women who were convicted on the basis of the
359
1118000
2000
Er zijn zelfs twee andere vrouwen die werden veroordeeld op basis van
18:40
evidence of this pediatrician, who have subsequently been released on appeal.
360
1120000
4000
het getuigenis van deze kinderarts. Ze zijn intussen vrijgelaten na beroep.
18:44
Many cases were reviewed.
361
1124000
2000
Vele zaken werden hervormd.
18:46
And it's particularly topical because he's currently facing a disrepute charge
362
1126000
4000
Het is bijzonder actueel omdat momenteel een tuchtzaak tegen hem loopt
18:50
at Britain's General Medical Council.
363
1130000
3000
voor de Britse Hoge Medische Raad.
18:53
So just to conclude -- what are the take-home messages from this?
364
1133000
4000
Tot slot -- wat leren we hieruit?
18:57
Well, we know that randomness and uncertainty and chance
365
1137000
4000
We weten dat toeval, onzekerheid en kans
19:01
are very much a part of our everyday life.
366
1141000
3000
een belangrijk deel van ons leven van elke dag zijn.
19:04
It's also true -- and, although, you, as a collective, are very special in many ways,
367
1144000
5000
Het is ook zo -- hoewel jullie als groep op vele manieren bijzonder zijn,
19:09
you're completely typical in not getting the examples I gave right.
368
1149000
4000
hebben jullie net als iedereen mijn voorbeelden fout opgelost.
19:13
It's very well documented that people get things wrong.
369
1153000
3000
We hebben veel bewijzen dat mensen dit verkeerd zien.
19:16
They make errors of logic in reasoning with uncertainty.
370
1156000
3000
Ze maken denkfouten als ze redeneren op basis van kansberekening.
19:20
We can cope with the subtleties of language brilliantly --
371
1160000
2000
We kunnen briljant omgaan met de subtiliteiten van de taal.
19:22
and there are interesting evolutionary questions about how we got here.
372
1162000
3000
Er zijn interessante evolutievraagstukken over hoe we zover kwamen.
19:25
We are not good at reasoning with uncertainty.
373
1165000
3000
We zijn niet goed in redeneren op basis van kansberekening.
19:28
That's an issue in our everyday lives.
374
1168000
2000
Dat is een probleem in ons dagelijks leven.
19:30
As you've heard from many of the talks, statistics underpins an enormous amount
375
1170000
3000
Zoals je in vele talks hebt gehoord, vormen statistieken de basis van een enorme hoop
19:33
of research in science -- in social science, in medicine
376
1173000
3000
onderzoek in dit verband -- in de sociale wetenschappen, de geneeskunde
19:36
and indeed, quite a lot of industry.
377
1176000
2000
en zeker ook in vele bedrijfstakken.
19:38
All of quality control, which has had a major impact on industrial processing,
378
1178000
4000
Kwaliteitscontrole, die een grote impact heeft op industriële verwerking,
19:42
is underpinned by statistics.
379
1182000
2000
is vaak op statistieken gestoeld.
19:44
It's something we're bad at doing.
380
1184000
2000
We zijn er niet goed in.
19:46
At the very least, we should recognize that, and we tend not to.
381
1186000
3000
We zouden dat minstens moeten erkennen, maar dat doen we niet.
19:49
To go back to the legal context, at the Sally Clark trial
382
1189000
4000
Terug naar de juridische context: op het proces van Sally Clark
19:53
all of the lawyers just accepted what the expert said.
383
1193000
4000
aanvaardden alle advocaten gewoon wat de expert zei
19:57
So if a pediatrician had come out and said to a jury,
384
1197000
2000
Stel dat een kinderarts de jury had verteld:
19:59
"I know how to build bridges. I've built one down the road.
385
1199000
3000
"Ik kan bruggen bouwen. Ik heb er verder in de straat eentje gebouwd.
20:02
Please drive your car home over it,"
386
1202000
2000
Ik nodig u uit om erover naar huis te rijden."
20:04
they would have said, "Well, pediatricians don't know how to build bridges.
387
1204000
2000
Dan zouden ze gezegd hebben: "Kinderartsen kennen niets van bruggen bouwen.
20:06
That's what engineers do."
388
1206000
2000
Daar hebben we ingenieurs voor."
20:08
On the other hand, he came out and effectively said, or implied,
389
1208000
3000
Anderzijds kwam hij inderdaad vertellen, of liet hij verstaan:
20:11
"I know how to reason with uncertainty. I know how to do statistics."
390
1211000
3000
"Ik weet hoe ik op basis van onzekerheid moet redeneren. Ik ken iets van statistiek."
20:14
And everyone said, "Well, that's fine. He's an expert."
391
1214000
3000
En iedereen zei: "Dat is goed. Hij is expert."
20:17
So we need to understand where our competence is and isn't.
392
1217000
3000
We moeten begrijpen waar de grens van onze competentie ligt.
20:20
Exactly the same kinds of issues arose in the early days of DNA profiling,
393
1220000
4000
We hadden exact dezelfde soort problemen in de begindagen van de DNA-profilering,
20:24
when scientists, and lawyers and in some cases judges,
394
1224000
4000
toen wetenschappers, advocaten en soms rechters
20:28
routinely misrepresented evidence.
395
1228000
3000
aan de lopende band het bewijsmateriaal fout voorstelden.
20:32
Usually -- one hopes -- innocently, but misrepresented evidence.
396
1232000
3000
Meestal -- dat hopen we -- gebeurde dat onbewust, maar ze stelden het fout voor.
20:35
Forensic scientists said, "The chance that this guy's innocent is one in three million."
397
1235000
5000
Gerechtsexperts zeiden: "De kans dat deze kerel onschuldig is, is één op drie miljoen."
20:40
Even if you believe the number, just like the 73 million to one,
398
1240000
2000
Zelfs al geloofde je het getal, zoals bij de 73 miljoen tegen één
20:42
that's not what it meant.
399
1242000
2000
is dat niet wat het betekende.
20:44
And there have been celebrated appeal cases
400
1244000
2000
Er zijn beroemde gevallen van beroep
20:46
in Britain and elsewhere because of that.
401
1246000
2000
in Groot-Brittannië en elders, om die reden.
20:48
And just to finish in the context of the legal system.
402
1248000
3000
Laten we eindigen in de context van het juridische systeem.
20:51
It's all very well to say, "Let's do our best to present the evidence."
403
1251000
4000
Het is prima om te zeggen: "Laten we ons best doen om het bewijsmateriaal voor te stellen."
20:55
But more and more, in cases of DNA profiling -- this is another one --
404
1255000
3000
Maar het gebeurt steeds vaker, bij DNA-profilering (dit is er nog een)
20:58
we expect juries, who are ordinary people --
405
1258000
3000
dat we verwachten dat jury's, gewone mensen,
21:01
and it's documented they're very bad at this --
406
1261000
2000
van wie we weten dat ze hier erg slecht in zijn,
21:03
we expect juries to be able to cope with the sorts of reasoning that goes on.
407
1263000
4000
in staat zijn om dit soort redeneringen te bevatten.
21:07
In other spheres of life, if people argued -- well, except possibly for politics --
408
1267000
5000
In andere domeinen van het leven zouden we, als mensen -- wel, met uitzondering van de politiek --
21:12
but in other spheres of life, if people argued illogically,
409
1272000
2000
maar in andere domeinen zouden we, als mensen een onlogisch betoog hielden,
21:14
we'd say that's not a good thing.
410
1274000
2000
zeggen dat dat geen goede zaak is.
21:16
We sort of expect it of politicians and don't hope for much more.
411
1276000
4000
Van politici verwachten we het zowat, daar hebben we niet veel hoop.
21:20
In the case of uncertainty, we get it wrong all the time --
412
1280000
3000
Bij onzekerheid hebben we het voortdurend fout.
21:23
and at the very least, we should be aware of that,
413
1283000
2000
Daar zouden we ons tenminste bewust van moeten zijn.
21:25
and ideally, we might try and do something about it.
414
1285000
2000
Idealiter zouden we er iets aan doen.
21:27
Thanks very much.
415
1287000
1000
Hartelijk dank.
Over deze website

Deze site laat u kennismaken met YouTube-video's die nuttig zijn om Engels te leren. U ziet Engelse lessen gegeven door topdocenten uit de hele wereld. Dubbelklik op de Engelse ondertitels op elke videopagina om de video af te spelen. De ondertitels scrollen synchroon met het afspelen van de video. Heeft u opmerkingen of verzoeken, neem dan contact met ons op via dit contactformulier.

https://forms.gle/WvT1wiN1qDtmnspy7