The human insights missing from big data | Tricia Wang

247,414 views ・ 2017-08-02

TED


Vui lòng nhấp đúp vào phụ đề tiếng Anh bên dưới để phát video.

Translator: Thuy Nguyen Thanh Reviewer: Jessie Nguyễn
00:12
In ancient Greece,
0
12705
1545
Ở Hy Lạp cổ đại,
00:15
when anyone from slaves to soldiers, poets and politicians,
1
15256
3943
bất cứ ai từ nô lệ đến người lính, nhà thơ và chính khách,
00:19
needed to make a big decision on life's most important questions,
2
19223
4004
đều cần phải đưa ra một quyết định lớn cho các câu hỏi quan trọng trong đời,
00:23
like, "Should I get married?"
3
23251
1391
như, "Tôi có nên kết hôn?"
00:24
or "Should we embark on this voyage?"
4
24666
1857
hay "Ta có nên tham gia chuyến đi này?"
00:26
or "Should our army advance into this territory?"
5
26547
2928
hay "Quân ta có nên tiến vào vùng lãnh thổ này?"
00:29
they all consulted the oracle.
6
29499
2579
họ đều tham vấn nhà tiên tri.
00:32
So this is how it worked:
7
32840
1440
Và cách làm như sau:
00:34
you would bring her a question and you would get on your knees,
8
34304
3112
bạn đem đến cho bà ấy một câu hỏi và quỳ gối chờ,
00:37
and then she would go into this trance.
9
37440
1871
và rồi bà ấy sẽ chuyển sang nhập định.
00:39
It would take a couple of days,
10
39335
1549
Kéo dài trong vài ngày,
00:40
and then eventually she would come out of it,
11
40908
2163
và cuối cùng bà ấy sẽ bình thường trở lại,
00:43
giving you her predictions as your answer.
12
43095
2536
và cho bạn những tiên đoán cũng như là câu trả lời.
00:46
From the oracle bones of ancient China
13
46730
2566
Từ những mẫu xương nhà tiên tri của Trung quốc cổ đại
00:49
to ancient Greece to Mayan calendars,
14
49320
2345
đến Hy Lạp cổ đại đến lịch Maya,
00:51
people have craved for prophecy
15
51689
2296
con người khao khát những lời tiên tri
00:54
in order to find out what's going to happen next.
16
54009
3137
để biết được điều gì sẽ xãy ra tiếp theo.
00:58
And that's because we all want to make the right decision.
17
58336
3239
Và đó là bởi vì tất cả chúng ta đều muốn đưa ra quyết định đúng,
01:01
We don't want to miss something.
18
61599
1545
Ta không muốn bỏ lỡ điều gì.
01:03
The future is scary,
19
63712
1743
Tương lai thật đáng sợ,
01:05
so it's much nicer knowing that we can make a decision
20
65479
2717
và sẽ dễ chịu hơn khi biết ta có thể đưa ra một quyết định
01:08
with some assurance of the outcome.
21
68220
1982
mà có sự chắc chắn nhất định về kết quả.
01:10
Well, we have a new oracle,
22
70899
1611
Vâng, ta có một nhà tiên tri mới,
01:12
and it's name is big data,
23
72534
2145
có tên là dữ liệu lớn,
01:14
or we call it "Watson" or "deep learning" or "neural net."
24
74703
3939
ta có thể gọi nó là "Watson" hay "học máy" hay "mạng nơ rôn."
01:19
And these are the kinds of questions we ask of our oracle now,
25
79160
4012
Và đây là những loại câu hỏi mà giờ đây ta có thể hỏi nhà tiên tri của chúng ta,
01:23
like, "What's the most efficient way to ship these phones
26
83196
3922
như, "Cách nào hiệu quả nhất để chuyển những chiếc điện thoại
01:27
from China to Sweden?"
27
87142
1823
từ Trung Quốc đến Thụy Điển?"
01:28
Or, "What are the odds
28
88989
1800
Hay, "Con tôi sinh ra
01:30
of my child being born with a genetic disorder?"
29
90813
3363
có tỷ lệ bị rối loạn di truyền là bao nhiêu?"
01:34
Or, "What are the sales volume we can predict for this product?"
30
94772
3244
Hay, "Ta có thể dự đoán doanh số của sản phẩm này là bao nhiêu?"
01:39
I have a dog. Her name is Elle, and she hates the rain.
31
99928
4047
Tôi có một con chó. Tên nó là Elle, và nó rất ghét trời mưa.
01:43
And I have tried everything to untrain her.
32
103999
3306
Và tôi đã tìm mọi cách để giúp nó hết sợ.
01:47
But because I have failed at this,
33
107329
2771
Nhưng tôi đã thất bại,
01:50
I also have to consult an oracle, called Dark Sky,
34
110124
3286
nên tôi đã tham vấn một nhà tiên tri, được gọi là Dark Sky,
01:53
every time before we go on a walk,
35
113434
1635
trước mỗi lúc chúng tôi đi dạo bộ,
01:55
for very accurate weather predictions in the next 10 minutes.
36
115093
3577
để có được các dự báo thời tiết chính xác trong 10 phút tới.
02:01
She's so sweet.
37
121355
1303
Cô ấy thật ngọt ngào.
02:03
So because of all of this, our oracle is a $122 billion industry.
38
123647
5707
Bởi tất cả những điều đó, nhà tiên tri của ta là một ngành công nghiệp 122 tỷ đô.
02:09
Now, despite the size of this industry,
39
129826
3376
Giờ đây, bất chấp kích cỡ của ngành công nghiệp này,
02:13
the returns are surprisingly low.
40
133226
2456
kết quả mang lại vẫn thấp một cách ngạc nhiên.
02:16
Investing in big data is easy,
41
136162
2494
Đầu tư vào dữ liệu lớn rất dễ dàng,
02:18
but using it is hard.
42
138680
1933
nhưng sử dụng nó mới khó.
02:21
Over 73 percent of big data projects aren't even profitable,
43
141801
4040
Thậm chí, hơn 73 phần trăm các dự án dữ liệu lớn không đem lại lợi nhuận,
02:25
and I have executives coming up to me saying,
44
145865
2431
và nhiều vị giám đốc đến gặp tôi và nói rằng,
02:28
"We're experiencing the same thing.
45
148320
1789
"Chúng tôi đang gặp vấn đề giống nhau,
02:30
We invested in some big data system,
46
150133
1753
Đều đầu tư một hệ thống dữ liệu lớn,
02:31
and our employees aren't making better decisions.
47
151910
2968
và nhân viên vẫn không đưa ra được các quyết định tốt hơn.
02:34
And they're certainly not coming up with more breakthrough ideas."
48
154902
3162
Và chắc chắn là họ không đưa ra được các ý tưởng đột phá hơn."
02:38
So this is all really interesting to me,
49
158734
3184
Tất cả điều này thực sự thú vị với tôi,
02:41
because I'm a technology ethnographer.
50
161942
2010
vì tôi là nhà dân tộc học về công nghệ
02:44
I study and I advise companies
51
164450
2564
Tôi nghiên cứu và cố vấn cho các công ty
02:47
on the patterns of how people use technology,
52
167038
2483
về các mô hình sử dụng công nghệ,
02:49
and one of my interest areas is data.
53
169545
2678
và một trong các lĩnh vực mà tôi quan tâm là dữ liệu.
02:52
So why is having more data not helping us make better decisions,
54
172247
5193
Tại sao có thêm nhiều dữ liệu cũng không giúp ta đưa ra các quyết định tốt hơn,
02:57
especially for companies who have all these resources
55
177464
2783
đặc biệt đối với các công ty có đủ nguồn lực
03:00
to invest in these big data systems?
56
180271
1736
để đầu tư các hệ thống dữ liệu lớn?
03:02
Why isn't it getting any easier for them?
57
182031
2398
Tại sao nó không trở nên dễ dàng hơn?
03:05
So, I've witnessed the struggle firsthand.
58
185810
2634
Tôi đã chứng kiến sự khó khăn đầu tiên.
03:09
In 2009, I started a research position with Nokia.
59
189194
3484
Năm 2009, tôi bắt đầu một vị trí nghiên cứu với Nokia.
03:13
And at the time,
60
193052
1158
Và vào lúc đó,
03:14
Nokia was one of the largest cell phone companies in the world,
61
194234
3158
Nokia là 1 trong các công ty điện thoại di động lớn nhất thế giới,
03:17
dominating emerging markets like China, Mexico and India --
62
197416
3202
thống trị các thị trường mới nổi như Trung Quốc, Mexico và Ấn Độ--
03:20
all places where I had done a lot of research
63
200642
2502
những nơi đó tôi đã thực hiện nhiều nghiên cứu
03:23
on how low-income people use technology.
64
203168
2676
về cách những người thu nhập thấp sử dụng công nghệ.
03:25
And I spent a lot of extra time in China
65
205868
2330
Và tôi cũng đã dành nhiều thời gian ở Trung Quốc
03:28
getting to know the informal economy.
66
208222
2592
để tìm hiểu nền kinh tế phi chính thức.
03:30
So I did things like working as a street vendor
67
210838
2401
Tôi đã làm những việc như bán hàng rong
03:33
selling dumplings to construction workers.
68
213263
2574
bán bánh bao cho công nhân xây dựng.
03:35
Or I did fieldwork,
69
215861
1358
Hay tôi đi thực tế,
03:37
spending nights and days in internet cafés,
70
217243
2958
dành cả ngày lẫn đêm trong các quán cà phê internet,
03:40
hanging out with Chinese youth, so I could understand
71
220225
2546
đi chơi với thanh niên Trung Quốc, nên tôi có thể hiểu
03:42
how they were using games and mobile phones
72
222795
2284
họ đã sử dụng điện thoại và chơi game ra sao
03:45
and using it between moving from the rural areas to the cities.
73
225103
3370
và sử dụng khi di chuyển giữa nông thôn và thành thị.
03:50
Through all of this qualitative evidence that I was gathering,
74
230155
3927
Dựa trên những dữ liệu định tính mà tôi đã thu thập được này,
03:54
I was starting to see so clearly
75
234106
2824
Tôi đã bắt đầu nhận ra
03:56
that a big change was about to happen among low-income Chinese people.
76
236954
4472
rằng sắp diễn ra một sự thay đổi lớn giữa những người Trung Quốc thu nhập thấp.
04:02
Even though they were surrounded by advertisements for luxury products
77
242840
4367
Ngay cả khi họ bị bủa vây bởi những quảng cáo cho các sản phẩm xa xỉ
04:07
like fancy toilets -- who wouldn't want one? --
78
247231
3495
như thiết bị vệ sinh ưa thích-- ai mà không muốn một cái?
04:10
and apartments and cars,
79
250750
2890
rồi căn hộ và xe hơi,
04:13
through my conversations with them,
80
253664
1820
qua tiếp xúc với họ,
04:15
I found out that the ads the actually enticed them the most
81
255508
3841
Tôi khám phá ra rằng những quảng cáo thực sự lôi cuốn họ nhất
04:19
were the ones for iPhones,
82
259373
1996
là những cái quảng cáo về iPhones,
04:21
promising them this entry into this high-tech life.
83
261393
3052
hứa hẹn họ cánh cửa này dẫn vào cuộc sống công nghệ cao.
04:25
And even when I was living with them in urban slums like this one,
84
265289
3163
Và ngay cả khi tôi sống với họ trong các khu ổ chuột như cái này,
04:28
I saw people investing over half of their monthly income
85
268476
2996
Tôi thấy mọi người chi quá nữa thu nhập hàng tháng của họ
04:31
into buying a phone,
86
271496
1623
để mua điện thoại,
04:33
and increasingly, they were "shanzhai,"
87
273143
2302
và hàng nhái "shanzhai" ngày càng nhiều,
04:35
which are affordable knock-offs of iPhones and other brands.
88
275469
3388
giá cả dễ mua đánh bật iPhones và các nhãn hiệu khác.
04:40
They're very usable.
89
280123
1625
Những thứ này dùng được.
04:42
Does the job.
90
282710
1322
Được chấp nhận.
04:44
And after years of living with migrants and working with them
91
284570
5789
Sau nhiều năm sống với những người nhập cư và làm việc với họ
04:50
and just really doing everything that they were doing,
92
290383
3434
và làm mọi thứ họ làm,
04:53
I started piecing all these data points together --
93
293841
3597
Tôi bắt đầu kết nối tất cả dữ liệu lại với nhau--
04:57
from the things that seem random, like me selling dumplings,
94
297462
3123
từ những thứ tưởng như ngẫu nhiên, như tôi đi bán bánh bao,
05:00
to the things that were more obvious,
95
300609
1804
đến những thứ rõ ràng hơn,
05:02
like tracking how much they were spending on their cell phone bills.
96
302437
3232
như tìm hiểu họ đã chi tiêu bao nhiêu cho hóa đơn điện thoại.
05:05
And I was able to create this much more holistic picture
97
305693
2639
Và tôi đã tạo ra bức tranh toàn diện hơn rất nhiều này
05:08
of what was happening.
98
308356
1156
về những gì đang xảy ra.
05:09
And that's when I started to realize
99
309536
1722
Và đó cũng là lúc tôi bắt đầu nhận ra
05:11
that even the poorest in China would want a smartphone,
100
311282
3509
ngay cả những người Trung Quốc nghèo nhất cũng muốn điện thoại thông minh,
05:14
and that they would do almost anything to get their hands on one.
101
314815
4985
và họ làm gần như mọi thứ để có được một cái trên tay.
05:20
You have to keep in mind,
102
320893
2404
Bạn cần nhớ rằng,
05:23
iPhones had just come out, it was 2009,
103
323321
3084
iPhones chỉ mới xuất hiện, vào năm 2009,
05:26
so this was, like, eight years ago,
104
326429
1885
mới khoảng tám năm trước,
05:28
and Androids had just started looking like iPhones.
105
328338
2437
và Android cũng bắt đầu trông giống iPhones.
05:30
And a lot of very smart and realistic people said,
106
330799
2507
Và rất nhiều người thực tế và thông minh đã nói,
05:33
"Those smartphones -- that's just a fad.
107
333330
2207
Điện thoại thông minh -- ở thời điểm đó.
05:36
Who wants to carry around these heavy things
108
336063
2996
Có ai muốn mang theo những thứ nặng nề đó
05:39
where batteries drain quickly and they break every time you drop them?"
109
339083
3487
trong khi Pin thì nhanh hết và sẽ bị vỡ mỗi khi ta làm rơi chúng?
05:44
But I had a lot of data,
110
344613
1201
Và tôi có nhiều dữ liệu,
05:45
and I was very confident about my insights,
111
345838
2260
tôi rất tự tin về những phát hiện của mình,
05:48
so I was very excited to share them with Nokia.
112
348122
2829
tôi đã rất hào hứng chia sẻ với Nokia.
05:53
But Nokia was not convinced,
113
353152
2517
Nhưng đã không thuyết phục được Nokia,
05:55
because it wasn't big data.
114
355693
2335
bởi vì đó không phải là dữ liệu lớn.
05:58
They said, "We have millions of data points,
115
358842
2404
Họ nói, "Chúng tôi có hàng triệu mục dữ liệu,
06:01
and we don't see any indicators of anyone wanting to buy a smartphone,
116
361270
4247
và chúng tôi không thấy chỉ dấu nào rằng có người muốn mua điện thoại thông minh,
06:05
and your data set of 100, as diverse as it is, is too weak
117
365541
4388
và tập dữ liệu của bạn chỉ có 100, mức độ đa dạng của nó quá yếu
06:09
for us to even take seriously."
118
369953
1714
để chúng tôi xem xét nghiêm túc."
06:12
And I said, "Nokia, you're right.
119
372728
1605
Và tôi nói, "Nokia, các bạn đúng.
06:14
Of course you wouldn't see this,
120
374357
1560
Tất nhiên các bạn sẽ không thấy,
06:15
because you're sending out surveys assuming that people don't know
121
375941
3371
bởi vì bạn thực hiện các khảo sát giả định rằng mọi người không biết
06:19
what a smartphone is,
122
379336
1159
về điện thoại thông minh
06:20
so of course you're not going to get any data back
123
380519
2366
và dĩ nhiên bạn sẽ không có được bất kỳ dữ liệu
06:22
about people wanting to buy a smartphone in two years.
124
382909
2572
về người muốn mua điện thoại thông minh cho 2 năm tới.
06:25
Your surveys, your methods have been designed
125
385505
2118
Phương pháp khảo sát của bạn được thiết kế
06:27
to optimize an existing business model,
126
387647
2022
để tối ưu mô hình kinh doanh hiện tại,
06:29
and I'm looking at these emergent human dynamics
127
389693
2608
và tôi đang nhắm đến những động lực con người mới nổi
06:32
that haven't happened yet.
128
392325
1354
mà chưa xuất hiện.
06:33
We're looking outside of market dynamics
129
393703
2438
Chúng ta đang ra bên ngoài các động lực thị trường
06:36
so that we can get ahead of it."
130
396165
1631
để có thể đón đầu nó."
06:39
Well, you know what happened to Nokia?
131
399193
2244
Vâng, các bạn biết những gì đã xãy ra với Nokia?
06:41
Their business fell off a cliff.
132
401461
2365
Kinh doanh của họ đã rơi thẳng đứng.
06:44
This -- this is the cost of missing something.
133
404611
3727
Đây là cái giá của việc thiếu sót thứ gì đó.
06:48
It was unfathomable.
134
408983
1999
Không thể hiểu được.
06:51
But Nokia's not alone.
135
411823
1651
Nhưng không phải chỉ mình Nokia.
06:54
I see organizations throwing out data all the time
136
414078
2581
Tôi thấy các tổ chức luôn vứt bỏ các dữ liệu
06:56
because it didn't come from a quant model
137
416683
2561
bởi vì nó không xuất phát từ một mô hình phân tích
06:59
or it doesn't fit in one.
138
419268
1768
hay không khớp với nó.
07:02
But it's not big data's fault.
139
422039
2048
Nhưng đó không phải lỗi của dữ liệu lớn.
07:04
It's the way we use big data; it's our responsibility.
140
424762
3907
Mà ở cách chúng ta sử dụng dữ liệu lớn; đó là lỗi của chúng ta.
07:09
Big data's reputation for success
141
429550
1911
Thành công nổi tiếng của dữ liệu lớn
07:11
comes from quantifying very specific environments,
142
431485
3759
đến từ việc định lượng hóa mọi điều kiện môi trường cụ thể
07:15
like electricity power grids or delivery logistics or genetic code,
143
435268
4913
như các lưới điện hay hạ tầng giao vận hay mã di truyền,
07:20
when we're quantifying in systems that are more or less contained.
144
440205
4318
khi chúng ta đang định lượng trong các hệ thống mà hay ít nhiều có kiểm soát.
07:24
But not all systems are as neatly contained.
145
444547
2969
Nhưng không phải mọi hệ thống đều được kiểm soát rõ ràng.
07:27
When you're quantifying and systems are more dynamic,
146
447540
3258
Khi chúng ta đang định lượng và các hệ thống thì năng động hơn,
07:30
especially systems that involve human beings,
147
450822
3799
đặc biệt là các hệ thống liên quan đến yếu tố con người,
07:34
forces are complex and unpredictable,
148
454645
2426
các động lực rất phức tạp và khó đoán,
07:37
and these are things that we don't know how to model so well.
149
457095
3486
và đây là những thứ mà chúng ta không biết cách để mô hình hóa cho tốt
07:41
Once you predict something about human behavior,
150
461024
2813
Một khi bạn dự đoán điều gì đó về hành vi con người,
07:43
new factors emerge,
151
463861
1855
các yếu tố mới xuất hiện,
07:45
because conditions are constantly changing.
152
465740
2365
bởi vì các điều kiện luôn thay đổi.
07:48
That's why it's a never-ending cycle.
153
468129
1803
Do đó nó là một chu trình vô tận.
07:49
You think you know something,
154
469956
1464
Bạn nghĩ bạn biết điều gì đó,
07:51
and then something unknown enters the picture.
155
471444
2242
và rồi điều chưa biết lại xuất hiện.
07:53
And that's why just relying on big data alone
156
473710
3322
Đó là lý do nếu chỉ dựa vào dữ liệu lớn
07:57
increases the chance that we'll miss something,
157
477056
2849
sẽ làm tăng xác suất chúng ta sẽ bỏ nhỡ điều gì đó,
07:59
while giving us this illusion that we already know everything.
158
479929
3777
trong khi làm cho chúng ta ảo tưởng rằng chúng ta đã biết mọi thứ.
08:04
And what makes it really hard to see this paradox
159
484226
3856
Và điều gì làm cho việc nhận ra nghịch lý này khó khăn đến vậy
08:08
and even wrap our brains around it
160
488106
2659
và ngay cả để hiểu nó
08:10
is that we have this thing that I call the quantification bias,
161
490789
3691
chúng ta đa gặp phải cái mà tôi gọi là thiên vị định lượng,
08:14
which is the unconscious belief of valuing the measurable
162
494504
3922
đó là niềm tin vô thức về giá trị của những cái đo lường được
08:18
over the immeasurable.
163
498450
1594
so với cái không đo lường được.
08:21
And we often experience this at our work.
164
501042
3284
Và chúng ta thường trải nghiệm điều này khi làm việc.
08:24
Maybe we work alongside colleagues who are like this,
165
504350
2650
Có thể chúng ta làm việc bên cạnh đồng nghiệp như vậy,
08:27
or even our whole entire company may be like this,
166
507024
2428
hoặc có thể cả công ty của chúng ta cũng như vậy,
08:29
where people become so fixated on that number,
167
509476
2546
nơi mà mọi người mặc nhiên tin vào con số đó,
08:32
that they can't see anything outside of it,
168
512046
2067
họ không thể nhìn thấy cái gì ngoài nó ra,
08:34
even when you present them evidence right in front of their face.
169
514137
3948
ngay cả khi bạn cho họ thấy bằng chứng ngay trước mặt họ.
08:38
And this is a very appealing message,
170
518943
3371
Vầ đây là một thông điệp rất lôi cuốn,
08:42
because there's nothing wrong with quantifying;
171
522338
2343
bởi vì chẳng có gì sai với việc định lượng hóa;
08:44
it's actually very satisfying.
172
524705
1430
Nó thực sự rất thỏa mãn.
08:46
I get a great sense of comfort from looking at an Excel spreadsheet,
173
526159
4362
Tôi có một cảm giác rất thoải mái khi nhìn vào một bảng tính Excel,
08:50
even very simple ones.
174
530545
1401
cho dù nó rát đơn giản.
08:51
(Laughter)
175
531970
1014
(Cười)
08:53
It's just kind of like,
176
533008
1152
Nó có phần giống như,
08:54
"Yes! The formula worked. It's all OK. Everything is under control."
177
534184
3504
"Vâng! Công thức đúng. Tất cả đều ổn. Mọi thứ đang được kiểm soát."
08:58
But the problem is
178
538612
2390
Nhưng vấn đề là
09:01
that quantifying is addictive.
179
541026
2661
Việc định lượng hóa gây nghiện.
09:03
And when we forget that
180
543711
1382
Và khi chúng ta quên mất rằng
09:05
and when we don't have something to kind of keep that in check,
181
545117
3038
khi chúng ta không có cái gì để giữ chúng trong tầm kiểm soát,
09:08
it's very easy to just throw out data
182
548179
2118
Chúng ta rất dễ đánh mất dữ liệu
09:10
because it can't be expressed as a numerical value.
183
550321
2718
bởi vì nó không thể được biểu diễn như một giá trị số học.
09:13
It's very easy just to slip into silver-bullet thinking,
184
553063
2921
Nó làm cho ta rất dễ rơi vào tư duy xử lý tình thế,
09:16
as if some simple solution existed.
185
556008
2579
như là một giải pháp đơn giản tồn tại.
09:19
Because this is a great moment of danger for any organization,
186
559420
4062
Bởi vì đây là thời điểm vô cùng nguy hiểm cho bất kỳ tổ chức nào,
09:23
because oftentimes, the future we need to predict --
187
563506
2634
bởi vì thường là, chúng ta cần dự đoán tương lai --
09:26
it isn't in that haystack,
188
566164
2166
không giống như trong đống rơm
09:28
but it's that tornado that's bearing down on us
189
568354
2538
mà nó như là cơn lốc xoáy đổ xuống đầu chúng ta
09:30
outside of the barn.
190
570916
1488
bên ngoài lều trại.
09:34
There is no greater risk
191
574780
2326
Không có rủi ro nào lớn hơn
09:37
than being blind to the unknown.
192
577130
1666
là bị mù với những thứ chưa biết.
09:38
It can cause you to make the wrong decisions.
193
578820
2149
Nó có thể làm cho bạn đưa ra quyết định sai.
09:40
It can cause you to miss something big.
194
580993
1974
Nó có thể làm bạn bỏ lỡ những điều to lớn.
09:43
But we don't have to go down this path.
195
583554
3101
Nhưng chúng ta không cần phải đi theo con đường này.
09:47
It turns out that the oracle of ancient Greece
196
587273
3195
Hóa ra những nhà tiên tri của Hy Lạp cổ đại
09:50
holds the secret key that shows us the path forward.
197
590492
3966
nắm giữ chìa khóa bí mật chỉ cho ta con đường đi về phía trước.
09:55
Now, recent geological research has shown
198
595474
2595
Hiện nay, nghiên cứu địa chất gần đây chỉ ra rằng
09:58
that the Temple of Apollo, where the most famous oracle sat,
199
598093
3564
ngôi đền Apollo, nơi nhà tiên tri nổi tiếng nhất ngồi,
10:01
was actually built over two earthquake faults.
200
601681
3084
được xây dựng trên hai đoạn đứt gãy động đất.
10:04
And these faults would release these petrochemical fumes
201
604789
2886
Và những đoạn đứt gãy này bốc ra hơi hóa dầu
10:07
from underneath the Earth's crust,
202
607699
1685
từ bên dưới lớp vỏ Trái đất,
10:09
and the oracle literally sat right above these faults,
203
609408
3866
và nhà tiên tri ngồi chính xác ngay trên chổ đứt gãy này,
10:13
inhaling enormous amounts of ethylene gas, these fissures.
204
613298
3588
hít vào lượng lớn khí Etylen ở chỗ vết nứt này.
10:16
(Laughter)
205
616910
1008
(Cười)
10:17
It's true.
206
617942
1173
Sự thật là như vậy.
10:19
(Laughter)
207
619139
1017
(Cười)
10:20
It's all true, and that's what made her babble and hallucinate
208
620180
3509
Tất cả là sự thật, và nó làm cho bà ấy nói nhảm và ảo giác
10:23
and go into this trance-like state.
209
623713
1724
và chuyển sang trạng thái xuất thần
10:25
She was high as a kite!
210
625461
1770
Bà ta bay bổng như chiếc diều!
10:27
(Laughter)
211
627255
4461
(Cười)
10:31
So how did anyone --
212
631740
2779
Vậy làm sao người ta--
10:34
How did anyone get any useful advice out of her
213
634543
3030
Làm sao người ta xin lời khuyên hữu dụng từ bà ấy
10:37
in this state?
214
637597
1190
trong trạng thái này?
10:39
Well, you see those people surrounding the oracle?
215
639317
2381
Vâng, bạn thấy những người đó vây quanh bà?
10:41
You see those people holding her up,
216
641722
1879
Bạn thấy những người đó nâng bà ấy lên,
10:43
because she's, like, a little woozy?
217
643625
1717
Vì bà ấy giống như một người say?
10:45
And you see that guy on your left-hand side
218
645366
2308
Và bạn thấy cái gã bên tay trái
10:47
holding the orange notebook?
219
647698
1598
đang cầm quyển vở màu cam?
10:49
Well, those were the temple guides,
220
649925
1730
Đó là những người hướng dẫn đền,
10:51
and they worked hand in hand with the oracle.
221
651679
3016
và họ làm việc cùng với nhà tiên tri.
10:55
When inquisitors would come and get on their knees,
222
655904
2516
Khi những người xin lời khuyên đến và quỳ gối,
10:58
that's when the temple guides would get to work,
223
658444
2340
đó là lúc người hướng dẫn đền làm việc,
11:00
because after they asked her questions,
224
660808
1864
vì sau khi người ta đặt câu hỏi cho bà,
11:02
they would observe their emotional state,
225
662696
2001
người ta sẽ quan sát trạng thái cảm xúc,
11:04
and then they would ask them follow-up questions,
226
664721
2324
và khi họ hỏi những câu hỏi tiếp theo,
11:07
like, "Why do you want to know this prophecy? Who are you?
227
667069
2834
như, "Tại sao các người muốn biết điều này? Các người là ai?
11:09
What are you going to do with this information?"
228
669927
2264
Các người sẽ làm gì với thông tin này?"
11:12
And then the temple guides would take this more ethnographic,
229
672215
3182
Và rồi người hướng dẫn đền sẽ lấy thông tin nhân chủng học,
11:15
this more qualitative information,
230
675421
2156
thông tin định tính,
11:17
and interpret the oracle's babblings.
231
677601
2075
và dịch những lời nói nhảm của tiên tri.
11:21
So the oracle didn't stand alone,
232
681248
2292
Vậy ra nhà tiên tri không đơn độc,
11:23
and neither should our big data systems.
233
683564
2148
và không như các hệ thống dữ liệu lớn của ta.
11:26
Now to be clear,
234
686450
1161
Bây giờ đã rõ,
11:27
I'm not saying that big data systems are huffing ethylene gas,
235
687635
3459
Tôi không nói rằng các hệ thống dữ liệu lớn đang thổi khí Etylen,
11:31
or that they're even giving invalid predictions.
236
691118
2353
hay chúng đang cung cấp các dự đoán sai.
11:33
The total opposite.
237
693495
1161
Hoàn toàn ngược lại.
11:34
But what I am saying
238
694680
2068
Nhưng điều tôi đang nói
11:36
is that in the same way that the oracle needed her temple guides,
239
696772
3832
là giống như cách nhà tiên tri cần những người hướng dẫn đền của bà ấy,
11:40
our big data systems need them, too.
240
700628
2288
các hệ thống dữ liệu lớn cũng cần họ.
11:42
They need people like ethnographers and user researchers
241
702940
4109
Chúng cần những nhà nhân chủng học, nhà nghiên cứu người dùng
11:47
who can gather what I call thick data.
242
707073
2506
họ có thể thu thập cái gọi là dữ liệu dày.
11:50
This is precious data from humans,
243
710322
2991
Đây là dữ liệu quý giá từ con người,
11:53
like stories, emotions and interactions that cannot be quantified.
244
713337
4102
như những câu chuyện, cảm xúc và những tương tác mà không thể lượng hóa được.
11:57
It's the kind of data that I collected for Nokia
245
717463
2322
Đó là loại dữ liệu mà tôi đã thu thập cho Nokia
11:59
that comes in in the form of a very small sample size,
246
719809
2669
nó thể hiện dưới dạng có kích thước mẫu rất nhỏ,
12:02
but delivers incredible depth of meaning.
247
722502
2955
nhưng chuyển tải độ sâu ý nghĩa không thể tin được.
12:05
And what makes it so thick and meaty
248
725481
3680
Và điều làm cho nó mang nhiều ý nghĩa
12:10
is the experience of understanding the human narrative.
249
730265
4029
là sự trải nghiệm thấu hiểu những câu chuyện về con người.
12:14
And that's what helps to see what's missing in our models.
250
734318
3639
Nó giúp ta nhìn thấy những thiếu sót trong các mô hình của chúng ta.
12:18
Thick data grounds our business questions in human questions,
251
738671
4045
Dữ liệu dày làm nền tảng cho những câu hỏi kinh doanh theo những câu hỏi con người,
12:22
and that's why integrating big and thick data
252
742740
3562
và đó là lý do việc tích hợp dữ liệu dày và dữ liệu lớn
12:26
forms a more complete picture.
253
746326
1689
tạo nên một bức tranh đầy đủ hơn.
12:28
Big data is able to offer insights at scale
254
748592
2881
Dữ liệu lớn có thể đem đến những thông tin theo quy mô
12:31
and leverage the best of machine intelligence,
255
751497
2647
và tận dụng tối đa trí tuệ của máy,
12:34
whereas thick data can help us rescue the context loss
256
754168
3572
trong khi dữ liệu dày có thể giúp ta cứu vớt những mất mát ngữ cảnh
12:37
that comes from making big data usable,
257
757764
2098
mà để làm cho dữ liệu lớn có thể dùng được,
12:39
and leverage the best of human intelligence.
258
759886
2181
và tối đa hóa trí tuệ con người.
12:42
And when you actually integrate the two, that's when things get really fun,
259
762091
3552
Và khi bạn tích hợp hai loại đó lại, lúc đó mọi thứ sẽ rất thú vị,
12:45
because then you're no longer just working with data
260
765667
2436
bởi vì bạn không còn chỉ làm việc với dữ liệu
12:48
you've already collected.
261
768127
1196
mà bạn đã thu thập sẵn.
12:49
You get to also work with data that hasn't been collected.
262
769347
2737
Bạn sẽ cần làm việc với dữ liệu mà chưa được thu thập.
12:52
You get to ask questions about why:
263
772108
1719
Bạn cần hỏi những câu tại sao:
12:53
Why is this happening?
264
773851
1317
Tại sao điều này xảy ra?
12:55
Now, when Netflix did this,
265
775598
1379
Khi Netflix làm điều này,
12:57
they unlocked a whole new way to transform their business.
266
777001
3035
họ đã mở ra một con đường hoàn toàn mới để thay đổi việc làm ăn.
13:01
Netflix is known for their really great recommendation algorithm,
267
781226
3956
Netflix được biết đến với giải thuật khuyến nghị tuyệt vời của họ,
13:05
and they had this $1 million prize for anyone who could improve it.
268
785206
4797
và họ đã treo giải 1 triệu đô cho ai có thể cải thiện nó.
13:10
And there were winners.
269
790027
1314
Đây, những người đoạt giải.
13:12
But Netflix discovered the improvements were only incremental.
270
792075
4323
Nhưng Netflix khám phá ra rằng sự cải tiến chỉ giúp tăng dần.
13:17
So to really find out what was going on,
271
797224
1964
Để tìm ra điều gì đang thực sự diễn ra,
13:19
they hired an ethnographer, Grant McCracken,
272
799212
3741
họ thuê một nhà nhân chủng học, Grant McCracken,
13:22
to gather thick data insights.
273
802977
1546
để tập hợp ý nghĩa dữ liệu dày.
13:24
And what he discovered was something that they hadn't seen initially
274
804547
3924
Và ông ấy đã khám phá ra là có điều gì đó mà họ đã không nhận thấy ngay từ đầu
13:28
in the quantitative data.
275
808495
1355
trong dữ liệu định lượng.
13:30
He discovered that people loved to binge-watch.
276
810892
2728
Ông khám phá ra rằng mọi người thích xem quá độ.
13:33
In fact, people didn't even feel guilty about it.
277
813644
2353
Nhưng người ta không cảm thấy có lỗi về điều đó.
13:36
They enjoyed it.
278
816021
1255
Họ thưởng thức nó.
13:37
(Laughter)
279
817300
1026
(Cười)
13:38
So Netflix was like, "Oh. This is a new insight."
280
818350
2356
Netflix tiếp nhận kiểu, "Ồ, đây là cách nhìn mới."
13:40
So they went to their data science team,
281
820730
1938
Và họ đã gặp đội khoa học dữ liệu của họ,
13:42
and they were able to scale this big data insight
282
822692
2318
và họ có thể điều chỉnh tỉ lệ ý nghĩa dữ liệu lớn
13:45
in with their quantitative data.
283
825034
2587
cùng với dữ liệu định lượng của họ.
13:47
And once they verified it and validated it,
284
827645
3170
Và khi đã xác minh và xác nhận nó,
13:50
Netflix decided to do something very simple but impactful.
285
830839
4761
Netflix đã quyết định làm điều gì đó rất đơn giản nhưng có ảnh hưởng lớn.
13:56
They said, instead of offering the same show from different genres
286
836654
6492
Họ nói, thay vì chào mời cùng chương trình đến các giới tính khác nhau
14:03
or more of the different shows from similar users,
287
843170
3888
hay tăng các chương trình khác nhau đến cùng lớp người dùng,
14:07
we'll just offer more of the same show.
288
847082
2554
chúng tôi sẽ tăng chào mời cùng loại chương trình.
14:09
We'll make it easier for you to binge-watch.
289
849660
2105
Chúng tôi sẽ giúp bạn xem quá độ dễ dàng hơn.
14:11
And they didn't stop there.
290
851789
1486
Và họ không dừng ở đó.
14:13
They did all these things
291
853299
1474
Họ đã làm tất cả những điều đó
14:14
to redesign their entire viewer experience,
292
854797
2959
để thiết kế lại toàn bộ trải nghiệm cho người xem,
14:17
to really encourage binge-watching.
293
857780
1758
để thực sự khuyến khích xem quá độ.
14:20
It's why people and friends disappear for whole weekends at a time,
294
860050
3241
Đó là lý do mọi người và bạn bè biến mất cả cuối tuần cùng lúc,
14:23
catching up on shows like "Master of None."
295
863315
2343
theo dõi các chương trình như "Không thông thạo."
14:25
By integrating big data and thick data, they not only improved their business,
296
865682
4173
Việc tích hợp dữ liệu lớn và dữ liệu dày, họ đã không chỉ cải thiện việc kinh doanh,
14:29
but they transformed how we consume media.
297
869879
2812
nhưng họ còn thay đổi cách chúng ta tiêu dùng truyền thông.
14:32
And now their stocks are projected to double in the next few years.
298
872715
4552
Và giờ đây kho hàng của họ được dự báo sẽ gấp đôi trong vài năm đến.
14:38
But this isn't just about watching more videos
299
878100
3830
Nhưng đây không chỉ là xem nhiều phim hơn
14:41
or selling more smartphones.
300
881954
1620
hay bán nhiều điện thoại hơn.
14:43
For some, integrating thick data insights into the algorithm
301
883963
4050
Đối với một số người, tích hợp ý nghĩa dữ liệu dày và giải thuật
14:48
could mean life or death,
302
888037
2263
có ý nghĩa sống còn,
14:50
especially for the marginalized.
303
890324
2146
đặc biệt những người bị gạt ra khỏi cuộc chơi.
14:53
All around the country, police departments are using big data
304
893558
3434
Trên khắp đất nước, các sở cảnh sát đang sử dụng dữ liệu lớn
14:57
for predictive policing,
305
897016
1963
cho việc giữ trật tự có dự báo,
14:59
to set bond amounts and sentencing recommendations
306
899003
3084
để thiết lập mức bảo lãnh và các khuyến nghị hình phạt
15:02
in ways that reinforce existing biases.
307
902111
3147
theo nhiều cách để củng cố lại các thiên vị đang tồn tại.
15:06
NSA's Skynet machine learning algorithm
308
906116
2423
Máy giải thuật học của NSA's Skynet
15:08
has possibly aided in the deaths of thousands of civilians in Pakistan
309
908563
5444
có thể đã góp phần vào những cái chết của hàng ngàn thường dân vô tội ở Pakistan
15:14
from misreading cellular device metadata.
310
914031
2721
vì đọc sai dữ liệu mô tả thiết bị di động.
15:18
As all of our lives become more automated,
311
918951
3403
Khi cuộc sống chúng ta trở nên tự động hóa hơn,
15:22
from automobiles to health insurance or to employment,
312
922378
3080
từ xe ô tô đến bảo hiểm y tế, hay việc làm,
15:25
it is likely that all of us
313
925482
2350
có vẻ như rằng tất cả chúng ta
15:27
will be impacted by the quantification bias.
314
927856
2989
sẽ bị ảnh hưởng bởi sự thiên vị định lượng.
15:32
Now, the good news is that we've come a long way
315
932792
2621
Giờ đây, tin tốt là chúng ta đã đi một chặng đường dài
15:35
from huffing ethylene gas to make predictions.
316
935437
2450
từ hít phải khí Etylen đến việc đưa ra các dự báo.
15:37
We have better tools, so let's just use them better.
317
937911
3070
Chúng ta có các công cụ tốt hơn, nên hãy sử dụng chúng tốt hơn.
15:41
Let's integrate the big data with the thick data.
318
941005
2323
Ta hãy tích hợp dữ liệu lớn cùng với dữ liệu dày.
15:43
Let's bring our temple guides with the oracles,
319
943352
2261
Hãy đem người hướng dẫn đền đến với nhà tiên tri
15:45
and whether this work happens in companies or nonprofits
320
945637
3376
và cho dù việc này xãy ra ở công ty hay các tổ chức phi lợi nhuận
15:49
or government or even in the software,
321
949037
2469
hay chính phủ hay ngay cả trong phần mềm,
15:51
all of it matters,
322
951530
1792
tất cả chúng đều quan trọng,
15:53
because that means we're collectively committed
323
953346
3023
bởi vì nó có nghĩa chúng ta đã cam kết một cách tập thể
15:56
to making better data,
324
956393
2191
để tạo ra dữ liệu tốt hơn,
15:58
better algorithms, better outputs
325
958608
1836
các giải thuật tốt hơn, kết quả tốt hơn
16:00
and better decisions.
326
960468
1643
và các quyết định tốt hơn.
16:02
This is how we'll avoid missing that something.
327
962135
3558
Đây là cách chúng ta sẽ tránh bỏ lỡ những thứ quan trọng đó.
16:07
(Applause)
328
967042
3948
(Vỗ tay)
Về trang web này

Trang web này sẽ giới thiệu cho bạn những video YouTube hữu ích cho việc học tiếng Anh. Bạn sẽ thấy các bài học tiếng Anh được giảng dạy bởi các giáo viên hàng đầu từ khắp nơi trên thế giới. Nhấp đúp vào phụ đề tiếng Anh hiển thị trên mỗi trang video để phát video từ đó. Phụ đề cuộn đồng bộ với phát lại video. Nếu bạn có bất kỳ nhận xét hoặc yêu cầu nào, vui lòng liên hệ với chúng tôi bằng biểu mẫu liên hệ này.

https://forms.gle/WvT1wiN1qDtmnspy7