Kenneth Cukier: Big data is better data

530,099 views ・ 2014-09-23

TED


Vă rugăm să faceți dublu clic pe subtitrările în limba engleză de mai jos pentru a reda videoclipul.

Traducător: Teodora Rogozea Corector: Adrian Dobroiu
00:12
America's favorite pie is?
0
12787
3845
Plăcinta preferată a Americii. Care este?
00:16
Audience: Apple. Kenneth Cukier: Apple. Of course it is.
1
16632
3506
Public: De mere! Kenneth Cukier: De mere, sigur că da.
00:20
How do we know it?
2
20138
1231
De unde știm?
00:21
Because of data.
3
21369
2753
Datorită datelor.
00:24
You look at supermarket sales.
4
24122
2066
Ne uităm la vânzările supermarketurilor, vânzările plăcintelor congelate de 30 cm.
00:26
You look at supermarket sales of 30-centimeter pies
5
26188
2866
00:29
that are frozen, and apple wins, no contest.
6
29054
4075
Iar plăcinta de mere câștigă. Detașat.
Majoritatea vânzărilor sunt la plăcinta de mere.
00:33
The majority of the sales are apple.
7
33129
5180
00:38
But then supermarkets started selling
8
38309
2964
Dar apoi supermarketurile au început să vândă plăcinte mai mici, de 11 cm,
00:41
smaller, 11-centimeter pies,
9
41273
2583
00:43
and suddenly, apple fell to fourth or fifth place.
10
43856
4174
și dintr-o dată plăcinta de mere a căzut pe locul 4 sau 5.
00:48
Why? What happened?
11
48030
2875
De ce? Ce s-a întâmplat?
00:50
Okay, think about it.
12
50905
2818
Ia să ne gândim.
00:53
When you buy a 30-centimeter pie,
13
53723
3848
Când cumpărăm o plăcintă de 30 cm
00:57
the whole family has to agree,
14
57571
2261
toată familia trebuie să fie de acord,
00:59
and apple is everyone's second favorite.
15
59832
3791
iar plăcinta de mere e a doua preferință a tuturor.
01:03
(Laughter)
16
63623
1935
(Râsete)
01:05
But when you buy an individual 11-centimeter pie,
17
65558
3615
Dar când iei o plăcintă personală, de 11 cm,
01:09
you can buy the one that you want.
18
69173
3745
poți s-o iei pe cea pe care ți-o dorești.
01:12
You can get your first choice.
19
72918
4015
Poți să-ți alegi prima preferință.
01:16
You have more data.
20
76933
1641
Avem mai multe date.
01:18
You can see something
21
78574
1554
Vedem ceva ce nu puteam vedea când aveam cantități mai mici de date.
01:20
that you couldn't see
22
80128
1132
01:21
when you only had smaller amounts of it.
23
81260
3953
01:25
Now, the point here is that more data
24
85213
2475
Dar ideea e că datele mai multe
01:27
doesn't just let us see more,
25
87688
2283
nu ne permit doar să vedem mai mult, mai mult din același lucru.
01:29
more of the same thing we were looking at.
26
89971
1854
01:31
More data allows us to see new.
27
91825
3613
Datele mai multe ne permit să vedem ceva nou.
01:35
It allows us to see better.
28
95438
3094
Ne permit să vedem mai bine.
01:38
It allows us to see different.
29
98532
3656
Ne permit să vedem altfel.
01:42
In this case, it allows us to see
30
102188
3173
În cazul de faţă ne permit să vedem
01:45
what America's favorite pie is:
31
105361
2913
care e plăcinta preferată a Americii:
01:48
not apple.
32
108274
2542
nu cea de mere.
01:50
Now, you probably all have heard the term big data.
33
110816
3614
Probabil toată lumea a auzit termenul „date masive”.
01:54
In fact, you're probably sick of hearing the term
34
114430
2057
De fapt probabil vi s-a făcut acru tot auzind „date masive”.
01:56
big data.
35
116487
1630
01:58
It is true that there is a lot of hype around the term,
36
118117
3330
E adevărat că se face mult tam-tam pe seama termenului și e mare păcat,
02:01
and that is very unfortunate,
37
121447
2332
02:03
because big data is an extremely important tool
38
123779
3046
pentru că datele masive sunt o unealtă foarte importantă
02:06
by which society is going to advance.
39
126825
3734
prin care va avansa societatea.
02:10
In the past, we used to look at small data
40
130559
3561
În trecut ne uitam la date puține
02:14
and think about what it would mean
41
134120
1704
și ne întrebam cum am putea încerca să înțelegem lumea,
02:15
to try to understand the world,
42
135824
1496
02:17
and now we have a lot more of it,
43
137320
1991
iar acum avem mult mai multe, mai multe decât era posibil înainte.
02:19
more than we ever could before.
44
139311
2722
02:22
What we find is that when we have
45
142033
1877
Constatăm că având o colecție mare de date putem face lucruri
02:23
a large body of data, we can fundamentally do things
46
143910
2724
02:26
that we couldn't do when we only had smaller amounts.
47
146634
3276
imposibil de realizat cu date puține.
02:29
Big data is important, and big data is new,
48
149910
2641
Datele masive sunt importante și sunt noi.
02:32
and when you think about it,
49
152551
1777
Dacă ne gândim bine,
02:34
the only way this planet is going to deal
50
154328
2216
singurul mod în care planeta va face față problemelor globale
02:36
with its global challenges —
51
156544
1789
02:38
to feed people, supply them with medical care,
52
158333
3537
— hrănirea populației, furnizarea serviciilor medicale,
02:41
supply them with energy, electricity,
53
161870
2810
alimentarea cu energie, electricitate,
02:44
and to make sure they're not burnt to a crisp
54
164680
1789
și cum facem să nu ne rumenim cu încălzirea globală —
02:46
because of global warming —
55
166469
1238
02:47
is because of the effective use of data.
56
167707
4195
e prin folosirea eficientă a datelor.
02:51
So what is new about big data? What is the big deal?
57
171902
3870
Dar ce e nou în datele masive? Care e marea scofală?
02:55
Well, to answer that question, let's think about
58
175772
2517
Pentru a răspunde, să ne amintim cum arătau informațiile efectiv în trecut.
02:58
what information looked like,
59
178289
1896
03:00
physically looked like in the past.
60
180185
3034
03:03
In 1908, on the island of Crete,
61
183219
3611
În 1908, pe insula Creta,
03:06
archaeologists discovered a clay disc.
62
186830
4735
arheologii au descoperit un disc de lut.
03:11
They dated it from 2000 B.C., so it's 4,000 years old.
63
191565
4059
L-au datat în 2000 î.Hr., deci e vechi de 4000 ani.
03:15
Now, there's inscriptions on this disc,
64
195624
2004
Discul are inscripții, dar nu știm ce înseamnă, e un mister complet.
03:17
but we actually don't know what it means.
65
197628
1327
03:18
It's a complete mystery, but the point is that
66
198955
2098
Dar ideea e că așa arătau informațiile acum 4000 ani.
03:21
this is what information used to look like
67
201053
1928
03:22
4,000 years ago.
68
202981
2089
03:25
This is how society stored
69
205070
2548
Așa proceda societatea pentru a păstra și transmite informațiile.
03:27
and transmitted information.
70
207618
3524
03:31
Now, society hasn't advanced all that much.
71
211142
4160
Dar societatea nu a avansat așa de mult.
03:35
We still store information on discs,
72
215302
3474
Încă mai păstrăm informații pe discuri,
03:38
but now we can store a lot more information,
73
218776
3184
dar acum putem stoca mult mai multe informații decât oricând.
03:41
more than ever before.
74
221960
1260
03:43
Searching it is easier. Copying it easier.
75
223220
3093
Căutarea e mai ușoară. Copierea e mai ușoară.
03:46
Sharing it is easier. Processing it is easier.
76
226313
3500
Distribuirea e mai ușoară. Prelucrarea e mai ușoară.
03:49
And what we can do is we can reuse this information
77
229813
2766
Și putem refolosi aceste informații
03:52
for uses that we never even imagined
78
232579
1834
în moduri pe care nu ni le-am închipuit când am colectat datele.
03:54
when we first collected the data.
79
234413
3195
03:57
In this respect, the data has gone
80
237608
2252
În această privință datele au trecut de la a fi păstrate la a fi circulate,
03:59
from a stock to a flow,
81
239860
3532
04:03
from something that is stationary and static
82
243392
3938
de la ceva staționar și static
04:07
to something that is fluid and dynamic.
83
247330
3609
la ceva fluid și dinamic.
04:10
There is, if you will, a liquidity to information.
84
250939
4023
Ca să zic așa, informațiile au o lichiditate.
04:14
The disc that was discovered off of Crete
85
254962
3474
Discul descoperit în Creta și vechi de 4000 ani
04:18
that's 4,000 years old, is heavy,
86
258436
3764
e greu, nu stochează multe informații.
04:22
it doesn't store a lot of information,
87
262200
1962
04:24
and that information is unchangeable.
88
264162
3116
Iar acele informații nu pot fi schimbate.
04:27
By contrast, all of the files
89
267278
4011
Pe de altă parte, toate documentele
04:31
that Edward Snowden took
90
271289
1861
pe care le-a luat Edward Snowden de la Agenția de Securitate Națională din SUA
04:33
from the National Security Agency in the United States
91
273150
2621
04:35
fits on a memory stick
92
275771
2419
încap pe un stick de memorie de mărimea unei unghii,
04:38
the size of a fingernail,
93
278190
3010
și se pot transmite cu viteza luminii.
04:41
and it can be shared at the speed of light.
94
281200
4745
04:45
More data. More.
95
285945
5255
Mai multe date. Mai multe.
04:51
Now, one reason why we have so much data in the world today
96
291200
1974
Un motiv pentru care azi lumea are atâtea date e că adunăm lucruri
04:53
is we are collecting things
97
293174
1432
04:54
that we've always collected information on,
98
294606
3280
despre care dintotdeauna am adunat informații.
04:57
but another reason why is we're taking things
99
297886
2656
Dar un alt motiv e că luăm lucruri care au fost mereu informaționale,
05:00
that have always been informational
100
300542
2812
05:03
but have never been rendered into a data format
101
303354
2486
dar n-au mai fost puse sub formă de date, și le transformăm în date.
05:05
and we are putting it into data.
102
305840
2419
05:08
Think, for example, the question of location.
103
308259
3308
Gândiți-vă de exemplu la problema localizării.
05:11
Take, for example, Martin Luther.
104
311567
2249
Să-l luăm pe Martin Luther.
05:13
If we wanted to know in the 1500s
105
313816
1597
Dacă voiam să știm, în anii 1500, unde se află Martin Luther,
05:15
where Martin Luther was,
106
315413
2667
05:18
we would have to follow him at all times,
107
318080
2092
trebuia să-l urmăm peste tot, poate cu pană și cerneală, ca să notăm.
05:20
maybe with a feathery quill and an inkwell,
108
320172
2137
05:22
and record it,
109
322309
1676
05:23
but now think about what it looks like today.
110
323985
2183
Dar acum gândiți-vă cum e azi.
05:26
You know that somewhere,
111
326168
2122
Știți că undeva, printr-o bază de date a unui furnizor de telecomunicații,
05:28
probably in a telecommunications carrier's database,
112
328290
2446
05:30
there is a spreadsheet or at least a database entry
113
330736
3036
e un tabel sau cel puțin o înscriere
05:33
that records your information
114
333772
2088
care înregistrează informații despre noi, unde am fost în fiecare moment.
05:35
of where you've been at all times.
115
335860
2063
05:37
If you have a cell phone,
116
337923
1360
Dacă aveți un telefon mobil cu GPS, dar chiar dacă nu are GPS,
05:39
and that cell phone has GPS, but even if it doesn't have GPS,
117
339283
2847
05:42
it can record your information.
118
342130
2385
vă poate memora informațiile.
05:44
In this respect, location has been datafied.
119
344515
4084
În această privință localizarea a fost „datificată”.
05:48
Now think, for example, of the issue of posture,
120
348599
4601
Acum gândiți-vă de exemplu la problema posturii,
05:53
the way that you are all sitting right now,
121
353200
1285
cum stați așezați,
05:54
the way that you sit,
122
354485
2030
cum stați dv.
05:56
the way that you sit, the way that you sit.
123
356515
2771
sau cum stați dv. sau dv.
05:59
It's all different, and it's a function of your leg length
124
359286
2077
Diferă în funcție de lungimea piciorului, de spate și de conturul spatelui.
06:01
and your back and the contours of your back,
125
361363
2093
06:03
and if I were to put sensors, maybe 100 sensors
126
363456
2531
Dacă aș pune sensori, să zicem 100 de sensori, în scaunele tuturor,
06:05
into all of your chairs right now,
127
365987
1766
06:07
I could create an index that's fairly unique to you,
128
367753
3600
aș putea crea un index unic pentru fiecare.
06:11
sort of like a fingerprint, but it's not your finger.
129
371353
4409
Ca o amprentă, dar nu a degetului.
06:15
So what could we do with this?
130
375762
2969
Și la ce am putea s-o folosim?
06:18
Researchers in Tokyo are using it
131
378731
2397
Unii cercetători din Tokio o folosesc ca posibil sistem antifurt pentru mașini.
06:21
as a potential anti-theft device in cars.
132
381128
4388
06:25
The idea is that the carjacker sits behind the wheel,
133
385516
2924
Ideea e că hoțul stă la volan, încearcă să pornească,
06:28
tries to stream off, but the car recognizes
134
388440
2104
dar mașina recunoaște că la volan e un șofer neautorizat
06:30
that a non-approved driver is behind the wheel,
135
390544
2362
06:32
and maybe the engine just stops, unless you
136
392906
2164
și atunci de exemplu se oprește motorul dacă nu tastezi o parolă în sistem
06:35
type in a password into the dashboard
137
395070
3177
06:38
to say, "Hey, I have authorization to drive." Great.
138
398247
4658
ca să-i spui: „Hei, sunt autorizat să conduc.”
Grozav.
06:42
What if every single car in Europe
139
402905
2553
Ce-ar fi dacă toate mașinile din Europa ar folosi această tehnologie?
06:45
had this technology in it?
140
405458
1457
06:46
What could we do then?
141
406915
3165
Ce am putea face atunci?
06:50
Maybe, if we aggregated the data,
142
410080
2240
Dacă punem datele cap la cap poate reușim să identificăm
06:52
maybe we could identify telltale signs
143
412320
3814
semnele distinctive care să prezică optim
06:56
that best predict that a car accident
144
416134
2709
06:58
is going to take place in the next five seconds.
145
418843
5893
că se va produce un accident de mașină
în următoarele cinci secunde.
07:04
And then what we will have datafied
146
424736
2557
Astfel s-ar datifica oboseala șoferului.
07:07
is driver fatigue,
147
427293
1783
07:09
and the service would be when the car senses
148
429076
2334
Iar utilitatea apare când mașina simte că persoana cade în poziția aceea
07:11
that the person slumps into that position,
149
431410
3437
07:14
automatically knows, hey, set an internal alarm
150
434847
3994
și știe automat să pornească o alarmă internă,
07:18
that would vibrate the steering wheel, honk inside
151
438841
2025
să vibreze volanul sau să claxoneze înăuntru, să spună:
07:20
to say, "Hey, wake up,
152
440866
1721
„Trezește-te, fii mai atent la drum!”
07:22
pay more attention to the road."
153
442587
1904
07:24
These are the sorts of things we can do
154
444491
1853
Astfel de lucruri putem face datificând mai multe aspecte ale vieții.
07:26
when we datafy more aspects of our lives.
155
446344
2821
07:29
So what is the value of big data?
156
449165
3675
Deci ce valoare au datele masive?
07:32
Well, think about it.
157
452840
2190
Ia gândiți-vă. Avem mai multe informații.
07:35
You have more information.
158
455030
2412
07:37
You can do things that you couldn't do before.
159
457442
3341
Putem face lucruri pe care nu le puteam face înainte.
07:40
One of the most impressive areas
160
460783
1676
Una din aplicațiile impresionante ale acestei noțiuni
07:42
where this concept is taking place
161
462459
1729
07:44
is in the area of machine learning.
162
464188
3307
e în domeniul învățării automate.
07:47
Machine learning is a branch of artificial intelligence,
163
467495
3077
Învățarea automată e o ramură a inteligenței artificiale
07:50
which itself is a branch of computer science.
164
470572
3378
care ea însăși e o ramură a informaticii.
07:53
The general idea is that instead of
165
473950
1543
Pe scurt, în loc să instruim un calculator ce să facă,
07:55
instructing a computer what do do,
166
475493
2117
07:57
we are going to simply throw data at the problem
167
477610
2620
bombardăm problema cu informații
08:00
and tell the computer to figure it out for itself.
168
480230
3206
și-i cerem calculatorului să descopere singur.
08:03
And it will help you understand it
169
483436
1777
Veți înțelege mai bine dacă veți vedea începuturile.
08:05
by seeing its origins.
170
485213
3552
08:08
In the 1950s, a computer scientist
171
488765
2388
În anii 1950, un informatician de la IBM pe nume Arthur Samuel,
08:11
at IBM named Arthur Samuel liked to play checkers,
172
491153
3592
căruia îi plăcea să joace dame,
08:14
so he wrote a computer program
173
494745
1402
a scris un program pentru a putea juca împotriva calculatorului.
08:16
so he could play against the computer.
174
496147
2813
08:18
He played. He won.
175
498960
2711
A jucat. A câștigat.
08:21
He played. He won.
176
501671
2103
A jucat. A câștigat.
08:23
He played. He won,
177
503774
3015
A jucat. A câștigat.
08:26
because the computer only knew
178
506789
1778
Pentru că tot ce știa calculatorul erau mutările permise.
08:28
what a legal move was.
179
508567
2227
08:30
Arthur Samuel knew something else.
180
510794
2087
Arthur Samuel mai știa altceva.
08:32
Arthur Samuel knew strategy.
181
512881
4629
Arthur Samuel mai știa
și strategie.
08:37
So he wrote a small sub-program alongside it
182
517510
2396
Atunci a adăugat un mic sub-program care să opereze în fundal.
08:39
operating in the background, and all it did
183
519906
1974
08:41
was score the probability
184
521880
1817
Tot ce făcea era să calculeze probabilitatea ca o configurație dată
08:43
that a given board configuration would likely lead
185
523697
2563
să conducă la o tablă de joc câștigătoare sau necâștigătoare
08:46
to a winning board versus a losing board
186
526260
2910
08:49
after every move.
187
529170
2508
după fiecare mutare.
08:51
He plays the computer. He wins.
188
531678
3150
Joacă cu calculatorul. Câștigă.
08:54
He plays the computer. He wins.
189
534828
2508
Joacă cu calculatorul. Câștigă.
08:57
He plays the computer. He wins.
190
537336
3731
Joacă cu calculatorul. Câștigă.
09:01
And then Arthur Samuel leaves the computer
191
541067
2277
Atunci Arthur Samuel lasă calculatorul să joace singur.
09:03
to play itself.
192
543344
2227
09:05
It plays itself. It collects more data.
193
545571
3509
Joacă singur, adună mai multe date.
09:09
It collects more data. It increases the accuracy of its prediction.
194
549080
4309
Adună mai multe date, îi crește precizia predicției.
09:13
And then Arthur Samuel goes back to the computer
195
553389
2104
Atunci Arthur Samuel se întoarce la calculator și joacă cu el, și pierde.
09:15
and he plays it, and he loses,
196
555493
2318
09:17
and he plays it, and he loses,
197
557811
2069
Și joacă, și pierde.
09:19
and he plays it, and he loses,
198
559880
2047
Și joacă, și pierde.
09:21
and Arthur Samuel has created a machine
199
561927
2599
Și Arthur Samuel a creat o mașină
09:24
that surpasses his ability in a task that he taught it.
200
564526
6288
care îl depășește la o sarcină în care el a inițiat-o.
09:30
And this idea of machine learning
201
570814
2498
Această idee de învățare automată se răspândește peste tot.
09:33
is going everywhere.
202
573312
3927
09:37
How do you think we have self-driving cars?
203
577239
3149
Cum credeți că avem mașini care se conduc singure?
09:40
Are we any better off as a society
204
580388
2137
E societatea mai capabilă să pună toate regulile rutiere într-un software?
09:42
enshrining all the rules of the road into software?
205
582525
3285
09:45
No. Memory is cheaper. No.
206
585810
2598
Nu.
E mai ieftină memoria? Nu.
09:48
Algorithms are faster. No. Processors are better. No.
207
588408
3994
Sunt mai rapizi algoritmii? Nu.
Sunt mai bune procesoarele? Nu.
09:52
All of those things matter, but that's not why.
208
592402
2772
Toate astea contează, dar nu sunt ele motivul.
09:55
It's because we changed the nature of the problem.
209
595174
3141
Motivul e că am schimbat natura problemei.
09:58
We changed the nature of the problem from one
210
598315
1530
Am trecut de la a-i spune deschis și explicit calculatorului cum să conducă
09:59
in which we tried to overtly and explicitly
211
599845
2245
10:02
explain to the computer how to drive
212
602090
2581
10:04
to one in which we say,
213
604671
1316
la a-i spune:
10:05
"Here's a lot of data around the vehicle.
214
605987
1876
„Iată o mulțime de date despre vehicul. Descurcă-te.
10:07
You figure it out.
215
607863
1533
10:09
You figure it out that that is a traffic light,
216
609396
1867
Prinde-te singur că ăla e un semafor, că semaforul e roșu și nu verde,
10:11
that that traffic light is red and not green,
217
611263
2081
10:13
that that means that you need to stop
218
613344
2014
că asta înseamnă să te oprești și nu să continui”.
10:15
and not go forward."
219
615358
3083
10:18
Machine learning is at the basis
220
618441
1518
Învățarea automată e la baza multor lucruri pe care le facem online:
10:19
of many of the things that we do online:
221
619959
1991
10:21
search engines,
222
621950
1857
motoare de căutare,
10:23
Amazon's personalization algorithm,
223
623807
3801
algoritmul de personalizare de la Amazon,
10:27
computer translation,
224
627608
2212
traduceri computerizate,
10:29
voice recognition systems.
225
629820
4290
sisteme de recunoaștere a vocii.
10:34
Researchers recently have looked at
226
634110
2835
Cercetătorii s-au interesat recent de problema biopsiilor,
10:36
the question of biopsies,
227
636945
3195
10:40
cancerous biopsies,
228
640140
2767
a biopsiilor de cancer.
10:42
and they've asked the computer to identify
229
642907
2315
Au cerut calculatorului să identifice,
10:45
by looking at the data and survival rates
230
645222
2471
analizând datele și procentajul de supraviețuire,
10:47
to determine whether cells are actually
231
647693
4667
să determine dacă într-adevăr celulele
10:52
cancerous or not,
232
652360
2544
sunt canceroase sau nu.
10:54
and sure enough, when you throw the data at it,
233
654904
1778
Și bineînțeles, folosind date și un algoritm de învățare automată,
10:56
through a machine-learning algorithm,
234
656682
2047
10:58
the machine was able to identify
235
658729
1877
mașina a reușit să identifice cele 12 semne tipice care prezic optim
11:00
the 12 telltale signs that best predict
236
660606
2262
11:02
that this biopsy of the breast cancer cells
237
662868
3299
că biopsia unor celule canceroase de sân e într-adevăr canceroasă.
11:06
are indeed cancerous.
238
666167
3218
11:09
The problem: The medical literature
239
669385
2498
Problema?
11:11
only knew nine of them.
240
671883
2789
Literatura medicală cunoștea numai nouă dintre ele.
11:14
Three of the traits were ones
241
674672
1800
Trei caracteristici nu erau între cele care trebuiau verificate,
11:16
that people didn't need to look for,
242
676472
2975
11:19
but that the machine spotted.
243
679447
5531
dar mașina le-a detectat.
11:24
Now, there are dark sides to big data as well.
244
684978
5925
Datele masive au și părți negative.
11:30
It will improve our lives, but there are problems
245
690903
2074
Ne vor îmbunătăți viața, dar sunt probleme de care trebuie să fim conștienți.
11:32
that we need to be conscious of,
246
692977
2640
11:35
and the first one is the idea
247
695617
2623
Prima e ideea
11:38
that we may be punished for predictions,
248
698240
2686
că s-ar putea să fim pedepsiți pentru predicții,
11:40
that the police may use big data for their purposes,
249
700926
3870
că poliția ar putea folosi datele masive pentru propriile scopuri,
11:44
a little bit like "Minority Report."
250
704796
2351
ca în filmul „Raport Special”.
11:47
Now, it's a term called predictive policing,
251
707147
2441
Se numește „poliție preventivă” sau „criminologie algoritmică”,
11:49
or algorithmic criminology,
252
709588
2363
11:51
and the idea is that if we take a lot of data,
253
711951
2036
iar ideea e că folosind multe date, de exemplu locul crimelor trecute,
11:53
for example where past crimes have been,
254
713987
2159
11:56
we know where to send the patrols.
255
716146
2543
știm unde să trimitem patrulele.
11:58
That makes sense, but the problem, of course,
256
718689
2115
Are logică, dar desigur problema e că nu se va limita la localizare,
12:00
is that it's not simply going to stop on location data,
257
720804
4544
12:05
it's going to go down to the level of the individual.
258
725348
2959
ci va ajunge la nivelul individului.
12:08
Why don't we use data about the person's
259
728307
2250
De ce să nu folosim date din foaia matricolă de liceu?
12:10
high school transcript?
260
730557
2228
12:12
Maybe we should use the fact that
261
732785
1561
Poate ar trebui să ținem cont dacă sunt șomeri, ce risc de credit au,
12:14
they're unemployed or not, their credit score,
262
734346
2028
12:16
their web-surfing behavior,
263
736374
1552
ce comportament au pe internet, dacă se culcă noaptea târziu.
12:17
whether they're up late at night.
264
737926
1878
12:19
Their Fitbit, when it's able to identify biochemistries,
265
739804
3161
Fitbitul lor, când va decela biochimia, va arăta că au gânduri agresive.
12:22
will show that they have aggressive thoughts.
266
742965
4236
12:27
We may have algorithms that are likely to predict
267
747201
2221
Poate vom avea algoritmi care să prezică ce avem de gând să facem
12:29
what we are about to do,
268
749422
1633
12:31
and we may be held accountable
269
751055
1244
și poate vom fi trași la răspundere înainte de a face ceva.
12:32
before we've actually acted.
270
752299
2590
12:34
Privacy was the central challenge
271
754889
1732
Intimitatea era problema centrală în epoca datelor puține.
12:36
in a small data era.
272
756621
2880
12:39
In the big data age,
273
759501
2149
În epoca datelor masive problema va fi
12:41
the challenge will be safeguarding free will,
274
761650
4523
de a proteja liberul arbitru,
12:46
moral choice, human volition,
275
766173
3779
alegerea morală,
voința umană,
12:49
human agency.
276
769952
3068
factorul uman.
12:54
There is another problem:
277
774540
2225
Mai e o problemă.
12:56
Big data is going to steal our jobs.
278
776765
3556
Datele masive ne vor fura locurile de muncă.
13:00
Big data and algorithms are going to challenge
279
780321
3512
Datele masive și algoritmii vor pune la încercare
13:03
white collar, professional knowledge work
280
783833
3061
munca funcționarilor și a profesioniștilor în secolul XXI
13:06
in the 21st century
281
786894
1653
13:08
in the same way that factory automation
282
788547
2434
așa cum automatizarea fabricilor și linia de asamblare
13:10
and the assembly line
283
790981
2189
13:13
challenged blue collar labor in the 20th century.
284
793170
3026
au pus la încercare muncitorimea în secolul XX.
13:16
Think about a lab technician
285
796196
2092
Să luăm un laborant
13:18
who is looking through a microscope
286
798288
1409
care se uită cu microscopul la o biopsie de cancer
13:19
at a cancer biopsy
287
799697
1624
13:21
and determining whether it's cancerous or not.
288
801321
2637
să vadă dacă e canceroasă sau nu.
13:23
The person went to university.
289
803958
1972
Omul a fost la facultate.
13:25
The person buys property.
290
805930
1430
Cumpără proprietate.
13:27
He or she votes.
291
807360
1741
Votează.
13:29
He or she is a stakeholder in society.
292
809101
3666
E acționar în societate.
13:32
And that person's job,
293
812767
1394
Omul acesta și o întreagă armată de profesioniști ca el
13:34
as well as an entire fleet
294
814161
1609
13:35
of professionals like that person,
295
815770
1969
13:37
is going to find that their jobs are radically changed
296
817739
3150
își vor găsi slujbele schimbate radical sau chiar complet eliminate.
13:40
or actually completely eliminated.
297
820889
2357
13:43
Now, we like to think
298
823246
1284
Ne place să credem că tehnologia creează slujbe pentru o vreme
13:44
that technology creates jobs over a period of time
299
824530
3187
13:47
after a short, temporary period of dislocation,
300
827717
3465
după o perioadă scurtă de dislocare.
13:51
and that is true for the frame of reference
301
831182
1941
E adevărat în sistemul de referință cu care trăim: revoluția industrială.
13:53
with which we all live, the Industrial Revolution,
302
833123
2142
13:55
because that's precisely what happened.
303
835265
2328
Pentru că exact așa s-a întâmplat.
13:57
But we forget something in that analysis:
304
837593
2333
Dar uităm ceva în analiza aceasta:
13:59
There are some categories of jobs
305
839926
1830
anumite categorii de locuri de muncă sunt eliminate total și nu se mai întorc.
14:01
that simply get eliminated and never come back.
306
841756
3420
14:05
The Industrial Revolution wasn't very good
307
845176
2004
Revoluția industrială nu prea a fost bună dacă erai un cal.
14:07
if you were a horse.
308
847180
4002
14:11
So we're going to need to be careful
309
851182
2055
Deci va trebui să avem grijă,
14:13
and take big data and adjust it for our needs,
310
853237
3514
să luăm datele masive și să le adaptăm la nevoile noastre,
14:16
our very human needs.
311
856751
3185
la nevoile noastre foarte omenești.
14:19
We have to be the master of this technology,
312
859936
1954
Trebuie să fim stăpânul tehnologiei, nu servitorul ei.
14:21
not its servant.
313
861890
1656
14:23
We are just at the outset of the big data era,
314
863546
2958
Era datelor masive abia acum începe
14:26
and honestly, we are not very good
315
866504
3150
și, sincer, nu prea ne descurcăm cu datele pe care le putem colecta acum.
14:29
at handling all the data that we can now collect.
316
869654
4207
14:33
It's not just a problem for the National Security Agency.
317
873861
3330
Nu e doar o problemă pentru Agenția de Securitate Națională.
14:37
Businesses collect lots of data, and they misuse it too,
318
877191
3038
Firmele adună o mulțime de date și mai abuzează de ele.
14:40
and we need to get better at this, and this will take time.
319
880229
3667
Trebuie să avansăm, iar asta durează.
14:43
It's a little bit like the challenge that was faced
320
883896
1822
E cam ca problema pe care o avea omul primitiv cu focul.
14:45
by primitive man and fire.
321
885718
2407
14:48
This is a tool, but this is a tool that,
322
888125
1885
E o unealtă, dar e o unealtă care, dacă nu suntem atenți, ne va arde.
14:50
unless we're careful, will burn us.
323
890010
3559
14:56
Big data is going to transform how we live,
324
896008
3120
Datele masive ne vor transforma viața, munca și gândirea.
14:59
how we work and how we think.
325
899128
2801
15:01
It is going to help us manage our careers
326
901929
1889
Ne vor ajuta să ne ocupăm de cariere și să trăim o viață plină de satisfacții,
15:03
and lead lives of satisfaction and hope
327
903818
3634
de speranță, de fericire și de sănătate.
15:07
and happiness and health,
328
907452
2992
15:10
but in the past, we've often looked at information technology
329
910444
3306
Dar în trecut ne-am uitat adesea la tehnologia informației
15:13
and our eyes have only seen the T,
330
913750
2208
și ochii noștri au văzut doar T-ul, tehnologia, hardware-ul,
15:15
the technology, the hardware,
331
915958
1686
15:17
because that's what was physical.
332
917644
2262
pentru că asta era partea fizică.
15:19
We now need to recast our gaze at the I,
333
919906
2924
Acum trebuie să ne aruncăm privirea pe I, informația, care e mai puțin vizibilă,
15:22
the information,
334
922830
1380
15:24
which is less apparent,
335
924210
1373
15:25
but in some ways a lot more important.
336
925583
4109
dar în unele privințe mult mai importantă.
15:29
Humanity can finally learn from the information
337
929692
3465
Omenirea poate în sfârșit învăța din informațiile pe care le poate colecta,
15:33
that it can collect,
338
933157
2418
15:35
as part of our timeless quest
339
935575
2115
în încercarea noastră dintotdeauna de a înțelege lumea și locul nostru în ea.
15:37
to understand the world and our place in it,
340
937690
3159
15:40
and that's why big data is a big deal.
341
940849
5631
De aceea datele masive sunt mare scofală.
15:46
(Applause)
342
946480
3568
(Aplauze)
Despre acest site

Acest site vă va prezenta videoclipuri de pe YouTube care sunt utile pentru a învăța limba engleză. Veți vedea lecții de engleză predate de profesori de top din întreaga lume. Faceți dublu clic pe subtitrările în limba engleză afișate pe fiecare pagină video pentru a reda videoclipul de acolo. Subtitrările se derulează în sincron cu redarea videoclipului. Dacă aveți comentarii sau solicitări, vă rugăm să ne contactați folosind acest formular de contact.

https://forms.gle/WvT1wiN1qDtmnspy7