Big Data - Tim Smith

589,741 views ・ 2013-05-03

TED-Ed


A videó lejátszásához kattintson duplán az alábbi angol feliratokra.

00:00
Translator: Andrea McDonough Reviewer: Jessica Ruby
0
0
7000
Fordító: Eva Ballago Lektor: Zsófia Herczeg
00:31
Big data is an elusive concept.
1
31085
2762
A big data fogalmát nehéz meghatározni.
00:35
It represents an amount of digital information,
2
35987
2688
Olyan mennyiségű digitális információt jelent,
00:38
which is uncomfortable to store,
3
38675
2170
melyet kényelmetlen tárolni,
00:40
transport,
4
40845
1128
00:41
or analyze.
5
41973
1878
továbbítani
és elemezni.
00:43
Big data is so voluminous
6
43851
1915
A big data olyan terjedelmes,
00:45
that it overwhelms the technologies of the day
7
45766
2708
hogy kifog a jelenlegi technológiákon,
00:48
and challenges us to create the next generation
8
48474
2425
és arra ösztönöz,
hogy adattároló eszközök és technikák új generációját hozzuk létre.
00:50
of data storage tools and techniques.
9
50899
3105
00:59
So, big data isn't new.
10
59557
1779
A big data nem újdonság.
01:01
In fact, physicists at CERN have been rangling
11
61336
2358
A CERN, az Európai Nukleáris Kutatási Szervezet fizikusai
01:03
with the challenge of their ever-expanding big data for decades.
12
63694
4399
évtizedek óta küzdenek folyamatosan növekvő adatmennyiségükkel.
01:09
Fifty years ago, CERN's data could be stored
13
69431
2323
50 évvel ezelőtt a CERN adatai
01:11
in a single computer.
14
71754
1752
elfértek egyetlen számítógépen.
01:13
OK, so it wasn't your usual computer,
15
73506
2154
Igaz, ez nem szokványos számítógép volt,
01:15
this was a mainframe computer
16
75660
1417
hanem egy nagyszámítógép,
01:17
that filled an entire building.
17
77077
2310
mely egy egész épületet elfoglalt.
01:21
To analyze the data,
18
81494
1169
A világ minden sarkából érkeztek fizikusok,
01:22
physicists from around the world traveled to CERN
19
82663
2948
hogy a hatalmas géphez csatlakozva elemezzék az adatokat.
01:25
to connect to the enormous machine.
20
85611
3026
01:31
In the 1970's, our ever-growing big data
21
91075
2853
Az 1970-es években az egyre növekvő adathalmazt
01:33
was distributed across different sets of computers,
22
93928
2750
több számítógépcsoport között osztották szét,
01:36
which mushroomed at CERN.
23
96678
2030
melyekből egyre több lett a CERN-nél.
01:38
Each set was joined together
24
98708
1442
A csoportok gépeit külön erre a célra létrehozott
01:40
in dedicated, homegrown networks.
25
100150
2528
saját fejlesztésű hálózatok kötötték össze.
01:42
But physicists collaborated without regard
26
102678
1786
A fizikusok együttműködése azonban
01:44
for the boundaries between sets,
27
104464
1949
nem a gépcsoportok határain belül történt,
01:46
hence needed to access data on all of these.
28
106413
2889
így az adatokat minden gépen el kellett érniük.
01:49
So, we bridged the independent networks together
29
109302
1985
Ezért az egymástól független hálózatokat összekapcsolták:
01:51
in our own CERNET.
30
111287
3092
így született a CERNET.
01:54
In the 1980's, islands of similar networks
31
114379
2848
Az 1980-as években ezekhez hasonló,
de eltérően kommunikáló hálózatok bukkantak fel
01:57
speaking different dialects
32
117227
1544
01:58
sprung up all over Europe and the States,
33
118771
2540
szerte Európában és az Államokban,
02:01
making remote access possible but torturous.
34
121311
3091
melyek bár nehézkesek voltak, lehetővé tették a távoli elérést.
02:04
To make it easy for our physicists across the world
35
124402
2144
Ahhoz, hogy a fizikusok bárhol a világon
02:06
to access the ever-expanding big data
36
126546
2405
könnyen, utazás nélkül elérjék a CERN-nél tárolt,
02:08
stored at CERN without traveling,
37
128951
1793
folyamatosan gyarapodó big datát,
02:10
the networks needed to be talking
38
130744
1299
a hálózatoknak ugyanazt a nyelvet kellett használniuk.
02:12
with the same language.
39
132043
1370
02:13
We adopted the fledgling internet working standard from the States,
40
133413
3795
Átvettük a gyerekcipőben járó internetszabványt az Államokból,
02:17
followed by the rest of Europe,
41
137208
1376
melyet aztán Európa más részein is használtak,
02:18
and we established the principal link at CERN
42
138584
2168
és 1989-ben létrehoztuk a CERN-nél
02:20
between Europe and the States in 1989,
43
140752
2503
az első kapcsolatot Európa és az Egyesült Államok között –
02:23
and the truly global internet took off!
44
143255
2786
ezzel elindult a valóban globális internet.
02:28
Physicists could easily then access
45
148580
1791
A fizikusok így már a világon bárhonnan
02:30
the terabytes of big data
46
150371
1812
könnyen elérhették a több terabájtnyi távoli adatmennyiséget,
02:32
remotely from around the world,
47
152183
1663
02:33
generate results,
48
153846
1379
számításokat végezhettek,
02:35
and write papers in their home institutes.
49
155225
2295
és tanulmányokat írhattak saját intézményükben.
02:37
Then, they wanted to share their findings
50
157520
1501
Ezután meg akarták osztani eredményeiket kollégáikkal.
02:39
with all their colleagues.
51
159021
1792
02:40
To make this information sharing easy,
52
160813
1603
Az információ megosztásának megkönnyítésére
02:42
we created the web in the early 1990's.
53
162416
2942
az 1990-es évek elején létrehoztuk a webet.
02:45
Physicists no longer needed to know
54
165358
1838
A fizikusoknak már nem kellett tudniuk,
02:47
where the information was stored
55
167196
1637
hol tárolják az információt ahhoz,
02:48
in order to find it and access it on the web,
56
168833
2569
hogy megtalálják és elérjék a weben.
02:51
an idea which caught on across the world
57
171402
2134
Ez az ötlet az egész világon elterjedt,
02:53
and has transformed the way we communicate
58
173536
2376
és megváltoztatta mindennapi kommunikációnkat.
02:55
in our daily lives.
59
175912
1668
03:00
During the early 2000's,
60
180226
1407
A 2000-es évek elején
03:01
the continued growth of our big data
61
181633
1990
az adatmennyiség további növekedése miatt
03:03
outstripped our capability to analyze it at CERN,
62
183623
3291
már nem voltunk képesek azt a CERN-ben elemezni,
03:06
despite having buildings full of computers.
63
186914
3585
annak ellenére, hogy épületeket töltöttünk meg számítógépekkel.
03:10
We had to start distributing the petabytes of data
64
190499
2306
A több petabájt mennyiségű adatot el kellett kezdenünk szétszórni
03:12
to our collaborating partners
65
192805
1582
együttműködő partnereink között,
03:14
in order to employ local computing and storage
66
194387
2752
hogy így több száz intézmény gépeit
03:17
at hundreds of different institutes.
67
197139
2835
használhassuk tárolásra.
03:19
In order to orchestrate these interconnected resources
68
199974
2295
A változatos technológiákat használó,
03:22
with their diverse technologies,
69
202269
2044
egymással összekötött erőforrások összehangolására
03:24
we developed a computing grid,
70
204313
1751
kifejlesztettünk egy számítógéphálózatot,
03:26
enabling the seamless sharing
71
206064
1576
mely lehetővé tette a számítógépes erőforrások
03:27
of computing resources around the globe.
72
207640
2428
zavartalan megosztását világszerte.
03:30
This relies on trust relationships and mutual exchange.
73
210068
4391
Ennek alapja a bizalom és a kölcsönös információcsere.
03:34
But this grid model could not be transferred
74
214459
2293
De ezt a hálózati modellt nem lehetett könnyen átültetni a közösségen kívülre,
03:36
out of our community so easily,
75
216752
2284
ahol nem mindenki rendelkezik megosztható erőforrásokkal,
03:39
where not everyone has resources to share
76
219036
2294
03:41
nor could companies be expected
77
221330
1876
és a vállalatoktól sem lehet elvárni
03:43
to have the same level of trust.
78
223206
2753
ugyanazt a mértékű bizalmat.
03:45
Instead, an alternative, more business-like approach
79
225959
2295
Ehelyett egy másik, az erőforrások igény szerinti hozzáférésén alapuló
03:48
for accessing on-demand resources
80
228254
1836
üzleti megközelítés virágzik mostanság,
03:50
has been flourishing recently,
81
230090
1708
03:51
called cloud computing,
82
231798
1668
az ún. felhőalapú számítástechnika,
03:53
which other communities are now exploiting
83
233466
1876
melyet más közösségek is kiaknáznak
03:55
to analyzing their big data.
84
235342
2000
saját big datájuk elemzésére.
03:57
It might seem paradoxical for a place like CERN,
85
237342
2987
Ellentmondásosnak tűnhet hogy egy olyan hely, mint a CERN,
04:00
a lab focused on the study
86
240329
1571
mely egy olyan laboratórium,
04:01
of the unimaginably small building blocks of matter,
87
241900
3171
ahol az anyag elképzelhetetlenül kicsi építőelemeit tanulmányozzák,
04:05
to be the source of something as big as big data.
88
245071
3377
valami olyan nagy forrása, mint a big data.
04:08
But the way we study the fundamental particles,
89
248448
2082
De az elemi részecskék
04:10
as well as the forces by which they interact,
90
250530
2613
és az azokat kölcsönhatásba hozó erők tanulmányozásának része,
04:13
involves creating them fleetingly,
91
253143
2103
hogy csak pillanatokra tudjuk ezeket létrehozni.
04:15
colliding protons in our accelerators
92
255246
2368
Mikor a protonok összeütköznek a gyorsítóban,
04:17
and capturing a trace of them
93
257614
1427
a nyomukról felvételt készítünk, miközben közel fénysebességgel elillannak.
04:19
as they zoom off near light speed.
94
259041
2273
04:21
To see those traces,
95
261314
994
Hogy lássuk a nyomokat,
04:22
our detector, with 150 million sensors,
96
262308
3448
a 150 millió szenzoros érzékelőnk egy hatalmas 3D kameraként működik,
04:25
acts like a really massive 3-D camera,
97
265756
2475
04:28
taking a picture of each collision event -
98
268231
2110
és minden összeütközésről képet készít –
04:30
that's up to 14 millions times per second.
99
270341
2550
14 milliót másodpercenként.
04:32
That makes a lot of data.
100
272891
2533
Ezzel rengeteg adatot hozunk létre.
04:37
But if big data has been around for so long,
101
277194
2159
De ha a big data ilyen régóta van jelen,
04:39
why do we suddenly keep hearing about it now?
102
279353
2627
miért csak most hallunk folyton róla?
04:41
Well, as the old metaphor explains,
103
281980
1711
Nos, ahogy a régi mondás tartja,
04:43
the whole is greater than the sum of its parts,
104
283691
2788
az egész több, mint a részek összessége,
04:46
and this is no longer just science that is exploiting this.
105
286479
3777
és ezt már nem csak a tudomány aknázza ki.
04:50
The fact that we can derive more knowledge
106
290256
1604
A felismerés, hogy többet tudhatunk meg,
04:51
by joining related information together
107
291860
2330
ha összefüggő információkat összekapcsolunk,
04:54
and spotting correlations
108
294190
1551
és további összefüggéseket állapítunk meg,
04:55
can inform and enrich numerous aspects of everyday life,
109
295741
3391
információval szolgálhat és gazdagíthat a mindennapok számos területén:
04:59
either in real time,
110
299132
1028
valós időben, pl. a közlekedés vagy a pénzügyi helyzet esetében,
05:00
such as traffic or financial conditions,
111
300160
2291
05:02
in short-term evolutions,
112
302451
1755
rövid távú változásoknál,
05:04
such as medical or meteorological,
113
304206
2127
pl. az orvostudományban vagy a meteorológiában,
05:06
or in predictive situations,
114
306333
1725
vagy előrejelzéseknél,
05:08
such as business, crime, or disease trends.
115
308058
3020
például üzleti, bűnözési vagy betegség trendeknél.
05:13
Virtually every field is turning to gathering big data,
116
313369
3063
Szinte minden területen elkezdtek nagy mennyiségű adatot gyűjteni,
05:16
with mobile sensor networks spanning the globe,
117
316432
2337
a világot átívelő mobilszenzoros hálózatok segítségével:
05:18
cameras on the ground and in the air,
118
318769
2287
kamerákkal a földön és a levegőben,
05:21
archives storing information published on the web,
119
321056
3011
archívumokkal, melyek a weben megjelent információkat tárolják,
05:24
and loggers capturing the activities
120
324067
2129
és naplókkal,
melyek a világ internethasználóinak tevékenységét tárolják.
05:26
of Internet citizens the world over.
121
326196
2699
05:28
The challenge is on to invent new tools and techniques
122
328895
2591
Itt a kihívás, hogy új eszközöket és technikákat találjunk,
05:31
to mine these vast stores,
123
331486
1953
hogy kiaknázhassuk ezeket az adatállományokat,
05:33
to inform decision making,
124
333439
1801
hogy felhasználhassuk döntéshozatalhoz,
05:35
to improve medical diagnosis,
125
335240
2256
hogy fejlesszük az orvosi diagnosztikát,
05:37
and otherwise to answer needs and desires
126
337496
2210
és egyáltalán megfeleljünk a társadalom jövőbeli szükségleteinek és vágyainak
05:39
of tomorrow's society in ways that are unimagined today.
127
339706
3957
oly módon, ami ma még elképzelhetetlen.

Original video on YouTube.com
Erről a weboldalról

Ez az oldal olyan YouTube-videókat mutat be, amelyek hasznosak az angol nyelvtanuláshoz. A világ minden tájáról származó, kiváló tanárok által tartott angol leckéket láthatsz. Az egyes videók oldalán megjelenő angol feliratokra duplán kattintva onnan játszhatja le a videót. A feliratok a videó lejátszásával szinkronban gördülnek. Ha bármilyen észrevétele vagy kérése van, kérjük, lépjen kapcsolatba velünk ezen a kapcsolatfelvételi űrlapon.

https://forms.gle/WvT1wiN1qDtmnspy7