Big Data - Tim Smith

빅 데이터 탐구 - 팀 스미스(Tim Smith)

589,741 views ・ 2013-05-03

TED-Ed


아래 영문자막을 더블클릭하시면 영상이 재생됩니다.

00:00
Translator: Andrea McDonough Reviewer: Jessica Ruby
0
0
7000
번역: Gemma Lee 검토: Sujin Byeon
00:31
Big data is an elusive concept.
1
31085
2762
빅 데이터는 어려운 개념입니다.
00:35
It represents an amount of digital information,
2
35987
2688
빅 데이터는 디지털 정보의 양을 나타내는데,
00:38
which is uncomfortable to store,
3
38675
2170
그 양은 저장하기에도,
00:40
transport,
4
40845
1128
전송하기에도,
00:41
or analyze.
5
41973
1878
분석하기도 힘들 만큼 큽니다.
00:43
Big data is so voluminous
6
43851
1915
빅 데이터는 너무 커서
00:45
that it overwhelms the technologies of the day
7
45766
2708
오늘날의 기술로 감당하기 어렵고
00:48
and challenges us to create the next generation
8
48474
2425
데이터를 저장하는 도구와 기술을
00:50
of data storage tools and techniques.
9
50899
3105
새롭게 만들어야 합니다.
00:59
So, big data isn't new.
10
59557
1779
그런데 빅 데이터는 새로운 것이 아닙니다.
01:01
In fact, physicists at CERN have been rangling
11
61336
2358
사실 유럽 원자핵 공동연구소(CERN)의 물리학자들은
01:03
with the challenge of their ever-expanding big data for decades.
12
63694
4399
계속 늘어만가는 큰 데이터를 처리하기 위해 수십년동안 도전해 왔습니다.
01:09
Fifty years ago, CERN's data could be stored
13
69431
2323
50년 전 유럽 원자핵 공동연구소(CERN)의 자료는
01:11
in a single computer.
14
71754
1752
컴퓨터 1 대에 저장할 수 있었습니다.
01:13
OK, so it wasn't your usual computer,
15
73506
2154
하지만 그건 보통 컴퓨터가 아니라
01:15
this was a mainframe computer
16
75660
1417
건물 전체를 다 채우는
01:17
that filled an entire building.
17
77077
2310
대형 컴퓨터였습니다.
01:21
To analyze the data,
18
81494
1169
데이터를 분석하기 위해서
01:22
physicists from around the world traveled to CERN
19
82663
2948
전세계의 과학자들은 CERN에 와서
01:25
to connect to the enormous machine.
20
85611
3026
대형 컴퓨터에 접속했습니다.
01:31
In the 1970's, our ever-growing big data
21
91075
2853
1970년대에 계속 늘어만 가는 데이터는
01:33
was distributed across different sets of computers,
22
93928
2750
서로 다른 컴퓨터 무리로 분산되었는데
01:36
which mushroomed at CERN.
23
96678
2030
각각의 무리는 모두 CERN에 몰려 있었습니다.
01:38
Each set was joined together
24
98708
1442
하나의 무리는
01:40
in dedicated, homegrown networks.
25
100150
2528
자체적인 네트워크 상에서 정밀하게 연결되었습니다.
01:42
But physicists collaborated without regard
26
102678
1786
하지만 물리학자들은 무리 사이의 경계를
01:44
for the boundaries between sets,
27
104464
1949
넘어서 일하기 때문에
01:46
hence needed to access data on all of these.
28
106413
2889
모든 데이터에 접속해야 할 필요가 있었습니다.
01:49
So, we bridged the independent networks together
29
109302
1985
그래서 독립된 네크워크를 함께 연결해
01:51
in our own CERNET.
30
111287
3092
자체적인 CERNET를 만들었습니다.
01:54
In the 1980's, islands of similar networks
31
114379
2848
1980년대에는 서로 다른 언어를 사용하는
01:57
speaking different dialects
32
117227
1544
비슷한 네트워크의 섬들이
01:58
sprung up all over Europe and the States,
33
118771
2540
유럽과 미국 전역에 생겨나
02:01
making remote access possible but torturous.
34
121311
3091
원거리 접속을 가능하게 했지만 고생이 많았습니다.
02:04
To make it easy for our physicists across the world
35
124402
2144
전세계의 과학자들이 CERN에 저장되어
02:06
to access the ever-expanding big data
36
126546
2405
계속 늘어만 가는 데이터에 쉽게 접속하게 하려면,
02:08
stored at CERN without traveling,
37
128951
1793
CERN에 오지 않고도 접속하려면,
02:10
the networks needed to be talking
38
130744
1299
네트워크끼리 같은 언어를
02:12
with the same language.
39
132043
1370
사용할 필요가 있습니다.
02:13
We adopted the fledgling internet working standard from the States,
40
133413
3795
우리는 미국에서 나온 초기 단계의 인터넷 표준을 적용했고
02:17
followed by the rest of Europe,
41
137208
1376
나머지 유럽이 그 뒤를 따랐습니다.
02:18
and we established the principal link at CERN
42
138584
2168
주된 링크를 CERN에 세웠고
02:20
between Europe and the States in 1989,
43
140752
2503
1989년에 유럽과 미국 사이에 링크를 세워
02:23
and the truly global internet took off!
44
143255
2786
진정한 전세계의 인터넷이 시작되었죠!
02:28
Physicists could easily then access
45
148580
1791
그제서야 물리학자들은
02:30
the terabytes of big data
46
150371
1812
테라바이트에 달하는 큰 데이터에
02:32
remotely from around the world,
47
152183
1663
전세계 어디서나 접속할 수 있었고
02:33
generate results,
48
153846
1379
결과를 볼 수 있고
02:35
and write papers in their home institutes.
49
155225
2295
그들이 속한 기관에서 논문을 쓸 수 있었습니다.
02:37
Then, they wanted to share their findings
50
157520
1501
이후 과학자들이 알아낸 결과를
02:39
with all their colleagues.
51
159021
1792
동료들과 공유하고 싶어했습니다.
02:40
To make this information sharing easy,
52
160813
1603
이런 정보를 쉽게 공유하기 위해서
02:42
we created the web in the early 1990's.
53
162416
2942
1990년대 초반에 웹을 만들었습니다.
02:45
Physicists no longer needed to know
54
165358
1838
물리학자들은 더이상
02:47
where the information was stored
55
167196
1637
정보가 어디에 저장되었는지 알 필요가 없이
02:48
in order to find it and access it on the web,
56
168833
2569
웹에서 찾아 접속하면 됩니다.
02:51
an idea which caught on across the world
57
171402
2134
이 아이디어는 전세계에서 인기를 얻었고
02:53
and has transformed the way we communicate
58
173536
2376
우리가 일상 생활에서
02:55
in our daily lives.
59
175912
1668
소통하는 방식을 바꾸었습니다.
03:00
During the early 2000's,
60
180226
1407
2000년대 초반
03:01
the continued growth of our big data
61
181633
1990
계속 늘어난 빅 데이터는
03:03
outstripped our capability to analyze it at CERN,
62
183623
3291
건물마다 컴퓨터로 꽉 찬 CERN에서조차
03:06
despite having buildings full of computers.
63
186914
3585
분석이 불가능할 만큼 늘어났습니다.
03:10
We had to start distributing the petabytes of data
64
190499
2306
페타바이트에 이르는 데이터를
03:12
to our collaborating partners
65
192805
1582
함께 일하는 협력 기관에 나눠주기 시작했습니다.
03:14
in order to employ local computing and storage
66
194387
2752
다른 기관에 있는 수백 개의
03:17
at hundreds of different institutes.
67
197139
2835
컴퓨터와 저장 공간을 이용하기 위해서죠.
03:19
In order to orchestrate these interconnected resources
68
199974
2295
이렇게 서로 연결된 자원을
03:22
with their diverse technologies,
69
202269
2044
다양한 기술로 관리하기 위해서
03:24
we developed a computing grid,
70
204313
1751
전산망을 개발해서
03:26
enabling the seamless sharing
71
206064
1576
전세계의 컴퓨터 자원들을
03:27
of computing resources around the globe.
72
207640
2428
경계없이 공유할 수 있게 되었습니다.
03:30
This relies on trust relationships and mutual exchange.
73
210068
4391
이는 서로의 신뢰와 상호 교류를 바탕으로 합니다.
03:34
But this grid model could not be transferred
74
214459
2293
하지만 이런 전산망 모델은
03:36
out of our community so easily,
75
216752
2284
쉽게 이전할 수 없습니다.
03:39
where not everyone has resources to share
76
219036
2294
공유할 자원을 누구나 가진 것도 아니고
03:41
nor could companies be expected
77
221330
1876
회사들이 똑같은 수준의 신뢰를
03:43
to have the same level of trust.
78
223206
2753
갖도록 기대할 수도 없습니다.
03:45
Instead, an alternative, more business-like approach
79
225959
2295
대신에 그 대안으로서
03:48
for accessing on-demand resources
80
228254
1836
필요할 때 자원에 접속할 수 있는 사업 모델이
03:50
has been flourishing recently,
81
230090
1708
최근에 번성하고 있으며
03:51
called cloud computing,
82
231798
1668
그것은 클라우드 컴퓨팅이라고 하는데
03:53
which other communities are now exploiting
83
233466
1876
다른 공동체에서는 빅 데이터를 분석하기 위해
03:55
to analyzing their big data.
84
235342
2000
클라우드 컴퓨팅을 연구하고 있습니다.
03:57
It might seem paradoxical for a place like CERN,
85
237342
2987
CERN과 같은 곳에서,
04:00
a lab focused on the study
86
240329
1571
물질을 이루는 아주 작은 구조를
04:01
of the unimaginably small building blocks of matter,
87
241900
3171
연구하는 곳이
04:05
to be the source of something as big as big data.
88
245071
3377
빅 데이터를 다루는 원천이라는 점이 좀 역설적입니다.
04:08
But the way we study the fundamental particles,
89
248448
2082
근본 입자와
04:10
as well as the forces by which they interact,
90
250530
2613
근본 입자가 서로 교류하는 힘을 연구하는데는
04:13
involves creating them fleetingly,
91
253143
2103
근본 입자를 순간적으로 생성시켜야 합니다.
04:15
colliding protons in our accelerators
92
255246
2368
가속기에서 양성자를 충돌시켜
04:17
and capturing a trace of them
93
257614
1427
빛의 속도로 사라지는
04:19
as they zoom off near light speed.
94
259041
2273
흔적을 잡아내야 합니다.
04:21
To see those traces,
95
261314
994
그 흔적을 보려면
04:22
our detector, with 150 million sensors,
96
262308
3448
1억 5천만 개의 센서가 달린 감지기가
04:25
acts like a really massive 3-D camera,
97
265756
2475
아주 거대한 3D 카메라처럼 작동해서
04:28
taking a picture of each collision event -
98
268231
2110
입자가 충돌할 때마다 사진을 찍는데
04:30
that's up to 14 millions times per second.
99
270341
2550
초당 1천 4백만 번을 찍습니다.
04:32
That makes a lot of data.
100
272891
2533
그게 아주 많은 데이터를 만듭니다.
04:37
But if big data has been around for so long,
101
277194
2159
빅 데이터는 오래 전부터 있었는데
04:39
why do we suddenly keep hearing about it now?
102
279353
2627
왜 갑자기 지금에서야 듣게 되는 걸까요?
04:41
Well, as the old metaphor explains,
103
281980
1711
글쎄요, 오래된 비유를 들자면
04:43
the whole is greater than the sum of its parts,
104
283691
2788
전체는 부분의 총합보다 큽니다.
04:46
and this is no longer just science that is exploiting this.
105
286479
3777
이것을 탐구하는 것은 과학뿐만이 아닙니다.
04:50
The fact that we can derive more knowledge
106
290256
1604
서로 관련이 있는 정보를 연결하여
04:51
by joining related information together
107
291860
2330
더 많은 지식을 얻을 수 있고
04:54
and spotting correlations
108
294190
1551
상관 관계를 알아낼 수 있다는 사실은
04:55
can inform and enrich numerous aspects of everyday life,
109
295741
3391
일상 생활의 여러 측면을 풍부하게 하고 정보를 알릴 수 있습니다.
04:59
either in real time,
110
299132
1028
실시간으로
05:00
such as traffic or financial conditions,
111
300160
2291
교통 정보나 금융 상태를 알리거나,
05:02
in short-term evolutions,
112
302451
1755
단기적으로
05:04
such as medical or meteorological,
113
304206
2127
의료나 기상 정보를 알릴 수 있고
05:06
or in predictive situations,
114
306333
1725
또는 예측 가능한 상황에서
05:08
such as business, crime, or disease trends.
115
308058
3020
사업, 범죄, 또는 질병의 동향 따위를 알릴 수 있습니다.
05:13
Virtually every field is turning to gathering big data,
116
313369
3063
거의 모든 분야가 빅 데이터를 모으려고 합니다.
05:16
with mobile sensor networks spanning the globe,
117
316432
2337
전세계에 퍼져 있는 휴대용 센서 네트워크,
05:18
cameras on the ground and in the air,
118
318769
2287
지상과 대기에 있는 카메라,
05:21
archives storing information published on the web,
119
321056
3011
웹에 나온 정보를 저장하는 기록물,
05:24
and loggers capturing the activities
120
324067
2129
전세계 인터넷 시민들의
05:26
of Internet citizens the world over.
121
326196
2699
활동을 수집하는 기록기.
05:28
The challenge is on to invent new tools and techniques
122
328895
2591
이렇게 거대한 저장고에서 자료를 뽑는
05:31
to mine these vast stores,
123
331486
1953
새로운 도구와 기술을 개발해야 합니다.
05:33
to inform decision making,
124
333439
1801
그래서 의사 결정에 필요한 정보를 알리고
05:35
to improve medical diagnosis,
125
335240
2256
의료 진단을 개선하고
05:37
and otherwise to answer needs and desires
126
337496
2210
오늘날에는 상상할 수 없었던 방법으로
05:39
of tomorrow's society in ways that are unimagined today.
127
339706
3957
미래 사회의 수요와 요구에 답하기 위해서 말이죠.
이 웹사이트 정보

이 사이트는 영어 학습에 유용한 YouTube 동영상을 소개합니다. 전 세계 최고의 선생님들이 가르치는 영어 수업을 보게 될 것입니다. 각 동영상 페이지에 표시되는 영어 자막을 더블 클릭하면 그곳에서 동영상이 재생됩니다. 비디오 재생에 맞춰 자막이 스크롤됩니다. 의견이나 요청이 있는 경우 이 문의 양식을 사용하여 문의하십시오.

https://forms.gle/WvT1wiN1qDtmnspy7