Big Data - Tim Smith

ビッグデータの歴史を探る — ティム・スミス

589,741 views ・ 2013-05-03

TED-Ed


下の英語字幕をダブルクリックすると動画を再生できます。

00:00
Translator: Andrea McDonough Reviewer: Jessica Ruby
0
0
7000
翻訳: Tomoshige Ohno 校正: Takahiro Shimpo
00:31
Big data is an elusive concept.
1
31085
2762
ビッグデータは とらえ所のない概念です
00:35
It represents an amount of digital information,
2
35987
2688
大量のデジタル情報のことを表しますが
00:38
which is uncomfortable to store,
3
38675
2170
保存したり
00:40
transport,
4
40845
1128
転送したり
00:41
or analyze.
5
41973
1878
分析することは困難です
00:43
Big data is so voluminous
6
43851
1915
ビッグデータは大容量なので
00:45
that it overwhelms the technologies of the day
7
45766
2708
現在の技術では扱い切れず
00:48
and challenges us to create the next generation
8
48474
2425
次世代のデータ保存ツールや技術を
00:50
of data storage tools and techniques.
9
50899
3105
創るという課題を突き付けてきます
00:59
So, big data isn't new.
10
59557
1779
ビッグデータは新しいわけではありません
01:01
In fact, physicists at CERN have been rangling
11
61336
2358
実際 CERNの物理学者は 数十年にも渡って
01:03
with the challenge of their ever-expanding big data for decades.
12
63694
4399
拡大を続けるビッグデータの挑戦に 立ち向かってきました
01:09
Fifty years ago, CERN's data could be stored
13
69431
2323
50年前 CERNのデータは
01:11
in a single computer.
14
71754
1752
1台のコンピュータに保存可能でした
01:13
OK, so it wasn't your usual computer,
15
73506
2154
通常のコンピュータではなく
01:15
this was a mainframe computer
16
75660
1417
1つの建物を埋め尽くすほどの
01:17
that filled an entire building.
17
77077
2310
メインフレームという コンピュータを使っていました
01:21
To analyze the data,
18
81494
1169
データを分析するために
01:22
physicists from around the world traveled to CERN
19
82663
2948
世界中の物理学者がCERNにやって来て
01:25
to connect to the enormous machine.
20
85611
3026
この巨大なマシンに接続していたのです
01:31
In the 1970's, our ever-growing big data
21
91075
2853
1970年代には 増殖を続けるビッグデータは
01:33
was distributed across different sets of computers,
22
93928
2750
CERNのあちこちにある 別々のコンピュータに
01:36
which mushroomed at CERN.
23
96678
2030
分散して保存されていました
01:38
Each set was joined together
24
98708
1442
それぞれのコンピュータは
01:40
in dedicated, homegrown networks.
25
100150
2528
専用の自家製ネットワークで 接続されていました
01:42
But physicists collaborated without regard
26
102678
1786
しかし物理学者は コンピュータ同士の 境界を越えて作業をしていたため
01:44
for the boundaries between sets,
27
104464
1949
しかし物理学者は コンピュータ同士の 境界を越えて作業をしていたため
01:46
hence needed to access data on all of these.
28
106413
2889
あらゆるコンピュータのデータに アクセスする必要がありました
01:49
So, we bridged the independent networks together
29
109302
1985
そこで私たちは 独立した ネットワークをまとめ
01:51
in our own CERNET.
30
111287
3092
CERNETという独自の ネットワークを構築したのです
01:54
In the 1980's, islands of similar networks
31
114379
2848
1980年代には ヨーロッパやアメリカの至る所で
01:57
speaking different dialects
32
117227
1544
異なる方言を持つ 同様のネットワークが
01:58
sprung up all over Europe and the States,
33
118771
2540
増殖・拡大するようになり
02:01
making remote access possible but torturous.
34
121311
3091
遠隔アクセス自体は可能でしたが ひどく面倒でした
02:04
To make it easy for our physicists across the world
35
124402
2144
世界中の物理学者が CERNに保存された —
02:06
to access the ever-expanding big data
36
126546
2405
増殖を続けるビッグデータへのアクセスを
02:08
stored at CERN without traveling,
37
128951
1793
現地に行くこと無く 実現するためには
02:10
the networks needed to be talking
38
130744
1299
あらゆるネットワークが
02:12
with the same language.
39
132043
1370
同じ言語を使う必要がありました
02:13
We adopted the fledgling internet working standard from the States,
40
133413
3795
私たちは アメリカで標準となり ヨーロッパがそれに続いた
02:17
followed by the rest of Europe,
41
137208
1376
当時まだ未成熟なインターネットを採用し
02:18
and we established the principal link at CERN
42
138584
2168
1989年に CERNで
02:20
between Europe and the States in 1989,
43
140752
2503
初めてヨーロッパと アメリカをつなぎました
02:23
and the truly global internet took off!
44
143255
2786
これが本当の意味での グローバルインターネットの始まりです
02:28
Physicists could easily then access
45
148580
1791
それにより 物理学者は 何テラバイトものビッグデータに
02:30
the terabytes of big data
46
150371
1812
それにより 物理学者は 何テラバイトものビッグデータに
02:32
remotely from around the world,
47
152183
1663
容易に遠隔アクセスできるようになり 結果を出したり —
02:33
generate results,
48
153846
1379
出張無しで 研究所での論文執筆が 可能になりました
02:35
and write papers in their home institutes.
49
155225
2295
出張無しで 研究所での論文執筆が 可能になりました
02:37
Then, they wanted to share their findings
50
157520
1501
新たな知見を 同僚と共有したいという ニーズが出てきました
02:39
with all their colleagues.
51
159021
1792
新たな知見を 同僚と共有したいという ニーズが出てきました
02:40
To make this information sharing easy,
52
160813
1603
情報共有を容易にするために
02:42
we created the web in the early 1990's.
53
162416
2942
1990年代初頭にウェブを開発しました
02:45
Physicists no longer needed to know
54
165358
1838
物理学者は もう情報がどこに 保存されているのか
02:47
where the information was stored
55
167196
1637
知る必要がなくなりました
02:48
in order to find it and access it on the web,
56
168833
2569
ウェブ上で情報を見つけ アクセスするために
02:51
an idea which caught on across the world
57
171402
2134
世界中で話題となったアイデアは
02:53
and has transformed the way we communicate
58
173536
2376
日常生活におけるコミュニケーションを
02:55
in our daily lives.
59
175912
1668
一変させました
03:00
During the early 2000's,
60
180226
1407
2000年代初頭にも
03:01
the continued growth of our big data
61
181633
1990
ビッグデータは増殖を続けており
03:03
outstripped our capability to analyze it at CERN,
62
183623
3291
CERNは建物一杯のコンピュータを 所有していたにも関わらず
03:06
despite having buildings full of computers.
63
186914
3585
解析能力を超えてしまい
03:10
We had to start distributing the petabytes of data
64
190499
2306
何百もの施設でローカルに データを計算・保存させるため
03:12
to our collaborating partners
65
192805
1582
何百もの施設でローカルに データを計算・保存させるため
03:14
in order to employ local computing and storage
66
194387
2752
ペタバイト級のデータを パートナーのコンピュータに
03:17
at hundreds of different institutes.
67
197139
2835
分散させる必要が出てきました
03:19
In order to orchestrate these interconnected resources
68
199974
2295
これらの相互接続されたリソースを
03:22
with their diverse technologies,
69
202269
2044
様々な技術を用いて 協調させるために
03:24
we developed a computing grid,
70
204313
1751
グリッドコンピューティング技術を開発し
03:26
enabling the seamless sharing
71
206064
1576
世界中の計算資源を
03:27
of computing resources around the globe.
72
207640
2428
シームレスに共有できるようにしました
03:30
This relies on trust relationships and mutual exchange.
73
210068
4391
信頼関係と相互交流に依存しますが
03:34
But this grid model could not be transferred
74
214459
2293
このグリッドモデルでは コミュニティ外への
03:36
out of our community so easily,
75
216752
2284
データ転送は容易ではありませんでした
03:39
where not everyone has resources to share
76
219036
2294
全員が共有できるだけのリソースを 持っていなかったり
03:41
nor could companies be expected
77
221330
1876
企業に同レベルの信頼を置けるとは
03:43
to have the same level of trust.
78
223206
2753
限らないからです
03:45
Instead, an alternative, more business-like approach
79
225959
2295
最近では 必要に応じてリソースに アクセスするための代替案として
03:48
for accessing on-demand resources
80
228254
1836
クラウドコンピューティングという
03:50
has been flourishing recently,
81
230090
1708
よりビジネスライクなアプローチが
03:51
called cloud computing,
82
231798
1668
盛んに用いられています
03:53
which other communities are now exploiting
83
233466
1876
これは今では 他のコミュニティーでも
03:55
to analyzing their big data.
84
235342
2000
ビッグデータを分析するために 用いられています
03:57
It might seem paradoxical for a place like CERN,
85
237342
2987
逆説的ですが 想像もつかない程小さな素粒子の
04:00
a lab focused on the study
86
240329
1571
逆説的ですが 想像もつかない程小さな素粒子の
04:01
of the unimaginably small building blocks of matter,
87
241900
3171
研究に特化したCERNのような場が
04:05
to be the source of something as big as big data.
88
245071
3377
ビッグデータのような 大きなものの源となっているのです
04:08
But the way we study the fundamental particles,
89
248448
2082
しかし 素粒子や その相互作用力を研究するには
04:10
as well as the forces by which they interact,
90
250530
2613
ほんの一瞬の間だけ素粒子を生成したり
04:13
involves creating them fleetingly,
91
253143
2103
加速器で陽子を衝突させたり
04:15
colliding protons in our accelerators
92
255246
2368
光速に近い速度まで加速する —
04:17
and capturing a trace of them
93
257614
1427
素粒子の軌道を観測したり
04:19
as they zoom off near light speed.
94
259041
2273
しなければなりません
04:21
To see those traces,
95
261314
994
軌道を観測するために
04:22
our detector, with 150 million sensors,
96
262308
3448
1.5億個のセンサーが付いた検出器が
04:25
acts like a really massive 3-D camera,
97
265756
2475
大規模3Dカメラのように振る舞い
04:28
taking a picture of each collision event -
98
268231
2110
1秒間に最大1400万回発生する
04:30
that's up to 14 millions times per second.
99
270341
2550
衝突のそれぞれを撮影するため
04:32
That makes a lot of data.
100
272891
2533
大量のデータが生成されます
04:37
But if big data has been around for so long,
101
277194
2159
しかしビッグデータが これほど長く存在していたのなら
04:39
why do we suddenly keep hearing about it now?
102
279353
2627
最近 突然その言葉をよく聞くように なったのはなぜでしょう?
04:41
Well, as the old metaphor explains,
103
281980
1711
昔からの比喩にあるように
04:43
the whole is greater than the sum of its parts,
104
283691
2788
集団は部分の総和より大きな力を発揮します
04:46
and this is no longer just science that is exploiting this.
105
286479
3777
これは科学に限ったことではありません
04:50
The fact that we can derive more knowledge
106
290256
1604
関連した情報をまとめたり
04:51
by joining related information together
107
291860
2330
相関を見抜いたりすることで
04:54
and spotting correlations
108
294190
1551
より多くの知識が得られ
04:55
can inform and enrich numerous aspects of everyday life,
109
295741
3391
それが日常生活を様々な面で 豊かにしてくれるのです
04:59
either in real time,
110
299132
1028
渋滞や経済状況など
05:00
such as traffic or financial conditions,
111
300160
2291
リアルタイムのことであったり
05:02
in short-term evolutions,
112
302451
1755
医療や気象といった
05:04
such as medical or meteorological,
113
304206
2127
短期間の変化であったり
05:06
or in predictive situations,
114
306333
1725
ビジネスや犯罪 病気の流行などを
05:08
such as business, crime, or disease trends.
115
308058
3020
予測するといった場面でも有効です
05:13
Virtually every field is turning to gathering big data,
116
313369
3063
事実上全ての分野が ビッグデータを集めるようになってきています
05:16
with mobile sensor networks spanning the globe,
117
316432
2337
モバイルセンサーネットワークは 地球全体に広がり
05:18
cameras on the ground and in the air,
118
318769
2287
カメラが地上や空中に存在しており
05:21
archives storing information published on the web,
119
321056
3011
またウェブ上の情報はアーカイブに保存され
05:24
and loggers capturing the activities
120
324067
2129
世界中のインターネット利用者の
05:26
of Internet citizens the world over.
121
326196
2699
活動記録は全てログに 記録されるようになっています
05:28
The challenge is on to invent new tools and techniques
122
328895
2591
課題となるのは 新たなツールや技術を開発し
05:31
to mine these vast stores,
123
331486
1953
大量のデータから情報を集め
05:33
to inform decision making,
124
333439
1801
意思決定に役立てたり
05:35
to improve medical diagnosis,
125
335240
2256
医療診断を改善したり
05:37
and otherwise to answer needs and desires
126
337496
2210
今日では想像もできない —
05:39
of tomorrow's society in ways that are unimagined today.
127
339706
3957
未来の社会のニーズや要求に応えることです
このウェブサイトについて

このサイトでは英語学習に役立つYouTube動画を紹介します。世界中の一流講師による英語レッスンを見ることができます。各ビデオのページに表示される英語字幕をダブルクリックすると、そこからビデオを再生することができます。字幕はビデオの再生と同期してスクロールします。ご意見・ご要望がございましたら、こちらのお問い合わせフォームよりご連絡ください。

https://forms.gle/WvT1wiN1qDtmnspy7