Big Data - Tim Smith

589,741 views ・ 2013-05-03

TED-Ed


لطفا برای پخش فیلم روی زیرنویس انگلیسی زیر دوبار کلیک کنید.

00:00
Translator: Andrea McDonough Reviewer: Jessica Ruby
0
0
7000
Translator: elham zeinodini Reviewer: Mahshid Moballegh Nasery
00:31
Big data is an elusive concept.
1
31085
2762
کلان داده مفهومی گیج کننده است
00:35
It represents an amount of digital information,
2
35987
2688
نمایان‌گر میزانی از اطلاعات دیجیتالی است،
00:38
which is uncomfortable to store,
3
38675
2170
که ذخیره‌،
00:40
transport,
4
40845
1128
انتقال،
00:41
or analyze.
5
41973
1878
یا تحلیل‌شان دشوار است.
00:43
Big data is so voluminous
6
43851
1915
کلان داده به قدری حجیم است
00:45
that it overwhelms the technologies of the day
7
45766
2708
که تکنولوژی روز را از پا در می‌آورد
00:48
and challenges us to create the next generation
8
48474
2425
و ما را برای ساختن نسل بعدی
00:50
of data storage tools and techniques.
9
50899
3105
ابزار ذخیره اطلاعات به چالش می‌کشد.
00:59
So, big data isn't new.
10
59557
1779
بنابراین، کلان داده مفهوم جدیدی نیست.
01:01
In fact, physicists at CERN have been rangling
11
61336
2358
در واقع، فیزیک‌ دانان در سرن
01:03
with the challenge of their ever-expanding big data for decades.
12
63694
4399
دهه‌ها با چالش کلان داده‌هایی که همواره در حال گسترش‌اند درگیر هستند.
01:09
Fifty years ago, CERN's data could be stored
13
69431
2323
پنجاه سال قبل، داده‌های سرن فقط می‌توانستند
01:11
in a single computer.
14
71754
1752
در یک کامپیوتر ذخیره شوند.
01:13
OK, so it wasn't your usual computer,
15
73506
2154
قبول، کامپیوتر معمولی شما نه،
01:15
this was a mainframe computer
16
75660
1417
این یک ابر کامپیوتر بود
01:17
that filled an entire building.
17
77077
2310
که تمام فضای یک ساختمان را اشغال می‌کرد.
01:21
To analyze the data,
18
81494
1169
برای تحلیل داده‌ها،
01:22
physicists from around the world traveled to CERN
19
82663
2948
فیزیک دانان از سراسر دنیا به سازمان سرن سفر می‌کردند،
01:25
to connect to the enormous machine.
20
85611
3026
تا به این ابر ماشین متصل شوند.
01:31
In the 1970's, our ever-growing big data
21
91075
2853
در سال ۱۹۷۰ ، کلان داده‌های همیشه در حال رشدمان
01:33
was distributed across different sets of computers,
22
93928
2750
بین مجموعه‌های مختلفی از کامپیوترها توزیع می‌شد،
01:36
which mushroomed at CERN.
23
96678
2030
که به سرعت در سرن گسترش یافت.
01:38
Each set was joined together
24
98708
1442
هریک از مجموعه‌ها به یک‌دیگر
01:40
in dedicated, homegrown networks.
25
100150
2528
در شبکه‌های اختصاصی، محلی متصل‌ بودند.
01:42
But physicists collaborated without regard
26
102678
1786
اما فیزیک‌دانان بدون در نظر گرفتن
01:44
for the boundaries between sets,
27
104464
1949
مرز بین این دستگاه‌ها همکاری می‌کردند،
01:46
hence needed to access data on all of these.
28
106413
2889
پس لازم بود تا به داده‌های همه آن‌ها دسترسی داشته باشیم.
01:49
So, we bridged the independent networks together
29
109302
1985
بنابراین، ما شبکه‌های مستقل را به یکدیگر
01:51
in our own CERNET.
30
111287
3092
در شبکه آموزشی تحقیقاتی خود متصل کردیم.
01:54
In the 1980's, islands of similar networks
31
114379
2848
در دهه۱۹۸۰، نواحی مجزا از شبکه‌های مشابه که به
01:57
speaking different dialects
32
117227
1544
گویش‌های مختلفی صحبت می‌کردند
01:58
sprung up all over Europe and the States,
33
118771
2540
به سراسر اروپا و ایالات متحده آمریکا هجوم آوردند،
02:01
making remote access possible but torturous.
34
121311
3091
دسترسی از راه دور را ممکن اما بسیار دشوار کردند.
02:04
To make it easy for our physicists across the world
35
124402
2144
برای اینکه فیزیک‌دانان در سراسر جهان به آسانی
02:06
to access the ever-expanding big data
36
126546
2405
امکان دسترسی به کلان داده‌های پیوسته در حال رشد
02:08
stored at CERN without traveling,
37
128951
1793
ذخیره در سرن را بدون سفر داشته باشند
02:10
the networks needed to be talking
38
130744
1299
شبکه‌ها نیاز به ارتباط
02:12
with the same language.
39
132043
1370
با یک زبان واحد داشتند.
02:13
We adopted the fledgling internet working standard from the States,
40
133413
3795
ما استاندارد نوظهور کار با اینترنت را از ایالات متحده اتخاذ کردیم،
02:17
followed by the rest of Europe,
41
137208
1376
پس از آن بقیه اروپا
02:18
and we established the principal link at CERN
42
138584
2168
و ما ارتباط بنیادی در سرن
02:20
between Europe and the States in 1989,
43
140752
2503
بین اروپا و ایالات متحده در سال ۱۹۸۹ تاسیس کردیم.
02:23
and the truly global internet took off!
44
143255
2786
و اینترنت جهانی حقیقی ناگهان موفق شد!
02:28
Physicists could easily then access
45
148580
1791
فیزیک‌دانان به راحتی امکان دسترسی
02:30
the terabytes of big data
46
150371
1812
به چندین ترابایت کلان داده
02:32
remotely from around the world,
47
152183
1663
به صورت از راه دور از سراسر دنیا،
02:33
generate results,
48
153846
1379
ایجاد نتایج،
02:35
and write papers in their home institutes.
49
155225
2295
نوشتن مقالات در انجمن‌های زیستگاه خود را داشتند.
02:37
Then, they wanted to share their findings
50
157520
1501
سپس، می‌خواستند یافته‌های خود را
02:39
with all their colleagues.
51
159021
1792
با همه همکاران‌شان به اشتراک بگذارند.
02:40
To make this information sharing easy,
52
160813
1603
برای میسر ساختن اشتراک اطلاعات
02:42
we created the web in the early 1990's.
53
162416
2942
ما در اوایل دهه ۱۹۹۰ وب را ایجاد کردیم.
02:45
Physicists no longer needed to know
54
165358
1838
دیگر فیزیک‌دانان نیازی به دانستن اینکه
02:47
where the information was stored
55
167196
1637
محل ذخیره‌سازی اطلاعات
02:48
in order to find it and access it on the web,
56
168833
2569
برای یافتن و دسترسی به آن‌ها در وب نداشتند
02:51
an idea which caught on across the world
57
171402
2134
ایده‌ای که در سراسر جهان باب شد
02:53
and has transformed the way we communicate
58
173536
2376
و نحوه ارتباط ما با یکدیگر
02:55
in our daily lives.
59
175912
1668
در زندگی روزمره‌مان را تغییر داد.
03:00
During the early 2000's,
60
180226
1407
در اوایل دهه ۲۰۰۰،
03:01
the continued growth of our big data
61
181633
1990
رشد ادامه‌دار کلان داده ما
03:03
outstripped our capability to analyze it at CERN,
62
183623
3291
توانایی‌مان برای تحلیل آن‌ها در سرن را ارتقا داد،
03:06
despite having buildings full of computers.
63
186914
3585
با وجود داشتن ساختمان‌هایی پر از کامپیوترها.
03:10
We had to start distributing the petabytes of data
64
190499
2306
ما باید توزیع پتابایت‌هایی از داده را برای
03:12
to our collaborating partners
65
192805
1582
شرکای همکاری خود آغاز می‌کردیم
03:14
in order to employ local computing and storage
66
194387
2752
تا رایانش محلی و مخازن را
03:17
at hundreds of different institutes.
67
197139
2835
در صدها مجموعه مختلف به کار گیریم.
03:19
In order to orchestrate these interconnected resources
68
199974
2295
برای هماهنگ سازی این مجموعه‌های به هم پیوسته
03:22
with their diverse technologies,
69
202269
2044
با تکنولوژی‌های متنوع‌شان،
03:24
we developed a computing grid,
70
204313
1751
ما یک رایانش مشبک ایجاد کردیم،
03:26
enabling the seamless sharing
71
206064
1576
که اشتراک گذاری یکپارچه
03:27
of computing resources around the globe.
72
207640
2428
منابع محاسباتی در سراسر جهان را میسر می‌سازد.
03:30
This relies on trust relationships and mutual exchange.
73
210068
4391
که وابسته به ارتباط بر مبنای اعتماد و مبادله متقابل است.
03:34
But this grid model could not be transferred
74
214459
2293
اما این مدل شبکه‌ای نمی‌توانست
03:36
out of our community so easily,
75
216752
2284
به راحتی خارج از اجتماع ما منتقل شود،
03:39
where not everyone has resources to share
76
219036
2294
جایی که نه هر کسی منابع برای اشتراک دارد
03:41
nor could companies be expected
77
221330
1876
و نه می‌توان از شرکت‌ها انتظار
03:43
to have the same level of trust.
78
223206
2753
میزان یکسانی از اعتماد را داشت.
03:45
Instead, an alternative, more business-like approach
79
225959
2295
در عوض، یک جایگزین، روشی تجاری مانند
03:48
for accessing on-demand resources
80
228254
1836
برای دسترسی به منابع مورد نیاز
03:50
has been flourishing recently,
81
230090
1708
اخیرا در حال ترقی است،
03:51
called cloud computing,
82
231798
1668
رایانش ابری نامیده می‌شود،
03:53
which other communities are now exploiting
83
233466
1876
که دیگر جوامع از آن برای
03:55
to analyzing their big data.
84
235342
2000
تحلیل کلان داده خود بهره می‌برند.
03:57
It might seem paradoxical for a place like CERN,
85
237342
2987
برای مکانی مانند سرن ممکن است متناقض به نظر برسد
04:00
a lab focused on the study
86
240329
1571
آزمایشگاهی با تمرکز بر پژوهش
04:01
of the unimaginably small building blocks of matter,
87
241900
3171
بر بلوک‌های کوچک باورنکردنی سازنده ماده،
04:05
to be the source of something as big as big data.
88
245071
3377
که منبعی از چیزی به بزرگی کلان داده باشد.
04:08
But the way we study the fundamental particles,
89
248448
2082
اما نحوه مطالعات ما در زمینه ذرات بنیادی،
04:10
as well as the forces by which they interact,
90
250530
2613
همچنین نیروهایی که به وسیله آن‌ها با هم تعامل دارند،
04:13
involves creating them fleetingly,
91
253143
2103
شامل ایجاد آن‌ها به صورت گذرا،
04:15
colliding protons in our accelerators
92
255246
2368
ایجاد تصادم پروتون‌ها در شتاب‌‌دهنده‌هایمان
04:17
and capturing a trace of them
93
257614
1427
و کنترل مسیرشان
04:19
as they zoom off near light speed.
94
259041
2273
در حالی که با سرعتی نزدیک سرعت نور حرکت می‌کنند
04:21
To see those traces,
95
261314
994
برای دیدن این مسیرها
04:22
our detector, with 150 million sensors,
96
262308
3448
ردیاب ما، با ۱۵۰ میلیون سنسور،
04:25
acts like a really massive 3-D camera,
97
265756
2475
که مانند یک دوربین سه بعدی غول‌آسا عمل می‌کند،
04:28
taking a picture of each collision event -
98
268231
2110
از هر تصادم تصاویری ثبت می‌کند -
04:30
that's up to 14 millions times per second.
99
270341
2550
که برابر ۱۴ میلیون بار در ثانیه است.
04:32
That makes a lot of data.
100
272891
2533
که مقدار زیادی داده تولید می‌کند.
04:37
But if big data has been around for so long,
101
277194
2159
اما اگر کلان داده چنین قدمتی داشته،
04:39
why do we suddenly keep hearing about it now?
102
279353
2627
چرا ما ناگهان چیزهایی از آن می‌شنویم؟
04:41
Well, as the old metaphor explains,
103
281980
1711
خب، یک ضرب المثل قدیمی می‌گوید،
04:43
the whole is greater than the sum of its parts,
104
283691
2788
کل از مجموع اجزای آن بزرگتر است،
04:46
and this is no longer just science that is exploiting this.
105
286479
3777
و دیگر تنها علم نیست که از این موضوع بهره‌برداری می‌کند.
04:50
The fact that we can derive more knowledge
106
290256
1604
این حقیقت که می‌توانیم دانش بیشتری
04:51
by joining related information together
107
291860
2330
را از کنار هم قرار دادن اطلاعات استخراج کنیم
04:54
and spotting correlations
108
294190
1551
و همبستگی‌ها را شناسایی کنیم
04:55
can inform and enrich numerous aspects of everyday life,
109
295741
3391
می‌تواند جنبه‌های متعددی از زندگی روزمره را متاثر کند و توسعه بخشد،
04:59
either in real time,
110
299132
1028
یا هر لحظه،
05:00
such as traffic or financial conditions,
111
300160
2291
مانند ترافیک یا شرایط مالی،
05:02
in short-term evolutions,
112
302451
1755
تحولات کوتاه مدت،
05:04
such as medical or meteorological,
113
304206
2127
مانند پزشکی یا هواشناسی،
05:06
or in predictive situations,
114
306333
1725
یا در پیش‌بینی موقعیت‌ها،
05:08
such as business, crime, or disease trends.
115
308058
3020
مانند تجارت، جنایت، یا روند بیماری.
05:13
Virtually every field is turning to gathering big data,
116
313369
3063
تقریبا همه شاخه‌های دانش به سمت جمع‌آوری کلان داده پیش می‌روند،
05:16
with mobile sensor networks spanning the globe,
117
316432
2337
شبکه‌های حسگر تلفن همراه که کره زمین پوشش می‌دهند
05:18
cameras on the ground and in the air,
118
318769
2287
دوربین‌ها روی زمین و در هوا،
05:21
archives storing information published on the web,
119
321056
3011
آرشیو‌هایی که اطلاعات منتشر شده در وب را ذخیره می‌کنند،
05:24
and loggers capturing the activities
120
324067
2129
واقعه‌نگارهایی که فعالیت‌های
05:26
of Internet citizens the world over.
121
326196
2699
شهروندان اینترنت در سراسر دنیا را ضبط می‌کنند.
05:28
The challenge is on to invent new tools and techniques
122
328895
2591
چالش پیش رو ابداع ابزار و تکنیک‌های جدید
05:31
to mine these vast stores,
123
331486
1953
برای حفر کردن این مخازن وسیع،
05:33
to inform decision making,
124
333439
1801
برای آگاه سازی در تصمیم‌گیری،
05:35
to improve medical diagnosis,
125
335240
2256
بهبود تشخیص پزشکی،
05:37
and otherwise to answer needs and desires
126
337496
2210
و جز این برای پاسخگویی به نیازها و تمایلاتی از
05:39
of tomorrow's society in ways that are unimagined today.
127
339706
3957
جامعه فردا که امروزه باورنکردنی به نظر می‌رسد است.

Original video on YouTube.com
درباره این وب سایت

این سایت ویدیوهای یوتیوب را به شما معرفی می کند که برای یادگیری زبان انگلیسی مفید هستند. دروس انگلیسی را خواهید دید که توسط معلمان درجه یک از سراسر جهان تدریس می شود. روی زیرنویس انگلیسی نمایش داده شده در هر صفحه ویدیو دوبار کلیک کنید تا ویدیو از آنجا پخش شود. زیرنویس‌ها با پخش ویدیو همگام می‌شوند. اگر نظر یا درخواستی دارید، لطفا با استفاده از این فرم تماس با ما تماس بگیرید.

https://forms.gle/WvT1wiN1qDtmnspy7