Big Data - Tim Smith

Exploration à la frontière du Big Data, les données massives - Tim Smith

591,439 views

2013-05-03 ・ TED-Ed


New videos

Big Data - Tim Smith

Exploration à la frontière du Big Data, les données massives - Tim Smith

591,439 views ・ 2013-05-03

TED-Ed


Veuillez double-cliquer sur les sous-titres anglais ci-dessous pour lire la vidéo.

00:00
Translator: Andrea McDonough Reviewer: Jessica Ruby
0
0
7000
Traducteur: Elisabeth Buffard Relecteur: Ariana Bleau Lugo
00:31
Big data is an elusive concept.
1
31085
2762
Le « Big Data » - les données massives - est une notion insaisissable,
00:35
It represents an amount of digital information,
2
35987
2688
qui représente une quantité d'informations numériques,
00:38
which is uncomfortable to store,
3
38675
2170
très difficile à stocker,
00:40
transport,
4
40845
1128
de transporter,
00:41
or analyze.
5
41973
1878
ou d'analyser.
00:43
Big data is so voluminous
6
43851
1915
Le Big Data est si volumineux
00:45
that it overwhelms the technologies of the day
7
45766
2708
qu'il submerge les technologies d'aujourd'hui
00:48
and challenges us to create the next generation
8
48474
2425
et nous pousse à créer la prochaine génération
00:50
of data storage tools and techniques.
9
50899
3105
d'outils et de techniques de stockage de données.
00:59
So, big data isn't new.
10
59557
1779
Le Big Data n'est pas nouveau.
01:01
In fact, physicists at CERN have been rangling
11
61336
2358
En effet, les physiciens du CERN bataillent
01:03
with the challenge of their ever-expanding big data for decades.
12
63694
4399
avec le problème de leurs données massives en constante expansion depuis des décennies.
01:09
Fifty years ago, CERN's data could be stored
13
69431
2323
Il y a cinquante ans, les données du CERN pouvaient être stockées
01:11
in a single computer.
14
71754
1752
dans un seul ordinateur.
01:13
OK, so it wasn't your usual computer,
15
73506
2154
Certes, ce n'était pas un ordinateur habituel,
01:15
this was a mainframe computer
16
75660
1417
il s'agissait d'un ordinateur central
01:17
that filled an entire building.
17
77077
2310
qui remplissait un bâtiment entier.
01:21
To analyze the data,
18
81494
1169
Pour analyser les données,
01:22
physicists from around the world traveled to CERN
19
82663
2948
les physiciens du monde entier se rendaient au CERN
01:25
to connect to the enormous machine.
20
85611
3026
pour se connecter à l'énorme machine.
01:31
In the 1970's, our ever-growing big data
21
91075
2853
Dans les années 1970, nos données massives en croissance constante
01:33
was distributed across different sets of computers,
22
93928
2750
ont été réparties à travers différents ensembles d'ordinateurs,
01:36
which mushroomed at CERN.
23
96678
2030
qui se sont multipliés au CERN.
01:38
Each set was joined together
24
98708
1442
Chaque ensemble était relié
01:40
in dedicated, homegrown networks.
25
100150
2528
dans les réseaux dédiés, faits sur place.
01:42
But physicists collaborated without regard
26
102678
1786
Mais les physiciens collaboraient sans tenir compte
01:44
for the boundaries between sets,
27
104464
1949
des frontières entre les ensembles,
01:46
hence needed to access data on all of these.
28
106413
2889
et avaient donc besoin d'accéder aux données sur tous les ensembles.
01:49
So, we bridged the independent networks together
29
109302
1985
Alors, nous avons connecté les réseaux indépendants ensemble
01:51
in our own CERNET.
30
111287
3092
dans notre propre CERNET.
01:54
In the 1980's, islands of similar networks
31
114379
2848
Dans les années 1980, des îles de réseaux similaires
01:57
speaking different dialects
32
117227
1544
parlant des dialectes différents
01:58
sprung up all over Europe and the States,
33
118771
2540
ont surgi dans toute l'Europe et les États-Unis,
02:01
making remote access possible but torturous.
34
121311
3091
rendant l'accès distant possible mais tortueux.
02:04
To make it easy for our physicists across the world
35
124402
2144
Pour faciliter à nos physiciens du monde entier
02:06
to access the ever-expanding big data
36
126546
2405
l'accès aux données massives sans cesse croissantes
02:08
stored at CERN without traveling,
37
128951
1793
stockées au CERN sans se déplacer,
02:10
the networks needed to be talking
38
130744
1299
les réseaux devaient parler
02:12
with the same language.
39
132043
1370
la même langue.
02:13
We adopted the fledgling internet working standard from the States,
40
133413
3795
Nous avons adopté la norme de travail d'Internet naissante des États-Unis,
02:17
followed by the rest of Europe,
41
137208
1376
suivis par le reste de l'Europe,
02:18
and we established the principal link at CERN
42
138584
2168
et nous avons établi le lien principal du CERN
02:20
between Europe and the States in 1989,
43
140752
2503
entre l'Europe et les États-Unis en 1989,
02:23
and the truly global internet took off!
44
143255
2786
et le véritable internet mondial a décollé !
02:28
Physicists could easily then access
45
148580
1791
Les physiciens pouvaient alors facilement accéder
02:30
the terabytes of big data
46
150371
1812
aux téraoctets de données massives
02:32
remotely from around the world,
47
152183
1663
à distance de partout dans le monde,
02:33
generate results,
48
153846
1379
générer des résultats,
02:35
and write papers in their home institutes.
49
155225
2295
et écrire des publications dans leurs établissements d'accueil.
02:37
Then, they wanted to share their findings
50
157520
1501
Puis, ils ont voulu partager leurs découvertes
02:39
with all their colleagues.
51
159021
1792
avec tous leurs collègues.
02:40
To make this information sharing easy,
52
160813
1603
Pour faciliter ce partage de l'information
02:42
we created the web in the early 1990's.
53
162416
2942
nous avons créé le web au début des années 1990.
02:45
Physicists no longer needed to know
54
165358
1838
Les physiciens n'avaient plus besoin de savoir
02:47
where the information was stored
55
167196
1637
où l'information était stockée
02:48
in order to find it and access it on the web,
56
168833
2569
pour la trouver et y accéder sur le web,
02:51
an idea which caught on across the world
57
171402
2134
une idée qui a pris à travers le monde
02:53
and has transformed the way we communicate
58
173536
2376
et a transformé la façon dont nous communiquons
02:55
in our daily lives.
59
175912
1668
dans notre vie quotidienne.
03:00
During the early 2000's,
60
180226
1407
Dans le début des années 2000,
03:01
the continued growth of our big data
61
181633
1990
la croissance continue de nos données massives
03:03
outstripped our capability to analyze it at CERN,
62
183623
3291
a dépassé notre capacité à l'analyser au CERN,
03:06
despite having buildings full of computers.
63
186914
3585
malgré les bâtiments pleins d'ordinateurs.
03:10
We had to start distributing the petabytes of data
64
190499
2306
Nous avons dû commencer à distribuer les pétaoctets de données
03:12
to our collaborating partners
65
192805
1582
à nos partenaires
03:14
in order to employ local computing and storage
66
194387
2752
afin d'employer l'informatique et le stockage locaux
03:17
at hundreds of different institutes.
67
197139
2835
dans des centaines d'instituts différents.
03:19
In order to orchestrate these interconnected resources
68
199974
2295
Pour orchestrer ces ressources interconnectées
03:22
with their diverse technologies,
69
202269
2044
avec leurs diverses technologies,
03:24
we developed a computing grid,
70
204313
1751
nous avons élaboré une grille de calcul,
03:26
enabling the seamless sharing
71
206064
1576
permettant le partage sans soudure
03:27
of computing resources around the globe.
72
207640
2428
des ressources informatiques partout dans le monde.
03:30
This relies on trust relationships and mutual exchange.
73
210068
4391
Elle repose sur des relations de confiance et d'échange mutuel.
03:34
But this grid model could not be transferred
74
214459
2293
Mais ce modèle de grille n'a pas pu être transféré
03:36
out of our community so easily,
75
216752
2284
hors de notre communauté si facilement,
03:39
where not everyone has resources to share
76
219036
2294
où tout le monde ne dispose pas de ressources à partager
03:41
nor could companies be expected
77
221330
1876
ni d'entreprises dont on puisse attendre
03:43
to have the same level of trust.
78
223206
2753
qu'elles aient le même niveau de confiance.
03:45
Instead, an alternative, more business-like approach
79
225959
2295
Au lieu de cela, une approche alternative, plus proche du fonctionnement des affaires,
03:48
for accessing on-demand resources
80
228254
1836
pour accéder à des ressources à la demande
03:50
has been flourishing recently,
81
230090
1708
s'est généralisé récemment,
03:51
called cloud computing,
82
231798
1668
c'est ce qu'on appelle le « cloud computing »,
03:53
which other communities are now exploiting
83
233466
1876
que les autres communautés exploitent désormais
03:55
to analyzing their big data.
84
235342
2000
pour l'analyse de leurs données massives.
03:57
It might seem paradoxical for a place like CERN,
85
237342
2987
Il peut sembler paradoxal pour un endroit comme le CERN,
04:00
a lab focused on the study
86
240329
1571
qu'un laboratoire centré sur l'étude
04:01
of the unimaginably small building blocks of matter,
87
241900
3171
des éléments constitutifs de la matière, incroyablement petits,
04:05
to be the source of something as big as big data.
88
245071
3377
soit à l'origine de quelque chose d'aussi gros que des données massives.
04:08
But the way we study the fundamental particles,
89
248448
2082
Mais la façon dont nous étudions les particules fondamentales,
04:10
as well as the forces by which they interact,
90
250530
2613
ainsi que les forces par lesquelles elles interagissent,
04:13
involves creating them fleetingly,
91
253143
2103
consiste à les créer fugitivement,
04:15
colliding protons in our accelerators
92
255246
2368
en créant des collisions de protons dans nos accélérateurs
04:17
and capturing a trace of them
93
257614
1427
et en capturant leur trace
04:19
as they zoom off near light speed.
94
259041
2273
quand ils partent à une vitesse proche de la lumière.
04:21
To see those traces,
95
261314
994
Pour voir ces traces,
04:22
our detector, with 150 million sensors,
96
262308
3448
notre détecteur, avec 150 millions de capteurs,
04:25
acts like a really massive 3-D camera,
97
265756
2475
agit comme une caméra 3D vraiment massive,
04:28
taking a picture of each collision event -
98
268231
2110
qui prend une photo de chaque collision -
04:30
that's up to 14 millions times per second.
99
270341
2550
c'est jusqu'à 14 millions de fois par seconde.
04:32
That makes a lot of data.
100
272891
2533
Ça fait beaucoup de données.
04:37
But if big data has been around for so long,
101
277194
2159
Mais si les données massives existent depuis si longtemps,
04:39
why do we suddenly keep hearing about it now?
102
279353
2627
pourquoi soudain en entend-on parler tout le temps maintenant ?
04:41
Well, as the old metaphor explains,
103
281980
1711
Eh bien, comme l'explique la métaphore ancienne,
04:43
the whole is greater than the sum of its parts,
104
283691
2788
le tout est plus grand que la somme de ses parties,
04:46
and this is no longer just science that is exploiting this.
105
286479
3777
et ce n'est donc plus seulement la science qui les exploite.
04:50
The fact that we can derive more knowledge
106
290256
1604
Le fait que nous pouvons tirer plus de connaissances
04:51
by joining related information together
107
291860
2330
en réunissant les informations connexes
04:54
and spotting correlations
108
294190
1551
et en repérant des corrélations
04:55
can inform and enrich numerous aspects of everyday life,
109
295741
3391
peut informer et enrichir les nombreux aspects de la vie quotidienne
04:59
either in real time,
110
299132
1028
soit en temps réel,
05:00
such as traffic or financial conditions,
111
300160
2291
comme le trafic ou les conditions financières,
05:02
in short-term evolutions,
112
302451
1755
dans les évolutions à court terme,
05:04
such as medical or meteorological,
113
304206
2127
telles que situations médicales ou météorologique,
05:06
or in predictive situations,
114
306333
1725
ou dans des situations prédictives,
05:08
such as business, crime, or disease trends.
115
308058
3020
comme les tendances en affaires, le crime ou les maladies.
05:13
Virtually every field is turning to gathering big data,
116
313369
3063
Pratiquement tous les domaines se tournent vers la collecte de données massives,
05:16
with mobile sensor networks spanning the globe,
117
316432
2337
avec les réseaux de capteurs mobiles couvrant le globe,
05:18
cameras on the ground and in the air,
118
318769
2287
les caméras sur le terrain et dans les airs,
05:21
archives storing information published on the web,
119
321056
3011
les archives qui stockent les informations publiées sur le web,
05:24
and loggers capturing the activities
120
324067
2129
et les enregistreurs qui capturent les activités
05:26
of Internet citizens the world over.
121
326196
2699
des citoyens de l'Internet partout dans le monde.
05:28
The challenge is on to invent new tools and techniques
122
328895
2591
Le défi consiste à inventer de nouveaux outils et techniques
05:31
to mine these vast stores,
123
331486
1953
pour exploiter ces vastes stockages,
05:33
to inform decision making,
124
333439
1801
d'informer le processus décisionnel,
05:35
to improve medical diagnosis,
125
335240
2256
pour améliorer le diagnostic médical,
05:37
and otherwise to answer needs and desires
126
337496
2210
et sinon pour répondre aux besoins et désirs
05:39
of tomorrow's society in ways that are unimagined today.
127
339706
3957
de la société de demain de façons qui sont inimaginables aujourd'hui.
À propos de ce site Web

Ce site vous présentera des vidéos YouTube utiles pour apprendre l'anglais. Vous verrez des leçons d'anglais dispensées par des professeurs de premier ordre du monde entier. Double-cliquez sur les sous-titres anglais affichés sur chaque page de vidéo pour lire la vidéo à partir de là. Les sous-titres défilent en synchronisation avec la lecture de la vidéo. Si vous avez des commentaires ou des demandes, veuillez nous contacter en utilisant ce formulaire de contact.

https://forms.gle/WvT1wiN1qDtmnspy7