Tim Berners-Lee: The next Web of open, linked data

441,970 views ・ 2009-03-13

TED


Vui lòng nhấp đúp vào phụ đề tiếng Anh bên dưới để phát video.

Translator: Lombard Amber Reviewer: Lan-Chi Nguyen
00:18
Time flies.
0
18330
2000
Thời gian trôi đi.
00:20
It's actually almost 20 years ago
1
20330
2000
Thật sự là gần 20 năm trước
00:22
when I wanted to reframe the way we use information,
2
22330
4000
khi tôi muốn hệ thống lại cách chúng ta sử dụng thông tin,
00:26
the way we work together: I invented the World Wide Web.
3
26330
3000
cách ta làm việc cùng nhau: tôi đã phát minh ra mạng toàn cầu.
00:29
Now, 20 years on, at TED,
4
29330
3000
Bây giờ, đã là 20 năm, tại TED,
00:32
I want to ask your help in a new reframing.
5
32330
4000
tôi muốn nhờ sự giúp đỡ từ các bạn trong việc hệ thống mới.
00:37
So going back to 1989,
6
37330
4000
Quay ngược về năm 1989,
00:41
I wrote a memo suggesting the global hypertext system.
7
41330
3000
tôi đã viết một bản ghi nhớ về hệ thống siêu văn bản toàn cầu.
00:44
Nobody really did anything with it, pretty much.
8
44330
3000
Thật sự thì không có ai làm gì với nó hết.
00:47
But 18 months later -- this is how innovation happens --
9
47330
4000
Nhưng 18 tháng sau - đây là cách sự đổi mới diễn ra -
00:51
18 months later, my boss said I could do it on the side,
10
51330
4000
18 tháng sau, ông chủ nói tôi có thể thực hiện nó ở bên ngoài,
00:55
as a sort of a play project,
11
55330
2000
như là một loại dự án cho vui,
00:57
kick the tires of a new computer we'd got.
12
57330
2000
khởi động loại máy tính mới.
00:59
And so he gave me the time to code it up.
13
59330
3000
Và do đó ông ấy đã cho tôi thời gian để mã hóa nó.
01:02
So I basically roughed out what HTML should look like:
14
62330
5000
Vì thế về cơ bản là tôi phác thảo HTML nên trông như thế nào:
01:07
hypertext protocol, HTTP;
15
67330
3000
giao thức siêu văn bản, HTTP;
01:10
the idea of URLs, these names for things
16
70330
3000
ý tưởng về URLs, những cái tên cho những thứ khác
01:13
which started with HTTP.
17
73330
2000
mà bắt nguồn từ HTTP.
01:15
I wrote the code and put it out there.
18
75330
2000
Tôi viết bảng mã và để ra chỗ khác.
01:17
Why did I do it?
19
77330
2000
Tại sao tôi làm vậy?
01:19
Well, it was basically frustration.
20
79330
2000
Cơ bản là thất bại.
01:21
I was frustrated -- I was working as a software engineer
21
81330
4000
Tôi đã thất bại - tôi đã làm việc như một kĩ sư phần mềm
01:25
in this huge, very exciting lab,
22
85330
2000
trong phòng thí nghiệm khổng lồ và thú vị,
01:27
lots of people coming from all over the world.
23
87330
2000
rất nhiều người từ khắp nơi trên thế giới.
01:29
They brought all sorts of different computers with them.
24
89330
3000
Họ mang theo tất cả các loại máy tính khác nhau.
01:32
They had all sorts of different data formats,
25
92330
3000
Họ có tất cả các kiểu định dạng dữ liệu khác nhau,
01:35
all sorts, all kinds of documentation systems.
26
95330
2000
tất cả các kiểu, loại hệ thống tư liệu.
01:37
So that, in all that diversity,
27
97330
3000
Cho nên, trong sự đa dạng đó,
01:40
if I wanted to figure out how to build something
28
100330
2000
nếu tôi muốn tìm ra cách xây dựng cái gì đó
01:42
out of a bit of this and a bit of this,
29
102330
2000
ngoài chỗ này một chút và chỗ kia một chút
01:44
everything I looked into, I had to connect to some new machine,
30
104330
4000
mọi thứ tôi nghiên cứu, tôi phải kết nối với vài thiết bị mới,
01:48
I had to learn to run some new program,
31
108330
2000
tôi phải học vận hành chương trình mới,
01:50
I would find the information I wanted in some new data format.
32
110330
5000
tôi sẽ tìm ra thông tin tôi cần trong định dang dữ liệu mới.
01:55
And these were all incompatible.
33
115330
2000
Và tất cả những thứ đó không tương thích.
01:57
It was just very frustrating.
34
117330
2000
Đó chỉ là thất bại.
01:59
The frustration was all this unlocked potential.
35
119330
2000
Thất bại là những tiềm tiềm năng chưa mở ra.
02:01
In fact, on all these discs there were documents.
36
121330
3000
Thực tế, trong tất cả những cái đĩa này đều có những tư liệu.
02:04
So if you just imagined them all
37
124330
3000
Nên nếu bạn chỉ tưởng tượng ra tất cả chúng
02:07
being part of some big, virtual documentation system in the sky,
38
127330
5000
trở thành một cái gì đó lớn lao, hệ thống tư liệu ảo trên trời,
02:12
say on the Internet,
39
132330
2000
ví như là trên Internet,
02:14
then life would be so much easier.
40
134330
2000
thế thì cuộc sống sẽ dễ dàng hơn nhiều.
02:16
Well, once you've had an idea like that it kind of gets under your skin
41
136330
4000
Một khi bạn đã có ý tưởng thì nó như kiểu trêu ngươi bạn
02:20
and even if people don't read your memo --
42
140330
2000
ngay cả nếu người ta không đọc ghi chép của bạn --
02:22
actually he did, it was found after he died, his copy.
43
142330
3000
-- thật ra là, sau khi chết bản thảo của ông được tìm thấy.
02:25
He had written, "Vague, but exciting," in pencil, in the corner.
44
145330
3000
Ông ghi bằng bút chì ở trong góc, "không rõ ràng, nhưng thú vị"
02:28
(Laughter)
45
148330
2000
(Tiếng cười)
02:30
But in general it was difficult -- it was really difficult to explain
46
150330
4000
Nhưng nói chung là khó - nó thật sự khó để giải thích
02:34
what the web was like.
47
154330
2000
mạng web trông như thế nào.
02:36
It's difficult to explain to people now that it was difficult then.
48
156330
2000
Khó để giải thích rằng hồi đó đã rất khó.
02:38
But then -- OK, when TED started, there was no web
49
158330
3000
Nhưng sau đó - OK, khi TED bắt đầu, không hề có mạng
02:41
so things like "click" didn't have the same meaning.
50
161330
3000
vậy nên những thứ như "click" không hề có nghĩa tương tự.
02:44
I can show somebody a piece of hypertext,
51
164330
2000
Tôi có thể cho xem một phần siêu văn bản,
02:46
a page which has got links,
52
166330
2000
một trang có đường liên kết,
02:48
and we click on the link and bing -- there'll be another hypertext page.
53
168330
4000
và khi ta bấm vào đường truyền và bing - một trang siêu văn bản khác mở ra.
02:52
Not impressive.
54
172330
2000
Không ấn tượng gì.
02:54
You know, we've seen that -- we've got things on hypertext on CD-ROMs.
55
174330
3000
Bạn biết đó, ta có các thứ trong siêu văn bản trong CD_ROMs.
02:57
What was difficult was to get them to imagine:
56
177330
3000
Cái khó là khiến họ tưởng tượng:
03:00
so, imagine that that link could have gone
57
180330
4000
vậy, hãy tưởng tượng đường truyền có thể đi đến
03:04
to virtually any document you could imagine.
58
184330
2000
tới hầu hết các tư liệu có thể tưởng tượng.
03:07
Alright, that is the leap that was very difficult for people to make.
59
187330
4000
Đó là bước nhảy mà rất khó để thực hiện.
03:11
Well, some people did.
60
191330
2000
Ờ thì, một số người đã làm.
03:13
So yeah, it was difficult to explain, but there was a grassroots movement.
61
193330
3000
Vậy nên, rất khó để giải thích, nhưng có một chuyển biến cơ sở.
03:17
And that is what has made it most fun.
62
197330
4000
Và đó là cái làm nó trở nên hay nhất.
03:21
That has been the most exciting thing,
63
201330
2000
Đó là điều thú vị nhất,
03:23
not the technology, not the things people have done with it,
64
203330
2000
không là kỹ thuật, không là thứ người ta đã làm
03:25
but actually the community, the spirit of all these people
65
205330
2000
mà là xã hội, tinh thần của mọi người
03:27
getting together, sending the emails.
66
207330
2000
làm cùng nhau, gửi thư điện tử.
03:29
That's what it was like then.
67
209330
2000
Đó là cái giống như vậy.
03:31
Do you know what? It's funny, but right now it's kind of like that again.
68
211330
3000
Bạn biết không? Nó buồn cười, nhưng giờ thì nó lại giống vậy.
03:34
I asked everybody, more or less, to put their documents --
69
214330
2000
Tôi yêu cầu, nhiều hay ít, hãy đưa tư liệu
03:36
I said, "Could you put your documents on this web thing?"
70
216330
3000
Tôi nói, "Bạn có thể đưa các tư liệu lên trang web này không?"
03:39
And you did.
71
219330
3000
Và họ đã làm.
03:42
Thanks.
72
222330
1000
Cảm ơn.
03:43
It's been a blast, hasn't it?
73
223330
2000
Đó là một cú huých, đúng không?
03:45
I mean, it has been quite interesting
74
225330
2000
Ý tôi là, điều đó khá là thú vị
03:47
because we've found out that the things that happen with the web
75
227330
2000
vì ta khám phá các thứ trên trang web
03:49
really sort of blow us away.
76
229330
2000
thật sự quá tuyệt vời.
03:51
They're much more than we'd originally imagined
77
231330
2000
Hơn rất nhiều so với tưởng tượng ban đầu
03:53
when we put together the little, initial website
78
233330
2000
khi đặt địa chỉ web nhỏ ban đầu với nhau
03:55
that we started off with.
79
235330
2000
mà chúng ta bắt đầu với.
03:57
Now, I want you to put your data on the web.
80
237330
3000
Bây giờ, tôi muốn bạn đưa dữ liệu của bạn lên trang mạng.
04:00
Turns out that there is still huge unlocked potential.
81
240330
4000
Hóa ra rằng vẫn có những tiềm năng khổng lồ chưa được mở khóa.
04:04
There is still a huge frustration
82
244330
2000
Vẫn còn là sự thất bại lớn
04:06
that people have because we haven't got data on the web as data.
83
246330
4000
bởi vì ta không có dữ liệu trên trang mạng như là dữ liệu.
04:10
What do you mean, "data"? What's the difference -- documents, data?
84
250330
2000
Ý là sao, "dữ liệu"? Khác gì nhau - tư liệu, dữ liệu?
04:12
Well, documents you read, OK?
85
252330
3000
Tư liệu bạn đọc, đúng không?
04:15
More or less, you read them, you can follow links from them, and that's it.
86
255330
3000
Nhiều hay ít, bạn đọc nó, bạn có thể theo đường dẫn, thế thôi.
04:18
Data -- you can do all kinds of stuff with a computer.
87
258330
2000
Dữ liệu-bạn có thể làm tất cả với máy tính
04:20
Who was here or has otherwise seen Hans Rosling's talk?
88
260330
6000
Ai đã ở đây hoặc cách khác xem bài nói của Hans Rosling?
04:26
One of the great -- yes a lot of people have seen it --
89
266330
4000
Một trong những người tuyệt với - vâng nhiều người đã xem nó -
04:30
one of the great TED Talks.
90
270330
2000
một trong những bài nói tuyệt với của TED.
04:32
Hans put up this presentation
91
272330
2000
Hans đưa ra bài thuyết trình
04:34
in which he showed, for various different countries, in various different colors --
92
274330
5000
trong đó ông đã chỉ ra, cho những đất nước khác nhau, trong màu sắc khác nhau -
04:39
he showed income levels on one axis
93
279330
3000
ông cho thấy mức độ thu nhập trên một trục
04:42
and he showed infant mortality, and he shot this thing animated through time.
94
282330
3000
ông cho thấy số tử vong trẻ sơ sinh, và biến đổi theo thời gian
04:45
So, he'd taken this data and made a presentation
95
285330
4000
Do đó, ông đã lấy dữ liệu này và làm bài thuyết trình
04:49
which just shattered a lot of myths that people had
96
289330
3000
mà đã phá hủy rất nhiều chuyện hoang đường
04:52
about the economics in the developing world.
97
292330
4000
về kinh tế trong thế giới đang phát triển.
04:56
He put up a slide a little bit like this.
98
296330
2000
Ông thiết lập một trình chiếu nhỏ như vậy.
04:58
It had underground all the data
99
298330
2000
Nó có chứa ngầm tất cả các dữ liệu
05:00
OK, data is brown and boxy and boring,
100
300330
3000
Dữ liệu là màu nâu, hình hộp và nhàm chán
05:03
and that's how we think of it, isn't it?
101
303330
2000
và đó là thứ ta nghĩ về nó, đúng không?
05:05
Because data you can't naturally use by itself
102
305330
3000
Vì dữ liệu không thể tự dùng một cách tự nhiên
05:08
But in fact, data drives a huge amount of what happens in our lives
103
308330
4000
nhưng thực tế, dữ liệu chứa một lượng lớn những gì xảy ra trong cuộc sống chúng ta
05:12
and it happens because somebody takes that data and does something with it.
104
312330
3000
và nó như thế là vì ai đó lấy dữ liệu và làm cái gì đó với nó.
05:15
In this case, Hans had put the data together
105
315330
2000
Trường hợp này, Hans đặt dữ liệu với nhau
05:17
he had found from all kinds of United Nations websites and things.
106
317330
5000
ông đã tìm từ tất cả trang mạng và các thứ của nước Mỹ.
05:22
He had put it together,
107
322330
2000
Ông đã đặt chúng với nhau,
05:24
combined it into something more interesting than the original pieces
108
324330
3000
kết hợp nó với vài thứ thú vị hơn bản gốc
05:27
and then he'd put it into this software,
109
327330
5000
và sau đó ông đưa nó vào phần mềm này,
05:32
which I think his son developed, originally,
110
332330
2000
mà tôi nghĩ con trai ông đã phát triển nó,
05:34
and produces this wonderful presentation.
111
334330
3000
và tạo ra bài thuyết trình tuyệt vời này.
05:37
And Hans made a point
112
337330
2000
Và Hans đã tạo một điểm nhấn
05:39
of saying, "Look, it's really important to have a lot of data."
113
339330
4000
khi nói, "Nhìn xem, có nhiều dữ liệu thật sự rất quan trọng".
05:43
And I was happy to see that at the party last night
114
343330
3000
Và tôi hạnh phúc khi thấy điều đó tại bữa tiệc tối qua
05:46
that he was still saying, very forcibly, "It's really important to have a lot of data."
115
346330
4000
khi ông ấy vẫn nói, rất mạnh mẽ, "Có nhiều dữ liệu thật sự rất quan trọng".
05:50
So I want us now to think about
116
350330
2000
Vậy tôi muốn bây giờ chúng ta hãy nghĩ
05:52
not just two pieces of data being connected, or six like he did,
117
352330
4000
không chỉ hai mảnh dữ liệu được kết nối, hay sáu giống như ông ấy đã làm,
05:56
but I want to think about a world where everybody has put data on the web
118
356330
5000
nhưng tôi muốn nghĩ về một thế giới mà ở đó mọi người đều đưa dữ liệu lên mạng
06:01
and so virtually everything you can imagine is on the web
119
361330
2000
mọi thứ tưởng tượng ban đầu đều trên mạng
06:03
and then calling that linked data.
120
363330
2000
và sau đó gọi là dữ liệu liên kết.
06:05
The technology is linked data, and it's extremely simple.
121
365330
2000
Kỹ thuật là dữ liệu liên kết, rất đơn giản.
06:07
If you want to put something on the web there are three rules:
122
367330
4000
Nếu bạn muốn đưa cái gì lên mạng thì có ba quy tắc:
06:11
first thing is that those HTTP names --
123
371330
3000
đầu tiên là tên HTTP -
06:14
those things that start with "http:" --
124
374330
2000
những thứ này bắt đầu với "http:" -
06:16
we're using them not just for documents now,
125
376330
4000
bây giờ chúng tôi dùng chúng không chỉ cho tư liệu,
06:20
we're using them for things that the documents are about.
126
380330
2000
chúng tôi dùng cho các thứ tư liệu đề cập.
06:22
We're using them for people, we're using them for places,
127
382330
2000
Chúng tôi dùng cho con người, địa điểm,
06:24
we're using them for your products, we're using them for events.
128
384330
4000
chúng tôi dùng nó cho sản phẩm của bạn, dùng cho các sự kiện.
06:28
All kinds of conceptual things, they have names now that start with HTTP.
129
388330
4000
Tất cả loại khái niệm, họ có tên bắt đầu với HTTP.
06:32
Second rule, if I take one of these HTTP names and I look it up
130
392330
5000
Quy tắc thứ hai, nếu bạn lấy một trong số các tên HTTP và bạn tra cứu nó
06:37
and I do the web thing with it and I fetch the data
131
397330
2000
và tôi làm về mạng với nó và lấy dữ liệu
06:39
using the HTTP protocol from the web,
132
399330
2000
sử dụng giao thức HTTP từ mạng,
06:41
I will get back some data in a standard format
133
401330
3000
tôi sẽ lấy về một vài dữ liệu với định dạng chuẩn
06:44
which is kind of useful data that somebody might like to know
134
404330
5000
là loại dữ liệu có ích mà vài người muốn biết
06:49
about that thing, about that event.
135
409330
2000
về điều đó, về sự kiện đó.
06:51
Who's at the event? Whatever it is about that person,
136
411330
2000
Ai ở sự kiện? Bất cứ gì về người đó,
06:53
where they were born, things like that.
137
413330
2000
họ sinh ra ở đâu, những thứ như thế.
06:55
So the second rule is I get important information back.
138
415330
2000
Quy tắc hai tôi lấy về thông tin quan trọng
06:57
Third rule is that when I get back that information
139
417330
4000
Quy tắc ba là khi tôi lấy lại thông tin đó
07:01
it's not just got somebody's height and weight and when they were born,
140
421330
3000
nó không chỉ là chiều cao và cân nặng và nơi sinh của ai đó,
07:04
it's got relationships.
141
424330
2000
nó có cả những mối quan hệ.
07:06
Data is relationships.
142
426330
2000
Dữ liệu là những nối quan hệ.
07:08
Interestingly, data is relationships.
143
428330
2000
Thú vị là, dữ liệu là các mối quan hệ.
07:10
This person was born in Berlin; Berlin is in Germany.
144
430330
4000
Người này sinh ở Berlin; Berlin ở Đức.
07:14
And when it has relationships, whenever it expresses a relationship
145
434330
3000
Khi có các mối quan hệ, bất cứ khi nào diễn tả một mối quan hệ
07:17
then the other thing that it's related to
146
437330
3000
khi đó những thứ khác có liên quan
07:20
is given one of those names that starts HTTP.
147
440330
4000
được đưa ra là một trong các tên bắt đầu với HTTP
07:24
So, I can go ahead and look that thing up.
148
444330
2000
Do đó, tôi có thể tiếp tục tra cứu cái đó.
07:26
So I look up a person -- I can look up then the city where they were born; then
149
446330
3000
Vậy tôi tìm một người - sau đó tôi có thể tìm thành phố sinh ra
07:29
I can look up the region it's in, and the town it's in,
150
449330
3000
sau đó tôi có thể tìm nó thuộc vùng nào, trong thị trấn nào,
07:32
and the population of it, and so on.
151
452330
3000
dân số của nó, vân vân.
07:35
So I can browse this stuff.
152
455330
2000
Do đó tôi có thể duyệt những thứ đó.
07:37
So that's it, really.
153
457330
2000
Vậy nó thật sự là như thế.
07:39
That is linked data.
154
459330
2000
Đó là dữ liệu kết nối.
07:41
I wrote an article entitled "Linked Data" a couple of years ago
155
461330
3000
Một vài năm trước tôi viết một bài báo tựa đề "Dữ liệu liên kết"
07:44
and soon after that, things started to happen.
156
464330
4000
và sớm sau đó, vài thứ bắt đầu xuất hiện.
07:48
The idea of linked data is that we get lots and lots and lots
157
468330
4000
Ý tưởng về dữ liệu liên kết mà chúng tôi có rất rất nhiều
07:52
of these boxes that Hans had,
158
472330
2000
về những cái hộp của Hans
07:54
and we get lots and lots and lots of things sprouting.
159
474330
2000
và có rất rất nhiều những thứ được nảy mầm.
07:56
It's not just a whole lot of other plants.
160
476330
3000
Nó không chỉ là toàn bộ nhiều cái cây khác.
07:59
It's not just a root supplying a plant,
161
479330
2000
Nó không chỉ là rễ nuôi lớn cái cây,
08:01
but for each of those plants, whatever it is --
162
481330
3000
nhưng với mỗi cái cây, bất kể là gì -
08:04
a presentation, an analysis, somebody's looking for patterns in the data --
163
484330
3000
bài thuyết trình, phân tích, ai đó tìm các mẫu trong dữ liệu -
08:07
they get to look at all the data
164
487330
3000
họ sẽ thấy tất cả các dữ liệu
08:10
and they get it connected together,
165
490330
2000
và họ sẽ thấy nó liên kết với nhau,
08:12
and the really important thing about data
166
492330
2000
và điều thật sự quan trọng về dữ liệu
08:14
is the more things you have to connect together, the more powerful it is.
167
494330
2000
là càng kết nối nhiều thứ, nó càng mạnh hơn.
08:16
So, linked data.
168
496330
2000
Vậy, dữ liệu liên kết.
08:18
The meme went out there.
169
498330
2000
Sự lan truyền đã vươn ra ngoài.
08:20
And, pretty soon Chris Bizer at the Freie Universitat in Berlin
170
500330
4000
Và, cũng khá sớm Chris Bizer tại trường Đại học Freie ở Berlin
08:24
who was one of the first people to put interesting things up,
171
504330
2000
trong số người đầu tiên đưa lên thứ thú vị,
08:26
he noticed that Wikipedia --
172
506330
2000
ông để ý rằng Wikipedia -
08:28
you know Wikipedia, the online encyclopedia
173
508330
3000
các bạn biết Wikipedia, bách khoa trực tuyến duy nhất
08:31
with lots and lots of interesting documents in it.
174
511330
2000
với rất rất nhiều tư liệu thú vị trong đó.
08:33
Well, in those documents, there are little squares, little boxes.
175
513330
4000
Trong tư liệu, có hình vuông, hình hộp nhỏ.
08:37
And in most information boxes, there's data.
176
517330
3000
Và trong hầu hết các hộp thông tin, là dữ liệu.
08:40
So he wrote a program to take the data, extract it from Wikipedia,
177
520330
4000
Nên ông ấy viết chương trình lấy dữ liệu, trích nó từ Wikipedia,
08:44
and put it into a blob of linked data
178
524330
2000
và bỏ vào một phần nhỏ dữ liệu liên kết
08:46
on the web, which he called dbpedia.
179
526330
3000
trên trang mạng, mà ông gọi là dbpedia.
08:49
Dbpedia is represented by the blue blob in the middle of this slide
180
529330
4000
Dbpedia thể hiện bằng khung màu xanh ở giữa trình chiếu này
08:53
and if you actually go and look up Berlin,
181
533330
2000
và nếu bạn thật sự tìm kiếm về Berlin,
08:55
you'll find that there are other blobs of data
182
535330
2000
bạn sẽ thấy rằng có các vùng thông tin khác
08:57
which also have stuff about Berlin, and they're linked together.
183
537330
3000
mà cũng có những thứ về Berlin, và chúng được liên kết với nhau.
09:00
So if you pull the data from dbpedia about Berlin,
184
540330
3000
Vậy nếu bạn kéo dữ liệu về Berlin từ Dbpedia,
09:03
you'll end up pulling up these other things as well.
185
543330
2000
bạn kết thúc bằng việc kéo cả các thứ khác
09:05
And the exciting thing is it's starting to grow.
186
545330
3000
Và thứ đang tồn tại bắt đầu phát triển.
09:08
This is just the grassroots stuff again, OK?
187
548330
2000
Đó cũng lại là cấp cơ sở.
09:10
Let's think about data for a bit.
188
550330
3000
Hãy nghĩ một chút về dữ liệu.
09:13
Data comes in fact in lots and lots of different forms.
189
553330
3000
Dữ liệu đến từ thực tế dưới rất rất nhiều hình thức khác nhau.
09:16
Think of the diversity of the web. It's a really important thing
190
556330
3000
Nghĩ về sự đa dạng của trang mạng. Nó thật sự rất quan trọng
09:19
that the web allows you to put all kinds of data up there.
191
559330
3000
rằng trang mạng cho phép bạn đưa tất cả loại dữ liệu lên đó.
09:22
So it is with data. I could talk about all kinds of data.
192
562330
2000
Nó với dữ liệu, Tôi có thể nói về mọi loại.
09:25
We could talk about government data, enterprise data is really important,
193
565330
4000
Ta có thể nói về dữ liệu chính phủ, dữ liệu doanh nghiệp rất quan trọng,
09:29
there's scientific data, there's personal data,
194
569330
3000
có dữ liệu khoa học, có dữ liệu cá nhân,
09:32
there's weather data, there's data about events,
195
572330
2000
có dữ liệu thời tiết, dữ liệu về sự kiện,
09:34
there's data about talks, and there's news and there's all kinds of stuff.
196
574330
4000
có dữ liệu về các bài nói, và có tin tức và có tất cả các thứ.
09:38
I'm just going to mention a few of them
197
578330
3000
Tôi chỉ định đề cập một vài trong số đó
09:41
so that you get the idea of the diversity of it,
198
581330
2000
để bạn hiểu được sự đa dạng của nó,
09:43
so that you also see how much unlocked potential.
199
583330
4000
cũng để bạn thấy tiềm năng chưa mở khóa nhiều như thế nào.
09:47
Let's start with government data.
200
587330
2000
Bắt đầu với dữ liệu chính phủ.
09:49
Barack Obama said in a speech,
201
589330
2000
Barack Obama đã nói trong bài diễn văn,
09:51
that he -- American government data would be available on the Internet
202
591330
5000
rằng ông ấy - dữ liệu về chính phủ Mỹ sẽ có trên mạng
09:56
in accessible formats.
203
596330
2000
dưới định dạng có thể tiếp cận.
09:58
And I hope that they will put it up as linked data.
204
598330
2000
Hy vọng họ đưa nó lên như dữ liệu liên kết
10:00
That's important. Why is it important?
205
600330
2000
Điều đó là quan trọng. Tại sao quan trọng?
10:02
Not just for transparency, yeah transparency in government is important,
206
602330
3000
Không chỉ vì minh bạch, minh bạch trong chính phủ là quan trọng
10:05
but that data -- this is the data from all the government departments
207
605330
3000
nhưng dữ liệu này - đây là dữ liêu từ tất cả cơ quan chính phủ
10:08
Think about how much of that data is about how life is lived in America.
208
608330
5000
Nghĩ xem dữ liệu đó có giá bao nhiêu, nghĩ về cuộc sống ở Mỹ như thế nào.
10:13
It's actual useful. It's got value.
209
613330
2000
Nó thật ra rất hũu dụng. Nó có giá trị.
10:15
I can use it in my company.
210
615330
2000
Tôi có thể dùng nó trong công ty tôi.
10:17
I could use it as a kid to do my homework.
211
617330
2000
Tôi có thể dùng nó như đứa trẻ làm bài tập
10:19
So we're talking about making the place, making the world run better
212
619330
3000
Vậy ta đang nói về việc tạo ra địa điểm, cho thế giới tốt hơn
10:22
by making this data available.
213
622330
2000
bằng cách tạo ra dữ liệu có sẵn.
10:24
In fact if you're responsible -- if you know about some data
214
624330
4000
Thực tế nếu bạn có trách nhiệm - nếu bạn biết về vài dữ liệu
10:28
in a government department, often you find that
215
628330
2000
trong cơ quan chính phủ, bạn thường thấy
10:30
these people, they're very tempted to keep it --
216
630330
3000
những người đó, họ rất muốn giữ kín nó -
10:33
Hans calls it database hugging.
217
633330
3000
Hans gọi đó là ôm chặt cơ sở dữ liệu.
10:36
You hug your database, you don't want to let it go
218
636330
2000
Bạn ôm cơ sở dữ liệu, bạn không muốn bỏ ra
10:38
until you've made a beautiful website for it.
219
638330
2000
tới khi bạn tạo một trang mạng đẹp cho nó.
10:40
Well, I'd like to suggest that rather --
220
640330
2000
Ừ thì, tôi muốn đề nghị thay vào đó -
10:42
yes, make a beautiful website,
221
642330
2000
vâng, làm một trang mạng đẹp,
10:44
who am I to say don't make a beautiful website?
222
644330
2000
tôi là ai mà nói là đừng làm một trang đẹp?
10:46
Make a beautiful website, but first
223
646330
3000
Hãy làm một trang mạng đẹp, nhưng đầu tiên
10:49
give us the unadulterated data,
224
649330
3000
hãy cho chúng tôi dữ liệu không giả tạo,
10:52
we want the data.
225
652330
2000
chúng tôi muốn dữ liệu.
10:54
We want unadulterated data.
226
654330
2000
Chúng tôi muốn dữ liệu không giả tạo.
10:56
OK, we have to ask for raw data now.
227
656330
3000
Bây giờ, chúng ta phải yêu cầu dữ liệu thô.
10:59
And I'm going to ask you to practice that, OK?
228
659330
2000
Và tôi sẽ yêu cầu bạn thực hành, được chứ?
11:01
Can you say "raw"?
229
661330
1000
Hãy nói từ "thô"?
11:02
Audience: Raw.
230
662330
1000
Khán giả: Thô.
11:03
Tim Berners-Lee: Can you say "data"?
231
663330
1000
Hãy nói "dữ liệu"
11:04
Audience: Data.
232
664330
1000
Khán giả: Dữ liệu.
11:05
TBL: Can you say "now"?
233
665330
1000
L: Hãy nói "bây giờ"
11:06
Audience: Now!
234
666330
1000
Khán giả: Bây giờ!
11:07
TBL: Alright, "raw data now"!
235
667330
2000
Được rồi, "dữ liệu thô ngay bây giờ"!
11:09
Audience: Raw data now!
236
669330
2000
Khán giả: Dữ liệu thô ngay bây giờ!
11:11
Practice that. It's important because you have no idea the number of excuses
237
671330
4000
Thực hiện như vậy. Điều đó là quan trọng vì bạn không biết có bao nhiêu lý do đâu.
11:15
people come up with to hang onto their data
238
675330
2000
Mọi người tìm cách để giữ dữ liệu của họ
11:17
and not give it to you, even though you've paid for it as a taxpayer.
239
677330
4000
và không đưa nó cho bạn, cho dù bạn trả tiền cho nó như một người đóng thuế.
11:21
And it's not just America. It's all over the world.
240
681330
2000
Và đó không chỉ ở Mỹ. Mà toàn thế giới.
11:23
And it's not just governments, of course -- it's enterprises as well.
241
683330
3000
Và dĩ nhiên không chỉ chính phủ- mà cũng có cả các doanh nghiệp.
11:26
So I'm just going to mention a few other thoughts on data.
242
686330
3000
Vì vậy tôi chỉ đề cập một vài suy nghĩ về dữ liệu.
11:29
Here we are at TED, and all the time we are very conscious
243
689330
5000
Bầy giờ chúng ta ở tại TED, và ta lúc nào cũng tỉnh táo
11:34
of the huge challenges that human society has right now --
244
694330
5000
với những thử thách khổng lồ trong xã hội loài nguời ngày nay
11:39
curing cancer, understanding the brain for Alzheimer's,
245
699330
3000
chữa trị ung thư, hiểu bộ não cho bệnh Alzheimer,
11:42
understanding the economy to make it a little bit more stable,
246
702330
3000
Hiểu nền kinh tế để làm cho nó ổn định hơn,
11:45
understanding how the world works.
247
705330
2000
Hiểu cách thế giới hoạt động.
11:47
The people who are going to solve those -- the scientists --
248
707330
2000
Giải quyết việc này là nhà khoa học
11:49
they have half-formed ideas in their head,
249
709330
2000
Họ có nửa ý tưởng trong đầu,
11:51
they try to communicate those over the web.
250
711330
3000
Họ cố giao tiếp những thứ đó qua mạng.
11:54
But a lot of the state of knowledge of the human race at the moment
251
714330
3000
Nhưng bây giờ có rất nhiều loại tri thức về loài người
11:57
is on databases, often sitting in their computers,
252
717330
3000
trong các cơ sở dữ liệu, thường nằm trong máy tính,
12:00
and actually, currently not shared.
253
720330
3000
và thật ra, là không được chia sẻ.
12:03
In fact, I'll just go into one area --
254
723330
3000
Thực tế, tôi sẽ chỉ đi vào một chuyện,
12:06
if you're looking at Alzheimer's, for example,
255
726330
2000
ví dụ, bệnh Alzhelmer.
12:08
drug discovery -- there is a whole lot of linked data which is just coming out
256
728330
3000
Sự phát minh ra thuốc - toàn bộ dữ liệu liên kết sẽ xuất hiện
12:11
because scientists in that field realize
257
731330
2000
vì nhà khoa học lĩnh vực này nhận ra rằng
12:13
this is a great way of getting out of those silos,
258
733330
3000
đây là cách tuyệt vời để ra khỏi những kho chứa,
12:16
because they had their genomics data in one database
259
736330
4000
vì họ có dữ liệu gen trong một cơ sở dữ liệu
12:20
in one building, and they had their protein data in another.
260
740330
3000
trong một tòa nhà, và họ có dữ liệu về chất hữu cơ ở chỗ khác.
12:23
Now, they are sticking it onto -- linked data --
261
743330
3000
Ngày nay, họ đang gắn bó với - dữ liệu liên kết -
12:26
and now they can ask the sort of question, that you probably wouldn't ask,
262
746330
3000
và bây giờ họ có thể hỏi những câu, mà bạn có thể sẽ không hỏi,
12:29
I wouldn't ask -- they would.
263
749330
2000
tôi không hỏi - họ hỏi.
12:31
What proteins are involved in signal transduction
264
751330
2000
Loại protein nào tham gia vào việc truyền tín hiệu
12:33
and also related to pyramidal neurons?
265
753330
2000
và cũng liên quan với tế bào thần kinh hình tháp?
12:35
Well, you take that mouthful and you put it into Google.
266
755330
3000
Bạn tiếp nhận thật nhiều và bạn đưa nó lên Google.
12:38
Of course, there's no page on the web which has answered that question
267
758330
3000
Dĩ nhiên, không có trang mạng nào trả lời câu hỏi đó
12:41
because nobody has asked that question before.
268
761330
2000
vì không có ai đã trả lời nó trước đây.
12:43
You get 223,000 hits --
269
763330
2000
Bạn có 223,000 kết quả -
12:45
no results you can use.
270
765330
2000
không kết quả nào dùng được
12:47
You ask the linked data -- which they've now put together --
271
767330
3000
Bạn hỏi dữ liệu liên kết - đang được đặt cùng nhau
12:50
32 hits, each of which is a protein which has those properties
272
770330
4000
32 kết quả, mỗi một đó là một chất đạm có các thuộc tính
12:54
and you can look at.
273
774330
2000
và bạn có thể nhìn thấy nó.
12:56
The power of being able to ask those questions, as a scientist --
274
776330
3000
Sức mạnh để hỏi những câu hỏi đó như một nhà khoa học -
12:59
questions which actually bridge across different disciplines --
275
779330
2000
câu hỏi vượt qua các quy tắc khác nhau
13:01
is really a complete sea change.
276
781330
3000
đó thật sự là sự thay đổi hoàn toàn.
13:04
It's very very important.
277
784330
2000
Điều đó rất rất quan trọng.
13:06
Scientists are totally stymied at the moment --
278
786330
2000
Lúc này, nhà khoa học hoàn toàn lúng túng -
13:08
the power of the data that other scientists have collected is locked up
279
788330
5000
sức mạnh của dữ liệu mà các nhà khoa học khác thu thập đc đã bị khóa
13:13
and we need to get it unlocked so we can tackle those huge problems.
280
793330
3000
và ta cần mở khóa nó để giải quyết những vấn đề khổng lồ.
13:16
Now if I go on like this, you'll think that all the data comes from huge institutions
281
796330
4000
Bây giờ, nếu tiếp tục thế này, bạn sẽ nghĩ tất cả dữ liệu đến từ tổ chức khổng lồ
13:20
and has nothing to do with you.
282
800330
3000
và không có gì liên quan tới bạn.
13:23
But, that's not true.
283
803330
2000
Nhưng điều đó không đúng.
13:25
In fact, data is about our lives.
284
805330
2000
Thực tế, dữ liệu là về cuộc sống.
13:27
You just -- you log on to your social networking site,
285
807330
3000
Bạn chỉ - đăng nhập vào địa chỉ mạng xã hội,
13:30
your favorite one, you say, "This is my friend."
286
810330
2000
cái bạn thích, nói, "Đây là bạn tôi"
13:32
Bing! Relationship. Data.
287
812330
3000
Bing! Mối quan hệ. Dữ liệu.
13:35
You say, "This photograph, it's about -- it depicts this person. "
288
815330
3000
Bạn nói, "Tấm ảnh này, nó mô tả người này".
13:38
Bing! That's data. Data, data, data.
289
818330
3000
Bìng! Đó là dữ liệu. Dữ liệu, dữ liệu, dữ liệu.
13:41
Every time you do things on the social networking site,
290
821330
2000
Mỗi lần bạn làm gì đó với mạng xã hội,
13:43
the social networking site is taking data and using it -- re-purposing it --
291
823330
4000
trang mạng xã hội lấy dữ liệu và dùng nó - tái tạo nó
13:47
and using it to make other people's lives more interesting on the site.
292
827330
4000
và dùng nó để làm cho cuộc sống con người thú vị hơn.
13:51
But, when you go to another linked data site --
293
831330
2000
Nhưng, khi tới vị trí dữ liệu kết nối khác
13:53
and let's say this is one about travel,
294
833330
3000
và lần này hãy nói về du lịch,
13:56
and you say, "I want to send this photo to all the people in that group,"
295
836330
3000
và nói, "Tôi muốn gửi tấm ảnh này đến mọi người trong nhóm"
13:59
you can't get over the walls.
296
839330
2000
bạn không thể vượt qua bức tường,
14:01
The Economist wrote an article about it, and lots of people have blogged about it --
297
841330
2000
Nhà Kinh tế viết về nó, nhiều người bàn tán
14:03
tremendous frustration.
298
843330
1000
sự thất bại to lớn.
14:04
The way to break down the silos is to get inter-operability
299
844330
2000
Cách đạp đổ các kho chứa là để đạt đồng bộ
14:06
between social networking sites.
300
846330
2000
giữa các địa chỉ mạng xã hội.
14:08
We need to do that with linked data.
301
848330
2000
Ta cần làm vậy với dữ liệu liên kết.
14:10
One last type of data I'll talk about, maybe it's the most exciting.
302
850330
3000
Loại dữ liệu cuối cùng tôi nói đến, có lẽ thú vị nhất.
14:13
Before I came down here, I looked it up on OpenStreetMap
303
853330
3000
Trước khi tôi xuống đây, tôi đã tìm trên OpenStreetMap
14:16
The OpenStreetMap's a map, but it's also a Wiki.
304
856330
2000
OpenStreetMap là bản đồ, cũng là Wiki.
14:18
Zoom in and that square thing is a theater -- which we're in right now --
305
858330
3000
Phóng to và cái hình vuông đó là nhà hát mà ta đang ngồi
14:21
The Terrace Theater. It didn't have a name on it.
306
861330
2000
Nhà hát Terrace. Không có tên trên đó.
14:23
So I could go into edit mode, I could select the theater,
307
863330
2000
Tôi vào phần biên tập, chọn nhà hát,
14:25
I could add down at the bottom the name, and I could save it back.
308
865330
5000
Tôi có thể thêm cái tên vào bên dưới, và lưu nó lại.
14:30
And now if you go back to the OpenStreetMap. org,
309
870330
3000
Và bây giờ nếu bạn vào OpenStreetMap.org,
14:33
and you find this place, you will find that The Terrace Theater has got a name.
310
873330
3000
Khi tìm nơi này, bạn sẽ thấy Nhà hát Terrace có tên ở đó
14:36
I did that. Me!
311
876330
2000
Tôi đã làm điều đó. Là tôi!
14:38
I did that to the map. I just did that!
312
878330
2000
Tôi làm thế với bản đồ. Vừa làm đó!
14:40
I put that up on there. Hey, you know what?
313
880330
2000
Tôi đưa nó lên đó. Bạn biết gì không?
14:42
If I -- that street map is all about everybody doing their bit
314
882330
3000
Nếu bản đồ phố xá là về mọi nguời làm bổn phận của họ
14:45
and it creates an incredible resource
315
885330
3000
và nó tạo ra một nguồn không thể tin được
14:48
because everybody else does theirs.
316
888330
3000
vì mọi người khác làm việc của họ.
14:51
And that is what linked data is all about.
317
891330
3000
Và đó là những gì về dữ liệu liên kết.
14:54
It's about people doing their bit
318
894330
3000
Nó nói về mọi người đang làm phần của họ
14:57
to produce a little bit, and it all connecting.
319
897330
3000
để làm ra một ít, và tất cả chúng đều kết nối với nhau.
15:00
That's how linked data works.
320
900330
3000
Đó là cách dữ liệu liên kết làm việc.
15:03
You do your bit. Everybody else does theirs.
321
903330
4000
Bạn làm bổn phận của mình. Những người khác làm của họ.
15:07
You may not have lots of data which you have yourself to put on there
322
907330
4000
Bạn có thể không tự có nhiều dữ liệu để đưa lên đây
15:11
but you know to demand it.
323
911330
3000
nhưng bạn biết yêu cầu nó.
15:14
And we've practiced that.
324
914330
2000
Và chúng ta sẽ tập luyện điều đó.
15:16
So, linked data -- it's huge.
325
916330
4000
Vậy, dữ liệu liên kết - nó khổng lồ.
15:20
I've only told you a very small number of things
326
920330
3000
Tôi chỉ nói một số ít rất nhỏ trong các thứ
15:23
There are data in every aspect of our lives,
327
923330
2000
Có dữ liệu ở mỗi khía cạnh cuộc sống,
15:25
every aspect of work and pleasure,
328
925330
3000
mỗi khía cạnh của công việc và sở thích,
15:28
and it's not just about the number of places where data comes,
329
928330
3000
và nó không chỉ là con số của nơi có dữ liệu,
15:31
it's about connecting it together.
330
931330
3000
mà nó kết nối với nhau.
15:34
And when you connect data together, you get power
331
934330
3000
Và khi bạn kết nối dữ liệu với nhau, bạn có sức mạnh
15:37
in a way that doesn't happen just with the web, with documents.
332
937330
3000
theo cách không chỉ xảy ra với trang mạng, mà còn với tư liệu.
15:40
You get this really huge power out of it.
333
940330
4000
Bạn sẽ có sức mạnh khổng lồ nhờ nó.
15:44
So, we're at the stage now
334
944330
3000
Vậy, bây giờ chúng ta đang ở tại sân khấu
15:47
where we have to do this -- the people who think it's a great idea.
335
947330
4000
nơi mà ta phải làm điều đó - những nguời nghĩ đó là ý hay.
15:51
And all the people -- and I think there's a lot of people at TED who do things because --
336
951330
3000
Tất cả mọi người - tôi nghĩ rất nhiều người ở TED làm nhiều thứ
15:54
even though there's not an immediate return on the investment
337
954330
2000
mặc dù không có sự hoàn vốn ngay tức khắc
15:56
because it will only really pay off when everybody else has done it --
338
956330
3000
vì nó sẽ chỉ thật sự chi trả khi mọi người khác hoàn thành nó -
15:59
they'll do it because they're the sort of person who just does things
339
959330
4000
họ sẽ làm bởi vì họ là kiểu người làm những thứ
16:03
which would be good if everybody else did them.
340
963330
3000
mà chỉ tốt nếu người khác đã làm nó.
16:06
OK, so it's called linked data.
341
966330
2000
Nên nó được gọi là dữ liệu liên kết
16:08
I want you to make it.
342
968330
2000
Tôi muốn bạn làm điều đó
16:10
I want you to demand it.
343
970330
2000
Tôi muốn bạn yêu cầu nó.
16:12
And I think it's an idea worth spreading.
344
972330
2000
Và tôi nghĩ nó là ý tường toàn cầu
16:14
Thanks.
345
974330
1000
Cảm ơn.
16:15
(Applause)
346
975330
3000
(Vỗ tay)
Về trang web này

Trang web này sẽ giới thiệu cho bạn những video YouTube hữu ích cho việc học tiếng Anh. Bạn sẽ thấy các bài học tiếng Anh được giảng dạy bởi các giáo viên hàng đầu từ khắp nơi trên thế giới. Nhấp đúp vào phụ đề tiếng Anh hiển thị trên mỗi trang video để phát video từ đó. Phụ đề cuộn đồng bộ với phát lại video. Nếu bạn có bất kỳ nhận xét hoặc yêu cầu nào, vui lòng liên hệ với chúng tôi bằng biểu mẫu liên hệ này.

https://forms.gle/WvT1wiN1qDtmnspy7