Blaise Aguera y Arcas: Jaw-dropping Photosynth demo

Phác thảo của Blaise Aguera Y Arcas về công nghệ tổng hợp hình ảnh

46,128 views

2007-06-26 ・ TED


New videos

Blaise Aguera y Arcas: Jaw-dropping Photosynth demo

Phác thảo của Blaise Aguera Y Arcas về công nghệ tổng hợp hình ảnh

46,128 views ・ 2007-06-26

TED


Vui lòng nhấp đúp vào phụ đề tiếng Anh bên dưới để phát video.

00:25
What I'm going to show you first, as quickly as I can,
0
25000
2548
Thứ mà tôi sẽ trình bày đến các bạn trước, một cách nhanh nhất có thể
00:27
is some foundational work, some new technology
1
27572
3769
là một công trình cơ bản, một công nghệ mới
00:31
that we brought to Microsoft as part of an acquisition
2
31365
2611
mà chúng tôi đã mang đến Microsoft trong cuộc sát nhập
00:34
almost exactly a year ago.
3
34000
1821
cách đây một năm. Đây là Seadragon.
00:35
This is Seadragon, and it's an environment
4
35845
2368
Là một môi trường mà bạn có thể tương tác trong phạm vi
00:38
in which you can either locally or remotely interact
5
38237
2476
00:40
with vast amounts of visual data.
6
40737
2119
xa hoặc gần với nhiều loại dữ liệu hình ảnh.
00:43
We're looking at many, many gigabytes of digital photos here
7
43165
3404
Chúng ta đang nhìn thấy rất nhiều Gb ảnh điện tử ở đây
00:46
and kind of seamlessly and continuously zooming in,
8
46593
2915
và gần như đang liên tục thu hẹp lại,
00:49
panning through it, rearranging it in any way we want.
9
49532
2545
xoay trái phải, xếp đặt lại chúng bằng mọi cách mà ta muốn
00:52
And it doesn't matter how much information we're looking at,
10
52389
3587
Và không quan trọng chuyện lượng thông tin ta cần đến lớn bao nhiêu,
00:56
how big these collections are or how big the images are.
11
56000
2976
những bộ sưu tập này và những hình ảnh đó lớn bao nhiêu.
00:59
Most of them are ordinary digital camera photos,
12
59000
2286
Tất cả đều là những hình ảnh chụp từ máy ảnh số,
01:01
but this one, for example, is a scan from the Library of Congress,
13
61310
3144
nhưng cái này chẳng hạn, là bản quét từ Thư viện Quốc hội,
01:04
and it's in the 300 megapixel range.
14
64478
2818
và có khối lượng khoảng 300 mega điểm ảnh.
01:07
It doesn't make any difference
15
67320
1656
Những cũng chẳng có gì khác biệt
01:09
because the only thing that ought to limit the performance of a system like this one
16
69000
4144
vì điều duy nhất làm giới hạn khả năng
của một hệ thống như thế này chính là số điểm ảnh trên màn hình của bạn
01:13
is the number of pixels on your screen at any given moment.
17
73168
2777
01:15
It's also very flexible architecture.
18
75969
1970
tại bất cứ thời điểm nào. Kiến trúc của nó cũng rất đa dạng.
01:17
This is an entire book, so this is an example of non-image data.
19
77963
3727
Đây là một quyển sách, ví dụ về dữ liệu không hình ảnh.
01:21
This is "Bleak House" by Dickens.
20
81714
2787
Đây là quyển Ngôi nhà lạnh lẽo của Dickens. Mỗi cột là một chương.
01:24
Every column is a chapter.
21
84525
2784
01:27
To prove to you that it's really text, and not an image,
22
87333
3643
Để chứng minh với các bạn rằng đây chính là một văn bản và không phải là hình ảnh,
01:31
we can do something like so, to really show
23
91000
2048
chúng ta có thể làm như thế này, để thực sự thấy rằng
01:33
that this is a real representation of the text; it's not a picture.
24
93072
3192
đây là phần trình bày của một văn bản; nó không phải là một bức tranh.
01:36
Maybe this is an artificial way to read an e-book.
25
96288
2664
Có thể đây là một cách để đọc một quyển sách điện tử
01:38
I wouldn't recommend it.
26
98976
1200
Tôi không khuyến khích cách này.
01:40
This is a more realistic case, an issue of The Guardian.
27
100200
2848
Đây là một trường hợp thực tế hơn. Đây là một số báo của tờ The Guardian.
01:43
Every large image is the beginning of a section.
28
103072
2286
Mỗi bức ảnh to bắt đầu một mục.
01:45
And this really gives you the joy and the good experience
29
105382
2904
Và nó thực sự mang lại cho bạn sự hứng khởi và vui vẻ
01:48
of reading the real paper version of a magazine or a newspaper,
30
108310
5183
khi đọc một tờ báo thực sự
01:53
which is an inherently multi-scale kind of medium.
31
113517
2435
và là một phương tiện đa dạng xuyên suốt.
01:55
We've done something
32
115976
1000
Chúng tôi đã làm thay đổi một chút
01:57
with the corner of this particular issue of The Guardian.
33
117000
2976
với góc của tờ báo The Guardian này.
02:00
We've made up a fake ad that's very high resolution --
34
120000
2976
Chúng tôi đã tạo ra một mẩu quảng cáo với độ phân giải cao--
02:03
much higher than in an ordinary ad --
35
123000
2198
cao hơn hẳn cái thường có ở quảng cáo thông thường --
02:05
and we've embedded extra content.
36
125222
1754
và chúng tôi đính thêm nhiều nội dung khác.
02:07
If you want to see the features of this car, you can see it here.
37
127000
3048
Nếu bạn muốn xem các nét đặc trưng của chiếc xe này, bạn có thể xem ở đây.
02:10
Or other models, or even technical specifications.
38
130072
4180
Cũng có thể xem các mẫu khác, thậm chí cả đặc tính kĩ thuật.
02:14
And this really gets at some of these ideas
39
134276
3315
Và điều này mang đến một vài ý tưởng
02:17
about really doing away with those limits on screen real estate.
40
137615
4661
về việc vượt qua giới hạn trên màn hình.
02:22
We hope that this means no more pop-ups
41
142300
2111
Chúng tôi mong rằng điều này có nghĩa là sẽ không còn các quảng cáo dạng pop-up
02:24
and other rubbish like that -- shouldn't be necessary.
42
144435
2541
và các dạng tương tự -- chúng không cần thiết.
02:27
Of course, mapping is one of those obvious applications
43
147000
2658
Tất nhiên, bản đồ là một trong những ứng dụng thiết yếu
02:29
for a technology like this.
44
149682
1294
cho công nghệ dạng này.
02:31
And this one I really won't spend any time on,
45
151000
2191
Và tôi sẽ không dành thời gian nói nhiều về nói
02:33
except to say that we have things to contribute to this field as well.
46
153215
3334
ngoài việc nói rằng chúng tôi cũng đóng góp vào lĩnh vực này.
02:37
But those are all the roads in the U.S.
47
157213
1858
Nhưng đó là những con đường ở nước Mỹ
02:39
superimposed on top of a NASA geospatial image.
48
159095
4565
được xếp chồng trên bản đồ của NASA.
02:44
So let's pull up, now, something else.
49
164000
1976
Nên hãy kéo lên, bây giờ, xem một thứ khác.
02:46
This is actually live on the Web now; you can go check it out.
50
166000
2976
Nó đã có ở trên trang web và bạn có thể tìm hiểu thêm.
02:49
This is a project called Photosynth, which marries two different technologies.
51
169000
3704
Đây là một dự án tên gọi Photosynth,
kết hợp hai công nghệ khác nhau.
02:52
One of them is Seadragon
52
172728
1248
Một trong số đó là Seadragon
02:54
and the other is some very beautiful computer-vision research
53
174000
2906
và công nghệ còn lại là một nghiên cứu tầm nhìn điện tử
02:56
done by Noah Snavely, a graduate student at the University of Washington,
54
176930
3462
bởi Noah Snavely, sinh viên cao học của trường đại học Washington,
03:00
co-advised by Steve Seitz at U.W.
55
180416
1829
đồng chỉ đạo bởi Steve Seitz ở UW
03:02
and Rick Szeliski at Microsoft Research.
56
182269
1978
và Rick Szeliski ở Trung tâm nghiên cứu Microsoft. Một sự hợp tác rất tuyệt vời.
03:04
A very nice collaboration.
57
184271
1733
03:06
And so this is live on the Web. It's powered by Seadragon.
58
186412
3108
Dự án này đã có trên mạng. Được cấp nguồn bởi Seadragon.
03:09
You can see that when we do these sorts of views,
59
189544
2504
Bạn có thể thấy khi chúng tôi tiến hành thử những góc nhìn này,
03:12
where we can dive through images
60
192072
1723
khi chúng tôi lướt qua các hình ảnh
03:13
and have this kind of multi-resolution experience.
61
193819
2334
và có sự trải nghiệm về sự phân giải nhiều lớp.
03:16
But the spatial arrangement of the images here is actually meaningful.
62
196177
3799
Nhưng sự sắp đặp không gian của các hình ảnh ở đây rất có ý nghĩa.
03:20
The computer vision algorithms have registered these images together
63
200000
3191
Các thuật toán máy tính đã xắp xếp những hình ảnh này cùng nhau.
03:23
so that they correspond to the real space in which these shots --
64
203215
3761
và chúng tương ứng với không gian thật, trong đó những bức hình này --
03:27
all taken near Grassi Lakes in the Canadian Rockies --
65
207000
3300
tất cả được chụp gần Grassi Lakes ở Canadian Rockies --
03:30
all these shots were taken.
66
210324
1663
Giờ các bạn có thể thấy ở đây những yếu tố
03:32
So you see elements here
67
212011
1467
03:33
of stabilized slide-show or panoramic imaging,
68
213502
6013
của slide-show được ổn định hoặc toàn bộ hình ảnh,
03:39
and these things have all been related spatially.
69
219539
2437
và những thứ này được liên hệ không gian với nhau.
03:42
I'm not sure if I have time to show you any other environments.
70
222000
3000
Tôi không chắc mình có đủ thời gian để trình bày về các môi trường khác.
03:45
Some are much more spatial.
71
225024
1431
Có một vài môi trường với nhiều không gian hơn rất nhiều.
03:46
I would like to jump straight to one of Noah's original data-sets --
72
226479
3945
Tôi muốn đề cập thẳng đến một trong những bộ dữ liệu nguyên bản của Noah --
03:50
this is from an early prototype that we first got working this summer --
73
230448
3552
có nguồn gốc từ một mẫu nguyên thủy của Photosynth
mà chúng tôi bắt đầu nghiên cứu lần đầu vào mùa hè --
03:54
to show you what I think
74
234024
1894
để trình bày cho các bạn những gì tôi nghĩ
03:55
is really the punch line behind the Photosynth technology,
75
235942
3838
là điểm nút đằng sau công nghệ này,
03:59
It's not necessarily so apparent
76
239804
1561
công nghệ Photosynth. Và nó thực sự không rõ rệt
04:01
from looking at the environments we've put up on the website.
77
241389
2895
nếu chỉ nhìn vào những môi trường được tạo dựng trên trang web.
04:04
We had to worry about the lawyers and so on.
78
244308
2177
Chúng tôi đã phải lo lắng về luật sư và những điều khác.
04:06
This is a reconstruction of Notre Dame Cathedral
79
246509
2301
Đây là bản tái thiết nhà thờ Notre Dame
04:08
that was done entirely computationally from images scraped from Flickr.
80
248834
3457
đã được làm hoàn toàn bằng máy tính
từ những hình ảnh lấy từ Flickr. Bạn chỉ cần đánh "Notre Dame" vào Flickr,
04:12
You just type Notre Dame into Flickr,
81
252315
2019
04:14
and you get some pictures of guys in T-shirts, and of the campus and so on.
82
254358
3854
và bạn có thể thấy hình ảnh những cậu sinh viên mặc áo phông, hoặc ảnh của trường
và nhiều nữa. Và mỗi hình nón màu cam này báo hiệu một hình ảnh
04:18
And each of these orange cones represents an image
83
258236
3146
04:21
that was discovered to belong to this model.
84
261406
3234
được coi là thuộc mẫu hình này.
04:26
And so these are all Flickr images,
85
266000
1976
Và đây là tất cả những hình ảnh lấy từ Flickr,
04:28
and they've all been related spatially in this way.
86
268000
2976
và chúng được liên kết không gian theo cách này.
04:31
We can just navigate in this very simple way.
87
271000
2334
Chúng ta chỉ cần tìm hiểu chúng một cách rất đơn giản.
04:35
(Applause)
88
275000
3920
(Vỗ tay).
04:42
(Applause ends)
89
282557
1014
04:43
You know, I never thought that I'd end up working at Microsoft.
90
283595
2954
Bạn biết đấy, tôi chưa từng nghĩ rằng cuối cùng mình lại làm việc ở Microsoft.
04:46
It's very gratifying to have this kind of reception here.
91
286573
3000
Và thật phấn khởi khi được đón nhận như thế này.
04:49
(Laughter)
92
289597
3379
(Cười).
04:53
I guess you can see this is lots of different types of cameras:
93
293000
5048
Tôi nghĩ các bạn có thể thấy
ở đây có rất nhiều các loại máy ảnh:
04:58
it's everything from cell-phone cameras to professional SLRs,
94
298072
3161
nó có tất cả từ máy ảnh điện thoại đến máy SLR chuyên nghiệp,
05:01
quite a large number of them, stitched together in this environment.
95
301257
3191
một số lớn trong chúng được cài vào
trong môi trường này.
05:04
If I can find some of the sort of weird ones --
96
304472
2632
Và nếu có thể, tôi sẽ tìm những loại kì cục nhất.
05:08
So many of them are occluded by faces, and so on.
97
308000
3322
Có rất nhiều loại được bít kín bởi các mặt, và nhiều hơn nữa.
05:12
Somewhere in here there is actually a series of photographs -- here we go.
98
312595
4277
Vài nơi trong này thực ra đã có một series
các bức ảnh -- chúng ta bắt đầu.
05:16
This is actually a poster of Notre Dame that registered correctly.
99
316896
3301
Đây là một bức ảnh của Notre Dame được đăng kí đúng.
05:20
We can dive in from the poster
100
320221
3216
Chúng ta có thể khám phá bức ảnh này
05:23
to a physical view of this environment.
101
323461
3810
để có cái nhìn của môi trường này.
05:31
What the point here really is
102
331421
1866
Ý chính ở đây là chúng ta có thể làm những điều tương tự
05:33
is that we can do things with the social environment.
103
333311
2591
với môi trường xã hội. Giờ nó đang lấy dữ liệu từ tất cả mọi người --
05:35
This is now taking data from everybody --
104
335926
3002
05:38
from the entire collective memory, visually, of what the Earth looks like --
105
338952
3871
từ một bộ nhớ
về hình ảnh trái đất
05:42
and link all of that together.
106
342847
1749
và nối chúng lại với nhau.
05:44
Those photos become linked, and they make something emergent
107
344620
2839
Tất cả những bức ảnh đó được nối lại với nhau
và nó tạo nên những thứ
05:47
that's greater than the sum of the parts.
108
347483
1953
còn tuyệt vời hơn tất cả các phần góp lại.
05:49
You have a model that emerges of the entire Earth.
109
349460
2356
Giờ ta có một mẫu mô phỏng toàn bộ Trái đất.
05:51
Think of this as the long tail to Stephen Lawler's Virtual Earth work.
110
351840
4077
Hãy coi nó như bản thêm của chương trình Trái đất Ảo của Stepehn Lawler.
05:55
And this is something that grows in complexity as people use it,
111
355941
3200
Và đây là thứ mà càng trở nên phức tạp
khi người ta sử dụng, và lợi ích từ nó càng trở nên lớn hơn
05:59
and whose benefits become greater to the users as they use it.
112
359165
3811
cho người dùng.
06:03
Their own photos are getting tagged with meta-data that somebody else entered.
113
363000
3692
Những bức ảnh của người dùng sẽ được đính với dữ liệu dang meta
khi một người khác nhập vào.
06:06
If somebody bothered to tag all of these saints
114
366716
3360
Nếu có ai đó có thể tag tất cả những vị thánh này
06:10
and say who they all are, then my photo of Notre Dame Cathedral
115
370100
2953
và điền thông tin về họ, thì bức ảnh về nhà thờ Notre Dame của tôi
06:13
suddenly gets enriched with all of that data,
116
373077
2098
sẽ cập nhật những thông tin này luôn,
06:15
and I can use it as an entry point to dive into that space,
117
375199
2777
và tôi có thể dùng nó như điểm vào để lướt vào không gian đó,
06:18
into that meta-verse, using everybody else's photos,
118
378000
2681
dữ liệu đó, sử dụng hình ảnh của những người khác,
06:20
and do a kind of a cross-modal
119
380705
3301
và thực hiện thao tác xuyên mô hình
06:24
and cross-user social experience that way.
120
384030
3751
và xuyên mạng lưới người xử dụng.
06:27
And of course, a by-product of all of that is immensely rich virtual models
121
387805
4171
Và tất nhiên, sản phẩm đi kèm sau đó
là những mô hình giàu tính hình ảnh
06:32
of every interesting part of the Earth,
122
392000
1968
về những khu vực thú vị của thế giới, được thu thập
06:33
collected not just from overhead flights and from satellite images
123
393992
4487
không chỉ từ những ảnh chụp từ trên máy bay hay vệ tinh
06:38
and so on, but from the collective memory.
124
398503
2052
mà còn từ bộ nhớ có tính năng thu thập dữ liệu.
06:40
Thank you so much.
125
400579
1094
Cảm ơn các bạn rất nhiều.
06:41
(Applause)
126
401697
6863
(Vỗ tay)
06:51
(Applause ends)
127
411967
1001
06:52
Chris Anderson: Do I understand this right?
128
412992
2326
Chris Anderson: Không biết tôi hiểu có đúng không? Rằng điều mà phần mềm của ngài đang cho phép,
06:55
What your software is going to allow,
129
415342
2497
06:57
is that at some point, really within the next few years,
130
417863
3476
đó là tại một thời điểm nào đó, trong vòng vài năm tới,
07:01
all the pictures that are shared by anyone across the world
131
421363
4235
tất cả những bức ảnh được chia sẻ bởi bất cứ ai trên thế giới
07:05
are going to link together?
132
425622
1561
chúng sẽ được kết nối với nhau?
07:07
BAA: Yes. What this is really doing is discovering,
133
427207
2387
BAA: Đúng vậy. Những gì phầm mềm này là để khám phá.
07:09
creating hyperlinks, if you will, between images.
134
429618
2358
Nó tạo nên những siêu kết nối giữa những hình ảnh.
07:12
It's doing that based on the content inside the images.
135
432000
2584
Và nó làm điều đó
dựa trên nội dung bên trong bức ảnh.
07:14
And that gets really exciting when you think about the richness
136
434608
3022
và điều đó làm bạn thực sự phấn khích khi nghĩ đến những
07:17
of the semantic information a lot of images have.
137
437654
2304
thông tin phong phú mà những hình ảnh này có.
07:19
Like when you do a web search for images,
138
439982
1960
Chẳng hạn khi bạn thực hiện lệnh tìm kiếm hình ảnh trên mạng,
07:21
you type in phrases,
139
441966
1245
bạn gõ vào những cụm từ, và những từ khóa trên trang web
07:23
and the text on the web page is carrying a lot of information
140
443235
2900
chứa rất nhiều thông tin về bức ảnh đó.
07:26
about what that picture is of.
141
446159
1502
07:27
What if that picture links to all of your pictures?
142
447685
2391
Giờ, nếu bức ảnh đó được kết nối với tất cả những bức ảnh của bạn thì sao?
Thì khối lượng của liên kết ngữ nghĩa
07:30
The amount of semantic interconnection and richness
143
450100
2413
và khối lượng thông tin phong phú kèm với nó
07:32
that comes out of that is really huge.
144
452537
1854
là rất lớn. Đây chính là hiệu ứng mạng lưới điển hình.
07:34
It's a classic network effect.
145
454415
1449
07:35
CA: Truly incredible. Congratulations.
146
455888
2024
CA: Blaise, điều này thực sự kì diệu. Xin chúc mừng.
BAA: Cảm ơn rất nhiều.
Về trang web này

Trang web này sẽ giới thiệu cho bạn những video YouTube hữu ích cho việc học tiếng Anh. Bạn sẽ thấy các bài học tiếng Anh được giảng dạy bởi các giáo viên hàng đầu từ khắp nơi trên thế giới. Nhấp đúp vào phụ đề tiếng Anh hiển thị trên mỗi trang video để phát video từ đó. Phụ đề cuộn đồng bộ với phát lại video. Nếu bạn có bất kỳ nhận xét hoặc yêu cầu nào, vui lòng liên hệ với chúng tôi bằng biểu mẫu liên hệ này.

https://forms.gle/WvT1wiN1qDtmnspy7