Blaise Aguera y Arcas: Jaw-dropping Photosynth demo

Блез Агуэра-и-Аркас: Как Photosynth связывает фотографии

45,610 views

2007-06-26 ・ TED


New videos

Blaise Aguera y Arcas: Jaw-dropping Photosynth demo

Блез Агуэра-и-Аркас: Как Photosynth связывает фотографии

45,610 views ・ 2007-06-26

TED


Пожалуйста, дважды щелкните на английские субтитры ниже, чтобы воспроизвести видео.

00:25
What I'm going to show you first, as quickly as I can,
0
25000
2548
Прежде всего, как можно скорее, я хочу представить вам
00:27
is some foundational work, some new technology
1
27572
3769
одну серьезную работу, новую технологию,
00:31
that we brought to Microsoft as part of an acquisition
2
31365
2611
которую мы предоставили Microsoft как часть её приобретения
00:34
almost exactly a year ago.
3
34000
1821
почти год назад. Это Seadragon («Морской дракон»).
00:35
This is Seadragon, and it's an environment
4
35845
2368
В этом режиме можно работать
00:38
in which you can either locally or remotely interact
5
38237
2476
00:40
with vast amounts of visual data.
6
40737
2119
с огромным количеством видеоинформации, локально или удаленно.
00:43
We're looking at many, many gigabytes of digital photos here
7
43165
3404
Перед нашими глазами проходят мириады гигабайт цифровых фотографий,
00:46
and kind of seamlessly and continuously zooming in,
8
46593
2915
и мы можем незаметно и непрерывно увеличивать изображение,
00:49
panning through it, rearranging it in any way we want.
9
49532
2545
горизонтально его прокручивать, перестраивать его, как хотим.
00:52
And it doesn't matter how much information we're looking at,
10
52389
3587
Не имеет значения, сколько информации проходит у нас перед глазами,
00:56
how big these collections are or how big the images are.
11
56000
2976
насколько велики эти коллекции или сами изображения.
00:59
Most of them are ordinary digital camera photos,
12
59000
2286
Большинство из них — это снимки, сделанные обычным цифровым фотоаппаратом,
01:01
but this one, for example, is a scan from the Library of Congress,
13
61310
3144
но вот эта, например, отсканирована в Библиотеке Конгресса,
01:04
and it's in the 300 megapixel range.
14
64478
2818
она выполнена с разрешением в 300 мегапикселей.
01:07
It doesn't make any difference
15
67320
1656
Но это не имеет никакого значения,
01:09
because the only thing that ought to limit the performance of a system like this one
16
69000
4144
потому что единственное, что ограничивает эффективность
подобной системы — это количество пикселей на вашем экране
01:13
is the number of pixels on your screen at any given moment.
17
73168
2777
01:15
It's also very flexible architecture.
18
75969
1970
в данный момент. Это очень гибкая архитектура.
01:17
This is an entire book, so this is an example of non-image data.
19
77963
3727
Вот целая книга, пример данных без изображения.
01:21
This is "Bleak House" by Dickens.
20
81714
2787
Это «Холодный дом» Диккенса. Каждый столбец — это глава.
01:24
Every column is a chapter.
21
84525
2784
01:27
To prove to you that it's really text, and not an image,
22
87333
3643
Чтобы доказать вам, что это на самом деле текст, а не изображение,
01:31
we can do something like so, to really show
23
91000
2048
мы можем сделать вот что, чтобы действительно показать,
01:33
that this is a real representation of the text; it's not a picture.
24
93072
3192
что это настоящее представление текста; это не рисунок.
01:36
Maybe this is an artificial way to read an e-book.
25
96288
2664
Может быть, читать электронную книгу таким образом не совсем привычно.
01:38
I wouldn't recommend it.
26
98976
1200
Я бы не советовал читать ее так.
01:40
This is a more realistic case, an issue of The Guardian.
27
100200
2848
А это более удачный пример. Это выпуск газеты Guardian.
01:43
Every large image is the beginning of a section.
28
103072
2286
Каждое большое изображение — это начало раздела.
01:45
And this really gives you the joy and the good experience
29
105382
2904
И так вы действительно почувствуете радость и ощущение того,
01:48
of reading the real paper version of a magazine or a newspaper,
30
108310
5183
что читаете настоящую печатную версию журнала или газеты,
01:53
which is an inherently multi-scale kind of medium.
31
113517
2435
которая, по сути, является носителем информации с разными масштабами.
01:55
We've done something
32
115976
1000
Мы кое-что сделали здесь, в уголке
01:57
with the corner of this particular issue of The Guardian.
33
117000
2976
этого выпуска Guardian.
02:00
We've made up a fake ad that's very high resolution --
34
120000
2976
Мы составили фиктивную рекламу очень высокого разрешения,
02:03
much higher than in an ordinary ad --
35
123000
2198
намного выше, чем в обычной рекламе,
02:05
and we've embedded extra content.
36
125222
1754
и вставили дополнительное содержание.
02:07
If you want to see the features of this car, you can see it here.
37
127000
3048
Если вы хотите увидеть характеристики этой машины, они находятся вот здесь.
02:10
Or other models, or even technical specifications.
38
130072
4180
Или другие модели или даже техническое описание.
02:14
And this really gets at some of these ideas
39
134276
3315
Здесь мы приблизились к тому, чтобы
02:17
about really doing away with those limits on screen real estate.
40
137615
4661
покончить со всякими ограничениями реального объема экрана.
02:22
We hope that this means no more pop-ups
41
142300
2111
Мы надеемся, нам больше не понадобятся всплывающие окна
02:24
and other rubbish like that -- shouldn't be necessary.
42
144435
2541
и всякая подобная ерунда.
02:27
Of course, mapping is one of those obvious applications
43
147000
2658
Конечно, один из способов применения подобной технологии, что сразу
02:29
for a technology like this.
44
149682
1294
приходит на ум, — это составление карт.
02:31
And this one I really won't spend any time on,
45
151000
2191
Я не буду на этом останавливаться,
02:33
except to say that we have things to contribute to this field as well.
46
153215
3334
просто скажу, что мы можем кое-что привнести и в данную отрасль.
02:37
But those are all the roads in the U.S.
47
157213
1858
Это все дороги США,
02:39
superimposed on top of a NASA geospatial image.
48
159095
4565
нанесенные поверх геопространственного изображения NASA.
02:44
So let's pull up, now, something else.
49
164000
1976
А сейчас давайте остановимся на другом.
02:46
This is actually live on the Web now; you can go check it out.
50
166000
2976
Вот это сейчас размещено в сети в режиме реального времени, вы можете сами посмотреть.
02:49
This is a project called Photosynth, which marries two different technologies.
51
169000
3704
Этот проект называется Photosynth («Фотосинтез»),
он объединяет в себе две различные технологии.
02:52
One of them is Seadragon
52
172728
1248
Одна из них — это Seadragon,
02:54
and the other is some very beautiful computer-vision research
53
174000
2906
а вторая — прекрасное исследование машинного зрения,
02:56
done by Noah Snavely, a graduate student at the University of Washington,
54
176930
3462
выполненное Ноа Снейвли, аспирантом университета Вашингтона,
03:00
co-advised by Steve Seitz at U.W.
55
180416
1829
его консультировали Стив Зейтц из университета Вашингтона
03:02
and Rick Szeliski at Microsoft Research.
56
182269
1978
и Рик Силински из Microsoft Research. Просто прекрасная команда.
03:04
A very nice collaboration.
57
184271
1733
03:06
And so this is live on the Web. It's powered by Seadragon.
58
186412
3108
Этот проект размещен в сети. Поддерживается с помощью Seadragon.
03:09
You can see that when we do these sorts of views,
59
189544
2504
Вы видите, что когда мы используем эти режимы просмотра,
03:12
where we can dive through images
60
192072
1723
мы можем проникать через изображения
03:13
and have this kind of multi-resolution experience.
61
193819
2334
и получаем эффект переменной разрешающей способности.
03:16
But the spatial arrangement of the images here is actually meaningful.
62
196177
3799
Но пространственное расположение изображений имеет определенный смысл.
03:20
The computer vision algorithms have registered these images together
63
200000
3191
Алгоритмы машинного зрения зарегистрировали эти изображения
03:23
so that they correspond to the real space in which these shots --
64
203215
3761
таким образом, что они соответствуют реальному пространству —
03:27
all taken near Grassi Lakes in the Canadian Rockies --
65
207000
3300
это было снято в районе озер Грасси в канадских горах —
03:30
all these shots were taken.
66
210324
1663
где эти снимки были сделаны. Вы видите элементы
03:32
So you see elements here
67
212011
1467
03:33
of stabilized slide-show or panoramic imaging,
68
213502
6013
устойчивой покадровой или панорамной визуализации,
03:39
and these things have all been related spatially.
69
219539
2437
и всё это было связано в пространстве.
03:42
I'm not sure if I have time to show you any other environments.
70
222000
3000
Я не уверен, есть ли у меня время показать вам другие режимы просмотра.
03:45
Some are much more spatial.
71
225024
1431
Существуют режимы, которые ещё лучше передают пространство.
03:46
I would like to jump straight to one of Noah's original data-sets --
72
226479
3945
Я хотел бы перейти к одному из оригинальных наборов данных Ноа,
03:50
this is from an early prototype that we first got working this summer --
73
230448
3552
они взяты из раннего прототипа Photosynth,
с которым мы впервые начали работать летом,
03:54
to show you what I think
74
234024
1894
чтобы продемонстрировать вам то, что я считаю
03:55
is really the punch line behind the Photosynth technology,
75
235942
3838
действительно кульминационным моментом в этой технологии,
03:59
It's not necessarily so apparent
76
239804
1561
технологии Photosynth. Когда смотришь на режимы просмотра,
04:01
from looking at the environments we've put up on the website.
77
241389
2895
предложенные нами на веб-сайте, это не так заметно.
04:04
We had to worry about the lawyers and so on.
78
244308
2177
Мы тогда переживали по поводу юристов и так далее.
04:06
This is a reconstruction of Notre Dame Cathedral
79
246509
2301
Это реконструкция собора Парижской Богоматери,
04:08
that was done entirely computationally from images scraped from Flickr.
80
248834
3457
полностью выполненная с помощью компьютера на основе изображений,
собранных на сервисе Flickr. Вы просто печатаете «Нотр-Дам» во Flickr’е,
04:12
You just type Notre Dame into Flickr,
81
252315
2019
04:14
and you get some pictures of guys in T-shirts, and of the campus and so on.
82
254358
3854
и получаете изображения ребят в футболках, изображения студенческого городка
и так далее. А каждый из этих оранжевых конусов представляет изображение,
04:18
And each of these orange cones represents an image
83
258236
3146
04:21
that was discovered to belong to this model.
84
261406
3234
относящееся к этой модели.
04:26
And so these are all Flickr images,
85
266000
1976
Это все изображения из Flickr’а,
04:28
and they've all been related spatially in this way.
86
268000
2976
таким образом, они все были соединены пространственно.
04:31
We can just navigate in this very simple way.
87
271000
2334
И навигация здесь очень проста.
04:35
(Applause)
88
275000
3920
(Аплодисменты).
04:42
(Applause ends)
89
282557
1014
04:43
You know, I never thought that I'd end up working at Microsoft.
90
283595
2954
Вы знаете, я никогда не думал, что буду работать в Microsoft.
04:46
It's very gratifying to have this kind of reception here.
91
286573
3000
Такой прием — это просто огромное удовольствие для меня.
04:49
(Laughter)
92
289597
3379
(Смех)
04:53
I guess you can see this is lots of different types of cameras:
93
293000
5048
Думаю, вы видите,
все это многообразие различных видов фотоаппаратов:
04:58
it's everything from cell-phone cameras to professional SLRs,
94
298072
3161
от камеры в мобильном телефоне до профессиональных зеркальных фотоаппаратов,
05:01
quite a large number of them, stitched together in this environment.
95
301257
3191
их много, и они соединены в этом
режиме просмотра.
05:04
If I can find some of the sort of weird ones --
96
304472
2632
Если получится, я найду что-нибудь необычное.
05:08
So many of them are occluded by faces, and so on.
97
308000
3322
Многие изображения перекрываются.
05:12
Somewhere in here there is actually a series of photographs -- here we go.
98
312595
4277
Тут где-то есть серия
фотографий, а, вот они.
05:16
This is actually a poster of Notre Dame that registered correctly.
99
316896
3301
Это плакат собора Парижской Богоматери, правильно зарегистрированный.
05:20
We can dive in from the poster
100
320221
3216
Из этого плаката мы можем перейти
05:23
to a physical view of this environment.
101
323461
3810
в физический ракурс этой среды.
05:31
What the point here really is
102
331421
1866
Дело в том, что мы можем взаимодействовать с социальной средой.
05:33
is that we can do things with the social environment.
103
333311
2591
Брать данные у любого человека,
05:35
This is now taking data from everybody --
104
335926
3002
05:38
from the entire collective memory, visually, of what the Earth looks like --
105
338952
3871
из общей коллективной памяти,
чтобы видеть, как выглядит Земля,
05:42
and link all of that together.
106
342847
1749
и связывать всё это вместе.
05:44
Those photos become linked, and they make something emergent
107
344620
2839
Все эти фотографии связаны вместе,
и из них возникает нечто большее,
05:47
that's greater than the sum of the parts.
108
347483
1953
чем просто сумма составляющих.
05:49
You have a model that emerges of the entire Earth.
109
349460
2356
Вы постепенно получаете модель целой планеты.
05:51
Think of this as the long tail to Stephen Lawler's Virtual Earth work.
110
351840
4077
Считайте, что это продолжение работы Стивена Лоулера «Виртуальная Земля».
05:55
And this is something that grows in complexity as people use it,
111
355941
3200
Когда ее начинают использовать, она становится всё сложнее,
в процессе её использования
05:59
and whose benefits become greater to the users as they use it.
112
359165
3811
увеличиваются её преимущества.
06:03
Their own photos are getting tagged with meta-data that somebody else entered.
113
363000
3692
Фотографии пользователей связываются с метаданными,
которые ввел кто-то другой.
06:06
If somebody bothered to tag all of these saints
114
366716
3360
Если кто-то ввел информацию обо всех этих святых,
06:10
and say who they all are, then my photo of Notre Dame Cathedral
115
370100
2953
указал, кто они такие, тогда моя фотография собора Парижской Богоматери
06:13
suddenly gets enriched with all of that data,
116
373077
2098
внезапно обогащается всеми этими данными,
06:15
and I can use it as an entry point to dive into that space,
117
375199
2777
и я могу ее использовать как точку входа для погружения в это пространство,
06:18
into that meta-verse, using everybody else's photos,
118
378000
2681
в эту метавселенную, используя фотографии других людей
06:20
and do a kind of a cross-modal
119
380705
3301
и, таким образом, приобретя перекрестно-модальный
06:24
and cross-user social experience that way.
120
384030
3751
и перекрестно-пользовательский социальный опыт.
06:27
And of course, a by-product of all of that is immensely rich virtual models
121
387805
4171
И, конечно, побочный результат всего этого —
это виртуальные модели любой интересующей части Земли
06:32
of every interesting part of the Earth,
122
392000
1968
с чрезвычайно богатым содержанием, собранные не только
06:33
collected not just from overhead flights and from satellite images
123
393992
4487
со съемок местности и изображений со спутника
06:38
and so on, but from the collective memory.
124
398503
2052
и из всего такого прочего, но и из коллективной памяти.
06:40
Thank you so much.
125
400579
1094
Большое спасибо.
06:41
(Applause)
126
401697
6863
(Аплодисменты)
06:51
(Applause ends)
127
411967
1001
06:52
Chris Anderson: Do I understand this right?
128
412992
2326
Крис Андерсон: Я правильно понимаю? Ваше программное обеспечение позволит
06:55
What your software is going to allow,
129
415342
2497
06:57
is that at some point, really within the next few years,
130
417863
3476
когда-нибудь, уже в ближайшие несколько лет,
07:01
all the pictures that are shared by anyone across the world
131
421363
4235
по существу, связать воедино все изображения,
07:05
are going to link together?
132
425622
1561
которые кто-либо размещал в сети во всем мире?
07:07
BAA: Yes. What this is really doing is discovering,
133
427207
2387
БАА: Да. Программа их находит.
07:09
creating hyperlinks, if you will, between images.
134
429618
2358
То есть создает гиперссылки, если угодно, между изображениями.
07:12
It's doing that based on the content inside the images.
135
432000
2584
Программа делает это,
основываясь на содержимом изображений.
07:14
And that gets really exciting when you think about the richness
136
434608
3022
Это просто потрясающе, если вы подумаете о богатстве
07:17
of the semantic information a lot of images have.
137
437654
2304
семантической информации, которой обладают большинство из этих изображений.
07:19
Like when you do a web search for images,
138
439982
1960
Например, когда вы ищете изображения в сети,
07:21
you type in phrases,
139
441966
1245
вы набираете фразы, а текст на веб-странице
07:23
and the text on the web page is carrying a lot of information
140
443235
2900
содержит большое количество информации об этом изображении.
07:26
about what that picture is of.
141
446159
1502
07:27
What if that picture links to all of your pictures?
142
447685
2391
А что если это изображение связано со всеми вашими изображениями?
Тогда количество семантических взаимосвязей
07:30
The amount of semantic interconnection and richness
143
450100
2413
и весь тот объем информации, который вы получите,
07:32
that comes out of that is really huge.
144
452537
1854
становится просто огромным. Это классический сетевой эффект.
07:34
It's a classic network effect.
145
454415
1449
07:35
CA: Truly incredible. Congratulations.
146
455888
2024
КА: Блейз, это просто невероятно. Я вас поздравляю.
БАА: Огромное спасибо.
Об этом сайте

Этот сайт познакомит вас с видеороликами YouTube, полезными для изучения английского языка. Вы увидите уроки английского языка, преподаваемые высококлассными учителями со всего мира. Дважды щелкните по английским субтитрам, отображаемым на каждой странице видео, чтобы воспроизвести видео оттуда. Субтитры прокручиваются синхронно с воспроизведением видео. Если у вас есть какие-либо комментарии или пожелания, пожалуйста, свяжитесь с нами, используя эту контактную форму.

https://forms.gle/WvT1wiN1qDtmnspy7