Blaise Aguera y Arcas: Jaw-dropping Photosynth demo

45,610 views ・ 2007-06-26

TED


Моля, кликнете два пъти върху английските субтитри по-долу, за да пуснете видеото.

Translator: George Kremenliev Reviewer: Anton Hikov
00:25
What I'm going to show you first, as quickly as I can,
0
25000
2548
Това което ще Ви покажа първо, набързо,
00:27
is some foundational work, some new technology
1
27572
3769
е в известна степен основополагаща работа, една нова технология
00:31
that we brought to Microsoft as part of an acquisition
2
31365
2611
която донесохме в Майкрософт, като част от една покупка
00:34
almost exactly a year ago.
3
34000
1821
от преди точно една година. Това е Сиидрагън (Водно конче)
00:35
This is Seadragon, and it's an environment
4
35845
2368
Представлява среда, в която можете отблизо или отдалечено,
00:38
in which you can either locally or remotely interact
5
38237
2476
00:40
with vast amounts of visual data.
6
40737
2119
да разглеждате големи обеми от визуална информация.
00:43
We're looking at many, many gigabytes of digital photos here
7
43165
3404
В момента виждате много, много гигабайта цифрови снимки
00:46
and kind of seamlessly and continuously zooming in,
8
46593
2915
с плавно и непрекъснато увеличение,
00:49
panning through it, rearranging it in any way we want.
9
49532
2545
преместване и преподреждане по всевъзможни начини.
00:52
And it doesn't matter how much information we're looking at,
10
52389
3587
Няма значение обема на информацията, която преглеждаме,
00:56
how big these collections are or how big the images are.
11
56000
2976
колко са големи тези колекции, или колко са големи тези изображения.
00:59
Most of them are ordinary digital camera photos,
12
59000
2286
Повечето са снимки от обикновена цифрова камера,
01:01
but this one, for example, is a scan from the Library of Congress,
13
61310
3144
но това например, е сканирано от библиотеката на Конгреса,
01:04
and it's in the 300 megapixel range.
14
64478
2818
и е от порядъка на 300 мегапиксела.
01:07
It doesn't make any difference
15
67320
1656
Няма никакво значение,
01:09
because the only thing that ought to limit the performance of a system like this one
16
69000
4144
защото единственото нещо, което ограничава скоростта
на система като тази, е броя на точките на екрана
01:13
is the number of pixels on your screen at any given moment.
17
73168
2777
01:15
It's also very flexible architecture.
18
75969
1970
във всеки даден момент. Също така това е много гъвкава архитектура.
01:17
This is an entire book, so this is an example of non-image data.
19
77963
3727
Това е една цяла книга, като пример за не-снимкови данни.
01:21
This is "Bleak House" by Dickens.
20
81714
2787
Това е "Студеният дом" на Дикенс. Всяка колона е глава.
01:24
Every column is a chapter.
21
84525
2784
01:27
To prove to you that it's really text, and not an image,
22
87333
3643
За да ви покажа, че това е наистина текст, а не изображение,
01:31
we can do something like so, to really show
23
91000
2048
мога да направя нещо такова, което наистина показва,
01:33
that this is a real representation of the text; it's not a picture.
24
93072
3192
че това е истинско представяне на текста - не е снимка.
01:36
Maybe this is an artificial way to read an e-book.
25
96288
2664
Може би това е леко измислен начин за четене на книги.
01:38
I wouldn't recommend it.
26
98976
1200
Не бих ви го препоръчал.
01:40
This is a more realistic case, an issue of The Guardian.
27
100200
2848
Това е по-реалистичен случай. Това е брой на Гардиън.
01:43
Every large image is the beginning of a section.
28
103072
2286
Всяко голямо изображение е начало на раздел.
01:45
And this really gives you the joy and the good experience
29
105382
2904
И това наистина носи удоволствие и приятно усещане
01:48
of reading the real paper version of a magazine or a newspaper,
30
108310
5183
за четене на хартиеното издание на списание или вестник,
01:53
which is an inherently multi-scale kind of medium.
31
113517
2435
които са среда с различни размери.
01:55
We've done something
32
115976
1000
Също така направихме нещо дребно
01:57
with the corner of this particular issue of The Guardian.
33
117000
2976
в ъгъла на този брой на Гардиън.
02:00
We've made up a fake ad that's very high resolution --
34
120000
2976
Фалшифицирахме една реклама с много висока разделителна способност -
02:03
much higher than in an ordinary ad --
35
123000
2198
много по-висока отколко можете да видите в обикновена реклама -
02:05
and we've embedded extra content.
36
125222
1754
и й добавихме допълнително съдържание.
02:07
If you want to see the features of this car, you can see it here.
37
127000
3048
Ако искате да видите данните за тази кола, можете да ги видите тук.
02:10
Or other models, or even technical specifications.
38
130072
4180
Или други модели, или техническите им характеристики.
02:14
And this really gets at some of these ideas
39
134276
3315
Това наистина показва някои от тези идеи,
02:17
about really doing away with those limits on screen real estate.
40
137615
4661
за това, как можем да се справим с ограниченията в размера на екрана.
02:22
We hope that this means no more pop-ups
41
142300
2111
Надяваме се, това да означава край на изкачащите реклами
02:24
and other rubbish like that -- shouldn't be necessary.
42
144435
2541
и на други подобни глупости - не би трябвало да са необходими.
02:27
Of course, mapping is one of those obvious applications
43
147000
2658
Разбира се, картографирането е едно от тези очевидни приложения
02:29
for a technology like this.
44
149682
1294
за технология като тази.
02:31
And this one I really won't spend any time on,
45
151000
2191
На тази няма да отделям много време,
02:33
except to say that we have things to contribute to this field as well.
46
153215
3334
освен да кажа, че имаме какво да допринесем и в тази област.
02:37
But those are all the roads in the U.S.
47
157213
1858
Това са всички пътища в САЩ
02:39
superimposed on top of a NASA geospatial image.
48
159095
4565
нанесени върху сателитна снимка на НАСА.
02:44
So let's pull up, now, something else.
49
164000
1976
Нека да погледнем сега нещо друго.
02:46
This is actually live on the Web now; you can go check it out.
50
166000
2976
Това е качено в Инернет в момента; можете да го погледнете.
02:49
This is a project called Photosynth, which marries two different technologies.
51
169000
3704
Този проект се нарича Фотосинт,
и свързва две различни технологии.
02:52
One of them is Seadragon
52
172728
1248
Едната от тях е Сиидрагън
02:54
and the other is some very beautiful computer-vision research
53
174000
2906
а другата е едно чудесно изследване на компютърното зрение
02:56
done by Noah Snavely, a graduate student at the University of Washington,
54
176930
3462
направено от Ноа Снейвли, студент във Вашингтонския университет,
03:00
co-advised by Steve Seitz at U.W.
55
180416
1829
с ко-ръководители Стиив Сейц пак оттам
03:02
and Rick Szeliski at Microsoft Research.
56
182269
1978
и Рик Сзелиски от Майкрософт Рисърч. Много добро сътрудничество.
03:04
A very nice collaboration.
57
184271
1733
03:06
And so this is live on the Web. It's powered by Seadragon.
58
186412
3108
И така това е качено в Интернет. Базирано е на Сиидрагън.
03:09
You can see that when we do these sorts of views,
59
189544
2504
Виждате как, като показваме тези изгледи,
03:12
where we can dive through images
60
192072
1723
можем да се потопим в снимките
03:13
and have this kind of multi-resolution experience.
61
193819
2334
и да получим това много-разделително усещане.
03:16
But the spatial arrangement of the images here is actually meaningful.
62
196177
3799
Но пространственото подреждане на образите тук е от значение.
03:20
The computer vision algorithms have registered these images together
63
200000
3191
Алгоритмите за комютърно зрение са подредили тези образи заедно,
03:23
so that they correspond to the real space in which these shots --
64
203215
3761
за да отговарят на действителното пространство, в което тези снимки -
03:27
all taken near Grassi Lakes in the Canadian Rockies --
65
207000
3300
всички направени близо до езерата Граси (Grassi) в канадските Скалисти планини -
03:30
all these shots were taken.
66
210324
1663
са направени. И така, тук виждате елементи
03:32
So you see elements here
67
212011
1467
03:33
of stabilized slide-show or panoramic imaging,
68
213502
6013
от стабилизирана презентация или панорамно изобразяване.
03:39
and these things have all been related spatially.
69
219539
2437
и тези образи са ориентирани в пространството.
03:42
I'm not sure if I have time to show you any other environments.
70
222000
3000
Не съм сигурен дали имам време да ви покажа някои други места.
03:45
Some are much more spatial.
71
225024
1431
Има някои, които са много по-пространствени.
03:46
I would like to jump straight to one of Noah's original data-sets --
72
226479
3945
Искам да мина направо към един от началните набори на Ноа -
03:50
this is from an early prototype that we first got working this summer --
73
230448
3552
и този е от ранен прототип на Фотосинт,
който подкарахме през лятото -
03:54
to show you what I think
74
234024
1894
за да ви покажа, това което мисля,
03:55
is really the punch line behind the Photosynth technology,
75
235942
3838
е основата на тази технология,
03:59
It's not necessarily so apparent
76
239804
1561
технологията на Фотосинт. И тя не е задължително видима
04:01
from looking at the environments we've put up on the website.
77
241389
2895
от местата, които сме сложили на уебсайта.
04:04
We had to worry about the lawyers and so on.
78
244308
2177
Трябваше да се съобразим с адвокатите и други такива.
04:06
This is a reconstruction of Notre Dame Cathedral
79
246509
2301
Това е реконструкция на катедралата Св. Богородица,
04:08
that was done entirely computationally from images scraped from Flickr.
80
248834
3457
която е направена изцяло с изчисления
на база на снимки свалени от Фликр. Ако просто напишете "Notre Dame" във Фликр
04:12
You just type Notre Dame into Flickr,
81
252315
2019
04:14
and you get some pictures of guys in T-shirts, and of the campus and so on.
82
254358
3854
ще получите снимки на хора по тениски, на университета
и така нататък. И всеки един от оранжевите конуси представя изображение
04:18
And each of these orange cones represents an image
83
258236
3146
04:21
that was discovered to belong to this model.
84
261406
3234
което е маркирано, като принадлежащо към този модел.
04:26
And so these are all Flickr images,
85
266000
1976
И така, това всичко са снимки от Фликр,
04:28
and they've all been related spatially in this way.
86
268000
2976
и те са подредени в пространството по този начин.
04:31
We can just navigate in this very simple way.
87
271000
2334
И така можем да навигираме по този прост начин.
04:35
(Applause)
88
275000
3920
(Аплодисменти)
04:42
(Applause ends)
89
282557
1014
04:43
You know, I never thought that I'd end up working at Microsoft.
90
283595
2954
Знаете ли, никога не съм си представял, че един ден ще работя в Майкрософт.
04:46
It's very gratifying to have this kind of reception here.
91
286573
3000
Много е удовлетворително да получа такова посрещане тук.
04:49
(Laughter)
92
289597
3379
(Смях)
04:53
I guess you can see this is lots of different types of cameras:
93
293000
5048
Предполагам можете да видите,
че това са много различни видове фотоапарати:
04:58
it's everything from cell-phone cameras to professional SLRs,
94
298072
3161
всичко - от камери на мобилни телефони до професионални апрати,
05:01
quite a large number of them, stitched together in this environment.
95
301257
3191
доста голям брой от тях, свързани
заедно на това място.
05:04
If I can find some of the sort of weird ones --
96
304472
2632
И ако мога да намеря, ще ви покажа някои странни.
05:08
So many of them are occluded by faces, and so on.
97
308000
3322
Много от тях са закрити от лица, или нещо друго.
05:12
Somewhere in here there is actually a series of photographs -- here we go.
98
312595
4277
Някъде тук имаме
серия от фотографии - ето ги.
05:16
This is actually a poster of Notre Dame that registered correctly.
99
316896
3301
Това всъщност е постер на Св. Богородица с правилно разположение.
05:20
We can dive in from the poster
100
320221
3216
Можем да се потопим от постера
05:23
to a physical view of this environment.
101
323461
3810
до физическия изглед на мястото.
05:31
What the point here really is
102
331421
1866
Основната идея тук е, че можем да правим неща от
05:33
is that we can do things with the social environment.
103
333311
2591
социалната среда. Сега може да получим данни от всеки -
05:35
This is now taking data from everybody --
104
335926
3002
05:38
from the entire collective memory, visually, of what the Earth looks like --
105
338952
3871
от цялото съвместно съзнание
от, визуално, това което представлява Земята -
05:42
and link all of that together.
106
342847
1749
и ни свързва всички заедно.
05:44
Those photos become linked, and they make something emergent
107
344620
2839
И всички тези снимки стават свързани заедно,
и се получава нещо неочаквано,
05:47
that's greater than the sum of the parts.
108
347483
1953
което е по-голямо от сумата на своите части.
05:49
You have a model that emerges of the entire Earth.
109
349460
2356
Имате модел, който се създава от цялата Земя.
05:51
Think of this as the long tail to Stephen Lawler's Virtual Earth work.
110
351840
4077
Можете да мислите за това като за "дългата опашка" на Виртуалната Земя на Стивън Лоулер.
05:55
And this is something that grows in complexity as people use it,
111
355941
3200
И това е нещо, което нараства по сложност
когато хората го използват, и чиито ползи нарастват
05:59
and whose benefits become greater to the users as they use it.
112
359165
3811
за потребителите му, докато го използват.
06:03
Their own photos are getting tagged with meta-data that somebody else entered.
113
363000
3692
Техните собствени снимки биват маркирани с мета-данни
които някой друг е въвел.
06:06
If somebody bothered to tag all of these saints
114
366716
3360
Ако някой друг се е постарал да отбележи всички тези светци
06:10
and say who they all are, then my photo of Notre Dame Cathedral
115
370100
2953
и да каже кои са те, след това моята снимка на катедралата Св. Богородица
06:13
suddenly gets enriched with all of that data,
116
373077
2098
изведнъж се обогатява с цялата тази информция,
06:15
and I can use it as an entry point to dive into that space,
117
375199
2777
и аз мога да я използвам като отправна точка да се потопя в това място
06:18
into that meta-verse, using everybody else's photos,
118
378000
2681
в тази мета-вселена, използвайки снимките на всички останали,
06:20
and do a kind of a cross-modal
119
380705
3301
и да получа един вид междуформено
06:24
and cross-user social experience that way.
120
384030
3751
и междупотребителско социално изживяване.
06:27
And of course, a by-product of all of that is immensely rich virtual models
121
387805
4171
И разбира се, като страничен ефект от това
са изключително богатите виртуални модели
06:32
of every interesting part of the Earth,
122
392000
1968
от всяко интересно кътче на Земята, събрано
06:33
collected not just from overhead flights and from satellite images
123
393992
4487
не само от самолетни и спътникови снимки
06:38
and so on, but from the collective memory.
124
398503
2052
и т.н., но и от съвкупната памет.
06:40
Thank you so much.
125
400579
1094
Много благодаря.
06:41
(Applause)
126
401697
6863
(Аплодисменти)
06:51
(Applause ends)
127
411967
1001
06:52
Chris Anderson: Do I understand this right?
128
412992
2326
Крис Андерсън: Дали разбрах правилно? Това което твоя софтуер ще позволи
06:55
What your software is going to allow,
129
415342
2497
06:57
is that at some point, really within the next few years,
130
417863
3476
е, че в даден момент, през следващите няколко години,
07:01
all the pictures that are shared by anyone across the world
131
421363
4235
всички снимки споделени от всеки по света
07:05
are going to link together?
132
425622
1561
ще бъдат свързани заедно?
07:07
BAA: Yes. What this is really doing is discovering,
133
427207
2387
БАА: Да. Това което правим е откриване.
07:09
creating hyperlinks, if you will, between images.
134
429618
2358
Създаваме хипервръзки, ако искате, между изображения.
07:12
It's doing that based on the content inside the images.
135
432000
2584
И го правим,
на базата на съдържанието на тези изображения.
07:14
And that gets really exciting when you think about the richness
136
434608
3022
И това е доста вълнуващо, когато се замислите за богатството
07:17
of the semantic information a lot of images have.
137
437654
2304
на семантичната информация, която доста от тези снимки имат.
07:19
Like when you do a web search for images,
138
439982
1960
Например когато търсите в интернет за снимки,
07:21
you type in phrases,
139
441966
1245
пишете фрази, и текста на уеб страницата
07:23
and the text on the web page is carrying a lot of information
140
443235
2900
носи много информация за това какво е на картинката.
07:26
about what that picture is of.
141
446159
1502
07:27
What if that picture links to all of your pictures?
142
447685
2391
А какво би станало, ако тази картинка е свързана с всички ваши снимки?
Тогава обема на семантичната взаимосвързаност
07:30
The amount of semantic interconnection and richness
143
450100
2413
и обема на богатството, което идва от това
07:32
that comes out of that is really huge.
144
452537
1854
е наистина огромен. Класическия мрежов ефект.
07:34
It's a classic network effect.
145
454415
1449
07:35
CA: Truly incredible. Congratulations.
146
455888
2024
KA: Блейз, това е наистина невероятно. Поздравления.
БАА: Много благодаря.
Относно този уебсайт

Този сайт ще ви запознае с видеоклипове в YouTube, които са полезни за изучаване на английски език. Ще видите уроци по английски език, преподавани от първокласни учители от цял свят. Кликнете два пъти върху английските субтитри, показани на всяка страница с видеоклипове, за да възпроизведете видеото оттам. Субтитрите се превъртат в синхрон с възпроизвеждането на видеото. Ако имате някакви коментари или искания, моля, свържете се с нас, като използвате тази форма за контакт.

https://forms.gle/WvT1wiN1qDtmnspy7