Blaise Aguera y Arcas: Jaw-dropping Photosynth demo

46,176 views ・ 2007-06-26

TED


A videó lejátszásához kattintson duplán az alábbi angol feliratokra.

Fordító: Attila Volgyi Lektor: Júlia Martonosi
00:25
What I'm going to show you first, as quickly as I can,
0
25000
2548
Amit most megpróbálok minél gyorsabban bemutatni önöknek
00:27
is some foundational work, some new technology
1
27572
3769
az egy alapítványi munka, egy új technológia
00:31
that we brought to Microsoft as part of an acquisition
2
31365
2611
ami egy vásárlás útján került a Microsoft birtokába
00:34
almost exactly a year ago.
3
34000
1821
majdnem pontosan egy évvel ezelőtt. Ez a Seadragon.
00:35
This is Seadragon, and it's an environment
4
35845
2368
Ez egy olyan környezet, amiben akár helyben, akár távolról
00:38
in which you can either locally or remotely interact
5
38237
2476
00:40
with vast amounts of visual data.
6
40737
2119
hatalmas mennyiségű vizuális adatot kezelhetünk.
00:43
We're looking at many, many gigabytes of digital photos here
7
43165
3404
Itt most éppen nagyon-nagyon sok gigabájtnyi digitális fotót láthatnak
00:46
and kind of seamlessly and continuously zooming in,
8
46593
2915
zökkenőmentesen és folyamatosan tudunk nagyítani
00:49
panning through it, rearranging it in any way we want.
9
49532
2545
mozogni a tartalomban, vagy tetszésünk szerint átrendezni
00:52
And it doesn't matter how much information we're looking at,
10
52389
3587
Egyáltalán nem számít, hogy mennyi információt is nézünk,
00:56
how big these collections are or how big the images are.
11
56000
2976
hogy mekkorák ezek a gyűjtemények, vagy az egyes képek.
00:59
Most of them are ordinary digital camera photos,
12
59000
2286
Ezek legtöbbje általános digitális fotó,
01:01
but this one, for example, is a scan from the Library of Congress,
13
61310
3144
de ez az egy például a Kongresszusi Könyvtár scannelt anyaga,
01:04
and it's in the 300 megapixel range.
14
64478
2818
és nagyjából 300 megapixel felbontású.
01:07
It doesn't make any difference
15
67320
1656
De ez sem jelent semmi különbséget
01:09
because the only thing that ought to limit the performance of a system like this one
16
69000
4144
mert az egyetlen dolog, ami a rendszer teljesítményét befolyásolja
az a képernyőn éppen látható képpontok száma
01:13
is the number of pixels on your screen at any given moment.
17
73168
2777
01:15
It's also very flexible architecture.
18
75969
1970
bármelyik időpillanatban. Ez a megoldás nagyon rugalmas.
01:17
This is an entire book, so this is an example of non-image data.
19
77963
3727
Ez itt egy teljes könyv, példa a nem képi adatokra.
01:21
This is "Bleak House" by Dickens.
20
81714
2787
Dickens Puszta Ház című könyve. Minden oszlop egy fejezet.
01:24
Every column is a chapter.
21
84525
2784
01:27
To prove to you that it's really text, and not an image,
22
87333
3643
Hogy bizonyítsuk, hogy ez tényleg szöveg, és nem kép,
01:31
we can do something like so, to really show
23
91000
2048
csinálhatunk például így, hogy megmutassuk
01:33
that this is a real representation of the text; it's not a picture.
24
93072
3192
hogy ez tényleg szöveges tartalom; nem egy kép.
01:36
Maybe this is an artificial way to read an e-book.
25
96288
2664
Talán ez is egy lehetséges mód az e-könyv olvasásra.
01:38
I wouldn't recommend it.
26
98976
1200
Én nem ajánlanám.
01:40
This is a more realistic case, an issue of The Guardian.
27
100200
2848
Ez egy sokkal élethűbb alkalmazás. A Guardian egyik száma.
01:43
Every large image is the beginning of a section.
28
103072
2286
Mindegyik nagy kép egy rovat kezdete.
01:45
And this really gives you the joy and the good experience
29
105382
2904
Ez pedig az igazi élmény és szórakozás a dologban
01:48
of reading the real paper version of a magazine or a newspaper,
30
108310
5183
egy újság vagy magazin igazi nyomtatott változatát olvasni,
01:53
which is an inherently multi-scale kind of medium.
31
113517
2435
amiben jellemzően mindennek más lehet a mérete.
01:55
We've done something
32
115976
1000
Egy kicsit módosítottuk ezt a sarkát
01:57
with the corner of this particular issue of The Guardian.
33
117000
2976
a Guardian egyik nyomtatott számának.
02:00
We've made up a fake ad that's very high resolution --
34
120000
2976
Lecseréltük ezt a hirdetést egy nagyon nagy felbontásúra --
02:03
much higher than in an ordinary ad --
35
123000
2198
sokkal nagyobb felbontásúra, mint amit ki lehetne nyomtatni --
02:05
and we've embedded extra content.
36
125222
1754
és bele helyeztünk némi extra tartalmat.
02:07
If you want to see the features of this car, you can see it here.
37
127000
3048
Ha látni szeretnék a kocsi paramétereit, itt megnézhetik.
02:10
Or other models, or even technical specifications.
38
130072
4180
Vagy más modelleket, esetleg a műszaki adatait is.
02:14
And this really gets at some of these ideas
39
134276
3315
És így kezdenek ezzel a módszerrel
02:17
about really doing away with those limits on screen real estate.
40
137615
4661
megszűnni a képernyő méretek által szabott korlátok.
02:22
We hope that this means no more pop-ups
41
142300
2111
Reméljük, hogy ezzel eltűnnek majd a felugró hirdetések
02:24
and other rubbish like that -- shouldn't be necessary.
42
144435
2541
és minden hasonló zavaró megoldás -- nem lesz rájuk szükség.
02:27
Of course, mapping is one of those obvious applications
43
147000
2658
Persze a térképészet az egyik legkézenfekvőbb terület
02:29
for a technology like this.
44
149682
1294
egy ilyen technológia alkalmazására.
02:31
And this one I really won't spend any time on,
45
151000
2191
Erre igazán nem is akarok sok időt pazarolni,
02:33
except to say that we have things to contribute to this field as well.
46
153215
3334
csak hogy ezen a területen is fel tudunk mutatni pár dolgot.
02:37
But those are all the roads in the U.S.
47
157213
1858
Ez itt az USA teljes úthálózata
02:39
superimposed on top of a NASA geospatial image.
48
159095
4565
ráhelyezve a NASA egyik föld képére.
02:44
So let's pull up, now, something else.
49
164000
1976
Hagyjuk most ezt, jöjjön valami más.
02:46
This is actually live on the Web now; you can go check it out.
50
166000
2976
Ez már mind elérhető a világhálón; próbálják csak ki.
02:49
This is a project called Photosynth, which marries two different technologies.
51
169000
3704
Ennek a projektnek a neve Photosynth,
két különböző technológia remek házassága.
02:52
One of them is Seadragon
52
172728
1248
Az egyik közülük a Seadragon
02:54
and the other is some very beautiful computer-vision research
53
174000
2906
a másik pedig egy nagyon látványos kutatás
02:56
done by Noah Snavely, a graduate student at the University of Washington,
54
176930
3462
amit a Washingtoni Egyetemen az egyik végzős diák, Noah Snavely végzett,
03:00
co-advised by Steve Seitz at U.W.
55
180416
1829
Steve Seitz irányítása alatt
03:02
and Rick Szeliski at Microsoft Research.
56
182269
1978
a Microsoft kutatói közül pedig Rick Szeliskivel. Nagyon szép együttműködés.
03:04
A very nice collaboration.
57
184271
1733
03:06
And so this is live on the Web. It's powered by Seadragon.
58
186412
3108
És ez is fent van az Interneten. Ezt is a Seadragon működteti.
03:09
You can see that when we do these sorts of views,
59
189544
2504
Láthatják, hogy mi jelenik meg ezekben a nézetekben,
03:12
where we can dive through images
60
192072
1723
vessük magunkat a képek közé
03:13
and have this kind of multi-resolution experience.
61
193819
2334
ez a többszörös felbontás különleges élménye.
03:16
But the spatial arrangement of the images here is actually meaningful.
62
196177
3799
Viszont itt a képek térbeli elrendezése lényeges igazán.
03:20
The computer vision algorithms have registered these images together
63
200000
3191
A képeket a számítógépes látvány-algoritmusok rendezték el,
03:23
so that they correspond to the real space in which these shots --
64
203215
3761
olyan módon, ahogyan a valós térben is elhelyezkednek --
03:27
all taken near Grassi Lakes in the Canadian Rockies --
65
207000
3300
mind a Grassi Tónál készült a kanadai Sziklás hegységben.
03:30
all these shots were taken.
66
210324
1663
Ezek itt fotó részletek egy összetett
03:32
So you see elements here
67
212011
1467
03:33
of stabilized slide-show or panoramic imaging,
68
213502
6013
diavetítésben, vagy egy panoráma képben.
03:39
and these things have all been related spatially.
69
219539
2437
és mind térbeli kapcsolatban állnak egymással.
03:42
I'm not sure if I have time to show you any other environments.
70
222000
3000
Nem vagyok benne biztos, hogy az idő elég más helyeket mutatni.
03:45
Some are much more spatial.
71
225024
1431
Vannak, amik ennél sokkal térbelibbek.
03:46
I would like to jump straight to one of Noah's original data-sets --
72
226479
3945
Rögtön át is ugrok Noah egyik eredeti adat halmazára --
03:50
this is from an early prototype that we first got working this summer --
73
230448
3552
és ez még egy korai Photosynth prototípusból való
amivel a nyáron dolgoztunk először --
03:54
to show you what I think
74
234024
1894
megmutatom, mit tartok én
03:55
is really the punch line behind the Photosynth technology,
75
235942
3838
ennek a technológiának a valós értelmének,
03:59
It's not necessarily so apparent
76
239804
1561
a Photosynth értelme. Talán nem látja mindenki rögtön
04:01
from looking at the environments we've put up on the website.
77
241389
2895
azokon a helyszíneken, amiket feltettünk a weboldalra.
04:04
We had to worry about the lawyers and so on.
78
244308
2177
Tartottunk az ügyvedektől és a perektől.
04:06
This is a reconstruction of Notre Dame Cathedral
79
246509
2301
Ez a Notre Dame katedrális modellje
04:08
that was done entirely computationally from images scraped from Flickr.
80
248834
3457
amit teljes egészében számítógép generált
a Flickrről letöltött képekből. Csak beírják a Flickren, hogy Notre Dame,
04:12
You just type Notre Dame into Flickr,
81
252315
2019
04:14
and you get some pictures of guys in T-shirts, and of the campus and so on.
82
254358
3854
és felhoz néhány képet pólós srácokról, és a környékről
és így tovább. Mindegyik narancssárga kúp egy képet jelez
04:18
And each of these orange cones represents an image
83
258236
3146
04:21
that was discovered to belong to this model.
84
261406
3234
ami ehhez a modellhez tartozik.
04:26
And so these are all Flickr images,
85
266000
1976
Nos ezek itt a képek a Flickr-ről,
04:28
and they've all been related spatially in this way.
86
268000
2976
és így viszonyulnak egymáshoz a térben.
04:31
We can just navigate in this very simple way.
87
271000
2334
Ennyire egyszerűen tudunk köztük navigálni.
04:35
(Applause)
88
275000
3920
(Taps)
04:42
(Applause ends)
89
282557
1014
04:43
You know, I never thought that I'd end up working at Microsoft.
90
283595
2954
Tudják, én sosem hittem, hogy a Microsoftnál fogok egyszer dolgozni.
04:46
It's very gratifying to have this kind of reception here.
91
286573
3000
Örülök, hogy ilyen remek fogadtatásban részesül.
04:49
(Laughter)
92
289597
3379
(Nevetés)
04:53
I guess you can see this is lots of different types of cameras:
93
293000
5048
Gondolom mind látják
ezek mind más fényképezőgéppel készültek:
04:58
it's everything from cell-phone cameras to professional SLRs,
94
298072
3161
van köztük mindenféle, mobiltelefontól profi fényképezőgépig.
05:01
quite a large number of them, stitched together in this environment.
95
301257
3191
elég sok féle, összeillesztve
egymás mellé ebben a térben.
05:04
If I can find some of the sort of weird ones --
96
304472
2632
És talán megtalálok párat a furcsábbak közül is.
05:08
So many of them are occluded by faces, and so on.
97
308000
3322
Egy csomó képbe belógnak arcok, és ilyesmi.
05:12
Somewhere in here there is actually a series of photographs -- here we go.
98
312595
4277
Van itt valahol egy olyan sorozat is
néhány képpel -- itt is van.
05:16
This is actually a poster of Notre Dame that registered correctly.
99
316896
3301
Ez egy poszter a Notre Dame-ról, ami tökéletesen illeszkedik a modellre.
05:20
We can dive in from the poster
100
320221
3216
Át tudunk váltani más képekre a poszterről is
05:23
to a physical view of this environment.
101
323461
3810
egy másik, fizikai nézetre ebben a térben.
05:31
What the point here really is
102
331421
1866
A lényeg itt az, hogy rendkívüli dolgokat tehetünk
05:33
is that we can do things with the social environment.
103
333311
2591
a társadalmi közegben. Mindenkitől szerezhetünk információkat --
05:35
This is now taking data from everybody --
104
335926
3002
05:38
from the entire collective memory, visually, of what the Earth looks like --
105
338952
3871
az egész össz-közösségi emléktárból
vizuálisan felépítve, ahogy a Föld kinéz --
05:42
and link all of that together.
106
342847
1749
és mindezt összekapcsolhatjuk.
05:44
Those photos become linked, and they make something emergent
107
344620
2839
Az összes fotót összekapcsolja,
és valami rendkívülit eredményez
05:47
that's greater than the sum of the parts.
108
347483
1953
ami sokkal nagyobb az alkotóelemei összességénél.
05:49
You have a model that emerges of the entire Earth.
109
349460
2356
Van egy modell, ami magába foglalja a teljes Földet.
05:51
Think of this as the long tail to Stephen Lawler's Virtual Earth work.
110
351840
4077
Gondoljanak rá úgy, mint Stephen Lawyer Virtuális Föld munkája.
05:55
And this is something that grows in complexity as people use it,
111
355941
3200
És ez valami olyan, ami folyamatosan növekszik
ahogy az emberek használják, és egyre hasznosabbá válik
05:59
and whose benefits become greater to the users as they use it.
112
359165
3811
a felhasználói számára.
06:03
Their own photos are getting tagged with meta-data that somebody else entered.
113
363000
3692
Mindenki fotói meta-adatokkal gazdagodnak
amiket mások adnak hozzájuk.
06:06
If somebody bothered to tag all of these saints
114
366716
3360
Ha valaki mindegyik szentet beazonosítaná
06:10
and say who they all are, then my photo of Notre Dame Cathedral
115
370100
2953
és megmondaná, hogy kicsodák, akkor a fotóm a Notre Dame katedrálisról
06:13
suddenly gets enriched with all of that data,
116
373077
2098
hirtelen gazdagodna mindezzel az információval,
06:15
and I can use it as an entry point to dive into that space,
117
375199
2777
és használhatom kiindulópontként, hogy belépjek ebbe a térbe,
06:18
into that meta-verse, using everybody else's photos,
118
378000
2681
ebbe a meta-verzumba, ami mindenki más fotójából építkezik,
06:20
and do a kind of a cross-modal
119
380705
3301
ezzel egy módok közti
06:24
and cross-user social experience that way.
120
384030
3751
és felhasználók közti közösségi élményt hoz létre.
06:27
And of course, a by-product of all of that is immensely rich virtual models
121
387805
4171
És persze mindezek melléktermékei
rendkívül gazdag látvány modellek
06:32
of every interesting part of the Earth,
122
392000
1968
a Föld minden érdekes területéről, ami
06:33
collected not just from overhead flights and from satellite images
123
393992
4487
nem csak légifelvételekből és műhold képekből áll
06:38
and so on, but from the collective memory.
124
398503
2052
hanem a kollektív emlékezetből épül fel.
06:40
Thank you so much.
125
400579
1094
Nagyon szépen köszönöm.
06:41
(Applause)
126
401697
6863
(Taps)
06:51
(Applause ends)
127
411967
1001
06:52
Chris Anderson: Do I understand this right?
128
412992
2326
Chris Anderson: Jól értem? A szoftveretek lehetővé teszi,
06:55
What your software is going to allow,
129
415342
2497
06:57
is that at some point, really within the next few years,
130
417863
3476
valamikor a következő pár éven belül, hogy
07:01
all the pictures that are shared by anyone across the world
131
421363
4235
minden az emberek által megosztott kép a világon
07:05
are going to link together?
132
425622
1561
lényegében összekapcsolódjon egymással?
07:07
BAA: Yes. What this is really doing is discovering,
133
427207
2387
BAA: Igen. Amit ez igazából jelent, az a felfedezés.
07:09
creating hyperlinks, if you will, between images.
134
429618
2358
Ha úgy tetszik, hiperhivatkozások jönnek létre, a képek között.
07:12
It's doing that based on the content inside the images.
135
432000
2584
És pontosan ezt csinálja
a képek tartalma közötti kapcsolat alapján.
07:14
And that gets really exciting when you think about the richness
136
434608
3022
Ez akkor válik igazán izgalmassá, ha a tartalmi információ
07:17
of the semantic information a lot of images have.
137
437654
2304
gazdagságára gondolnak, ami ezekben a képekben rejlik.
07:19
Like when you do a web search for images,
138
439982
1960
Például amikor a weben képeket keres,
07:21
you type in phrases,
139
441966
1245
begépel egy kifejezést, és a honlapokon levő szöveg
07:23
and the text on the web page is carrying a lot of information
140
443235
2900
hordoz egy csomó információt arról, hogy milyen kép is az.
07:26
about what that picture is of.
141
446159
1502
07:27
What if that picture links to all of your pictures?
142
447685
2391
Mi lenne, ha maguk a képpek hivatkoznának egymásra?
Akkor a tartalmi összefüggések mértéke
07:30
The amount of semantic interconnection and richness
143
450100
2413
és a vele együtt járó gazdagság mértéke
07:32
that comes out of that is really huge.
144
452537
1854
igazán hatalmas lenne. Ez a klasszikus hálózati hatás.
07:34
It's a classic network effect.
145
454415
1449
07:35
CA: Truly incredible. Congratulations.
146
455888
2024
CA: Blaise, ez igazán bámulatos. Gratulálok.
BAA: Köszönöm szépen.
Erről a weboldalról

Ez az oldal olyan YouTube-videókat mutat be, amelyek hasznosak az angol nyelvtanuláshoz. A világ minden tájáról származó, kiváló tanárok által tartott angol leckéket láthatsz. Az egyes videók oldalán megjelenő angol feliratokra duplán kattintva onnan játszhatja le a videót. A feliratok a videó lejátszásával szinkronban gördülnek. Ha bármilyen észrevétele vagy kérése van, kérjük, lépjen kapcsolatba velünk ezen a kapcsolatfelvételi űrlapon.

https://forms.gle/WvT1wiN1qDtmnspy7