Blaise Aguera y Arcas: Jaw-dropping Photosynth demo

46,021 views ・ 2007-06-26

TED


אנא לחץ פעמיים על הכתוביות באנגלית למטה כדי להפעיל את הסרטון.

00:25
What I'm going to show you first, as quickly as I can,
0
25000
2548
מה שאני הולך להראות לכם קודם כול, מהר ככול האפשר,
00:27
is some foundational work, some new technology
1
27572
3769
הוא עבודה בסיסית, טכנולוגיה חדשה
00:31
that we brought to Microsoft as part of an acquisition
2
31365
2611
שהבאנו למיקרוסופט במסגרת רכישה
00:34
almost exactly a year ago.
3
34000
1821
לפני שנה כמעט. זו סידרגון.
00:35
This is Seadragon, and it's an environment
4
35845
2368
סביבה שבה ניתן באופן מקומי או מרחוק
00:38
in which you can either locally or remotely interact
5
38237
2476
00:40
with vast amounts of visual data.
6
40737
2119
לפעול עם כמויות עצומות של נתונים חזותיים.
00:43
We're looking at many, many gigabytes of digital photos here
7
43165
3404
אנו מביטים בהמוני ג'יגה-בייט של תמונות דיגיטליות
00:46
and kind of seamlessly and continuously zooming in,
8
46593
2915
ומגדילים את התצוגה באופן חלק ומתמשך,
00:49
panning through it, rearranging it in any way we want.
9
49532
2545
ונעים בתוך התמונות, מסדרים אותן איך שנרצה,
00:52
And it doesn't matter how much information we're looking at,
10
52389
3587
וזה לא משנה בכמה מידע אנו מביטים,
00:56
how big these collections are or how big the images are.
11
56000
2976
כמה גדולים האוספים או כמה גדולות התמונות.
00:59
Most of them are ordinary digital camera photos,
12
59000
2286
רובן תמונות ממצלמות דיגיטליות פשוטות,
01:01
but this one, for example, is a scan from the Library of Congress,
13
61310
3144
אך זו, למשל, סריקה מספריית הקונגרס,
01:04
and it's in the 300 megapixel range.
14
64478
2818
וזה טווח של 300 מגה-פיקסל.
01:07
It doesn't make any difference
15
67320
1656
זה לא משנה,
01:09
because the only thing that ought to limit the performance of a system like this one
16
69000
4144
כי הדבר היחיד שיכול להגביל ביצועים של
מערכת כזאת הוא מספר הפיקסלים במסך
01:13
is the number of pixels on your screen at any given moment.
17
73168
2777
01:15
It's also very flexible architecture.
18
75969
1970
בכל רגע נתון. זו גם ארכיטקטורה גמישה מאוד.
01:17
This is an entire book, so this is an example of non-image data.
19
77963
3727
זה ספר שלם, דוגמה לנתונים לא-תמונתיים.
01:21
This is "Bleak House" by Dickens.
20
81714
2787
זה "הבית העגום" מאת דיקנס. כל טור הוא פרק.
01:24
Every column is a chapter.
21
84525
2784
01:27
To prove to you that it's really text, and not an image,
22
87333
3643
כדי להוכיח שזה באמת טקסט ולא תמונה,
01:31
we can do something like so, to really show
23
91000
2048
אפשר לעשות משהו כזה, כדי להראות באמת
01:33
that this is a real representation of the text; it's not a picture.
24
93072
3192
שזו תצוגה אמיתית של הטקסט; זו לא תמונה.
01:36
Maybe this is an artificial way to read an e-book.
25
96288
2664
אולי זו דרך מלאכותית לקרוא ספר אלקטרוני.
01:38
I wouldn't recommend it.
26
98976
1200
לא הייתי ממליץ על כך.
01:40
This is a more realistic case, an issue of The Guardian.
27
100200
2848
הנה מקרה יותר מציאותי. זה גיליון של ה"גארדיאן".
01:43
Every large image is the beginning of a section.
28
103072
2286
כל תמונה גדולה מהווה תחילת הקטע.
01:45
And this really gives you the joy and the good experience
29
105382
2904
וזה באמת מעניק את ההנאה והחוויה הנעימה
01:48
of reading the real paper version of a magazine or a newspaper,
30
108310
5183
של קריאת גיליון נייר אמיתי של מגזין או עיתון,
01:53
which is an inherently multi-scale kind of medium.
31
113517
2435
שהוא במהותו מדיום עם קני מידה מרובים.
01:55
We've done something
32
115976
1000
עשינו גם משהו קטן
01:57
with the corner of this particular issue of The Guardian.
33
117000
2976
עם פינה קטנה של גיליון מסוים של ה"גארדיאן".
02:00
We've made up a fake ad that's very high resolution --
34
120000
2976
הכנו פרסומת מזויפת ברזולוציה גבוהה מאוד,
02:03
much higher than in an ordinary ad --
35
123000
2198
גבוהה בהרבה משתוכלו לכלול בפרסומת רגילה,
02:05
and we've embedded extra content.
36
125222
1754
והטמענו תוכן נוסף.
02:07
If you want to see the features of this car, you can see it here.
37
127000
3048
אם תרצו לראות את התכונות של המכונית, תוכלו לראות כאן.
02:10
Or other models, or even technical specifications.
38
130072
4180
או דגמים אחרים, או אפילו מפרטים טכניים.
02:14
And this really gets at some of these ideas
39
134276
3315
וזה באמת נוגע בכמה מהרעיונות
02:17
about really doing away with those limits on screen real estate.
40
137615
4661
להיפטר ממגבלות הנדל"ן של המסך.
02:22
We hope that this means no more pop-ups
41
142300
2111
אנו מקווים שפירוש הדבר הוא סוף לחלונות המוקפצים
02:24
and other rubbish like that -- shouldn't be necessary.
42
144435
2541
וזבל אחר. אין בהם צורך.
02:27
Of course, mapping is one of those obvious applications
43
147000
2658
כמובן, מיפוי הוא אחד היישומים המתבקשים
02:29
for a technology like this.
44
149682
1294
של טכנולוגיה כזאת.
02:31
And this one I really won't spend any time on,
45
151000
2191
ואני לא רוצה לבזבז על זה זמן,
02:33
except to say that we have things to contribute to this field as well.
46
153215
3334
רק אומר שיש לנו מה לתרום גם בתחום הזה.
02:37
But those are all the roads in the U.S.
47
157213
1858
הנה כל הכבישים בארצות הברית
02:39
superimposed on top of a NASA geospatial image.
48
159095
4565
מוצגים על תמונה גיאו-מרחבית של נאסא.
02:44
So let's pull up, now, something else.
49
164000
1976
אז בואו נביא משהו אחר.
02:46
This is actually live on the Web now; you can go check it out.
50
166000
2976
זה כרגע ישר מהאינטרנט; אתם יכולים ללכת לשם ולבדוק.
02:49
This is a project called Photosynth, which marries two different technologies.
51
169000
3704
זהו פרויקט בשם פוטוסינת,
שמשדך בין שתי טכנולוגיות שונות.
02:52
One of them is Seadragon
52
172728
1248
אחת מהם היא סידרגון
02:54
and the other is some very beautiful computer-vision research
53
174000
2906
והשנייה היא מחקר חזותי ממוחשב יפה
02:56
done by Noah Snavely, a graduate student at the University of Washington,
54
176930
3462
של נוח שנייבלי, סטודנט באוניברסיטת וושינגטון,
03:00
co-advised by Steve Seitz at U.W.
55
180416
1829
בייעוץ משותף של סטיב סייץ מהאוניברסיטה
03:02
and Rick Szeliski at Microsoft Research.
56
182269
1978
וריק סליסקי ממחקר מיקרוסופט. שיתוף פעולה מאוד יפה.
03:04
A very nice collaboration.
57
184271
1733
03:06
And so this is live on the Web. It's powered by Seadragon.
58
186412
3108
אז זה ישיר מהרשת. זה מופעל באמצעות סידרגון.
03:09
You can see that when we do these sorts of views,
59
189544
2504
אפשר לראות שכשאנחנו עושים תצוגות כאלו,
03:12
where we can dive through images
60
192072
1723
שבהן אנחנו צוללים לתוך התמונות
03:13
and have this kind of multi-resolution experience.
61
193819
2334
ומקבלים חוויה כזאת עם ריבוי רזולוציות.
03:16
But the spatial arrangement of the images here is actually meaningful.
62
196177
3799
אבל לסידור המרחבי של התמונות כאן יש משמעות.
03:20
The computer vision algorithms have registered these images together
63
200000
3191
אלגוריתמי התצוגה של המחשב רשמו את התמונות ביחד,
03:23
so that they correspond to the real space in which these shots --
64
203215
3761
כך שהן יתאמו לחלל האמיתי שבו הצילומים
03:27
all taken near Grassi Lakes in the Canadian Rockies --
65
207000
3300
נלקחו, ליד גראסי לייקס בהרי הרוקי בקנדה,
03:30
all these shots were taken.
66
210324
1663
אז אפשר לראות כאן רכיבים
03:32
So you see elements here
67
212011
1467
03:33
of stabilized slide-show or panoramic imaging,
68
213502
6013
של תצוגת שקופיות מיוצבת או הדמיה פנורמית,
03:39
and these things have all been related spatially.
69
219539
2437
ובין כל הדברים האלה יש קשר מרחבי.
03:42
I'm not sure if I have time to show you any other environments.
70
222000
3000
אני לא בטוח אם יש לי זמן להראות לכם סביבות אחרות.
03:45
Some are much more spatial.
71
225024
1431
יש כמה הרבה יותר מרחביות.
03:46
I would like to jump straight to one of Noah's original data-sets --
72
226479
3945
אני עובר ישר לאחד מאוספי הנתונים המקוריים של נוח,
03:50
this is from an early prototype that we first got working this summer --
73
230448
3552
וזה מאב-טיפוס מוקדם של פוטוסינת
שהצלחנו להפעיל בקיץ,
03:54
to show you what I think
74
234024
1894
כדי להראות לכם את
03:55
is really the punch line behind the Photosynth technology,
75
235942
3838
מה שאני רואה כשורת המחץ של הטכנולוגיה,
03:59
It's not necessarily so apparent
76
239804
1561
הטכנולוגיה של פוטוסינת. ואין זה ברור בהכרח
04:01
from looking at the environments we've put up on the website.
77
241389
2895
מהסתכלות בסביבות שהעלינו לאתר האינטרנט.
04:04
We had to worry about the lawyers and so on.
78
244308
2177
היינו צריכים להיזהר מעורכי דין וכן הלאה.
04:06
This is a reconstruction of Notre Dame Cathedral
79
246509
2301
זה שחזור של כנסיית נוטר דאם,
04:08
that was done entirely computationally from images scraped from Flickr.
80
248834
3457
כולו באמצעות מחשב,
מתמונות שנאספו מ"פליקר". פשוט מקלידים נוטר דאם "ב"פליקר",
04:12
You just type Notre Dame into Flickr,
81
252315
2019
04:14
and you get some pictures of guys in T-shirts, and of the campus and so on.
82
254358
3854
ומקבלים תמונות של אנשים בחולצות טי, ושל הקמפוס,
וכן הלאה. וכל אחד מהקונוסים הכתומים מייצג תמונה
04:18
And each of these orange cones represents an image
83
258236
3146
04:21
that was discovered to belong to this model.
84
261406
3234
שנמצאה כשייכת למודל הזה.
04:26
And so these are all Flickr images,
85
266000
1976
אז כל אלה תמונות מ"פליקר",
04:28
and they've all been related spatially in this way.
86
268000
2976
ונוצרו ביניהן קשרים מרחביים ככה.
04:31
We can just navigate in this very simple way.
87
271000
2334
וניתן לנווט בדרך הפשוטה הזאת.
04:35
(Applause)
88
275000
3920
(כפיים)
04:42
(Applause ends)
89
282557
1014
04:43
You know, I never thought that I'd end up working at Microsoft.
90
283595
2954
אף פעם לא חשבתי שבסוף אעבוד במיקרוסופט.
04:46
It's very gratifying to have this kind of reception here.
91
286573
3000
משמח לזכות בכזאת קבלה כאן.
04:49
(Laughter)
92
289597
3379
(צחוק)
04:53
I guess you can see this is lots of different types of cameras:
93
293000
5048
אתם בטח יכולים לראות
שאלו סוגים שונים של מצלמות:
04:58
it's everything from cell-phone cameras to professional SLRs,
94
298072
3161
כל דבר ממצלמות סלולריות למצלמות רפלקס,
05:01
quite a large number of them, stitched together in this environment.
95
301257
3191
די הרבה מהן, שנתפרו
ביחד בסביבה הזאת.
05:04
If I can find some of the sort of weird ones --
96
304472
2632
ואם אוכל אמצא כמה מהמוזרים.
05:08
So many of them are occluded by faces, and so on.
97
308000
3322
הרבה מהן מוסתרות על-ידי פנים וכן הלאה.
05:12
Somewhere in here there is actually a series of photographs -- here we go.
98
312595
4277
איפשהו כאן יש
סדרת צילומים, הנה זה.
05:16
This is actually a poster of Notre Dame that registered correctly.
99
316896
3301
זו כרזה של נוטר דאם שנרשמה נכון.
05:20
We can dive in from the poster
100
320221
3216
אפשר לצלול מהכרזה
05:23
to a physical view of this environment.
101
323461
3810
לתצוגה פיזית של הסביבה.
05:31
What the point here really is
102
331421
1866
הרעיון כאן הוא שאפשר לעשות דברים
05:33
is that we can do things with the social environment.
103
333311
2591
עם הסביבה החברתית. זה לוקח נתונים מכולם,
05:35
This is now taking data from everybody --
104
335926
3002
05:38
from the entire collective memory, visually, of what the Earth looks like --
105
338952
3871
מכל הזיכרון הקולקטיבי
של האופן שבו העולם נראה,
05:42
and link all of that together.
106
342847
1749
ומקשר הכול ביחד.
05:44
Those photos become linked, and they make something emergent
107
344620
2839
כל התמונות האלה מקושרות יחד,
ומציגות משהו
05:47
that's greater than the sum of the parts.
108
347483
1953
שגדול יותר מסכום חלקיו.
05:49
You have a model that emerges of the entire Earth.
109
349460
2356
מתגבש מודל של העולם כולו.
05:51
Think of this as the long tail to Stephen Lawler's Virtual Earth work.
110
351840
4077
חשבו על כך כעל זנבו הארוך של "וירצ'ואל ארת'" של סטיבן לולר.
05:55
And this is something that grows in complexity as people use it,
111
355941
3200
וזה דבר שנעשה יותר ויותר מורכב
ככול שאנשים משתמשים בו, ואשר התועלת ממנו גדלה
05:59
and whose benefits become greater to the users as they use it.
112
359165
3811
למשתמשים ככול שהם משתמשים בו.
06:03
Their own photos are getting tagged with meta-data that somebody else entered.
113
363000
3692
התמונות שלהן מתויגות במטה-נתונים
שמישהו אחר מזין.
06:06
If somebody bothered to tag all of these saints
114
366716
3360
אם מישהו מתייג את כל הקדושים האלה
06:10
and say who they all are, then my photo of Notre Dame Cathedral
115
370100
2953
ומספר מי הם, אז התמונה שלי מנוטר דאם
06:13
suddenly gets enriched with all of that data,
116
373077
2098
מועשרת בכל הנתונים הללו,
06:15
and I can use it as an entry point to dive into that space,
117
375199
2777
וניתן להשתמש בהם כנקודת כניסה לחלל הזה,
06:18
into that meta-verse, using everybody else's photos,
118
378000
2681
לעולם הוירטואלי הנתון, באמצעות התמונות של כל האחרים,
06:20
and do a kind of a cross-modal
119
380705
3301
ולחוות מעין חוויה חברתית
06:24
and cross-user social experience that way.
120
384030
3751
בין מודלים ובין משתמשים.
06:27
And of course, a by-product of all of that is immensely rich virtual models
121
387805
4171
וכמובן, ישנו תוצר הלוואי
של מודלים וירטואליים עשירים ביותר
06:32
of every interesting part of the Earth,
122
392000
1968
של כל חלק מעניין בעולם, שנאספו
06:33
collected not just from overhead flights and from satellite images
123
393992
4487
לא רק מתצלומי אוויר ולווין
06:38
and so on, but from the collective memory.
124
398503
2052
וכן הלאה, אלא מהזיכרון הקולקטיבי.
06:40
Thank you so much.
125
400579
1094
תודה רבה לכם.
06:41
(Applause)
126
401697
6863
(כפיים)
06:51
(Applause ends)
127
411967
1001
06:52
Chris Anderson: Do I understand this right?
128
412992
2326
כריס אנדרסון: אני מבין נכון? מה שהתוכנה שלכם תאפשר
06:55
What your software is going to allow,
129
415342
2497
06:57
is that at some point, really within the next few years,
130
417863
3476
הוא שבשלב מסוים, במהלך השנים הקרובות ממש,
07:01
all the pictures that are shared by anyone across the world
131
421363
4235
כל התמונות שמשתפים כל האנשים בעולם
07:05
are going to link together?
132
425622
1561
יהיו מקושרות ביחד?
07:07
BAA: Yes. What this is really doing is discovering,
133
427207
2387
בא"א: כן. מה שזה בעצם עושה זה גילוי.
07:09
creating hyperlinks, if you will, between images.
134
429618
2358
זה יוצר היפר-קישורים, אם תרצה, בין תמונות.
07:12
It's doing that based on the content inside the images.
135
432000
2584
וזה עושה זאת
בהתבסס על תוכן בתוך התמונות.
07:14
And that gets really exciting when you think about the richness
136
434608
3022
וזה מאוד מרגש לחשוב על העושר
07:17
of the semantic information a lot of images have.
137
437654
2304
של המידע הסמנטי שנמצא בהרבה מהתמונות האלו.
07:19
Like when you do a web search for images,
138
439982
1960
למשל כשמחפשים תמונות באינטרנט,
07:21
you type in phrases,
139
441966
1245
מקלידים צירופי מילים, והטקסט בדף האינטרנט
07:23
and the text on the web page is carrying a lot of information
140
443235
2900
מכיל המון מידע אודות נושא התמונה.
07:26
about what that picture is of.
141
446159
1502
07:27
What if that picture links to all of your pictures?
142
447685
2391
מה קורה אם התמונה מקושרת לכל התמונות שלך?
אז הכמות של הקישורים ההדדיים הסמנטיים
07:30
The amount of semantic interconnection and richness
143
450100
2413
והעושר שמגיע מכך
07:32
that comes out of that is really huge.
144
452537
1854
עצומים באמת. זהו אפקט רשת קלאסי.
07:34
It's a classic network effect.
145
454415
1449
07:35
CA: Truly incredible. Congratulations.
146
455888
2024
כ"א: בלייז, זה באמת מדהים. ברכותיי.
.בא"א: תודה רבה
על אתר זה

אתר זה יציג בפניכם סרטוני YouTube המועילים ללימוד אנגלית. תוכלו לראות שיעורי אנגלית המועברים על ידי מורים מהשורה הראשונה מרחבי העולם. לחץ פעמיים על הכתוביות באנגלית המוצגות בכל דף וידאו כדי להפעיל את הסרטון משם. הכתוביות גוללות בסנכרון עם הפעלת הווידאו. אם יש לך הערות או בקשות, אנא צור איתנו קשר באמצעות טופס יצירת קשר זה.

https://forms.gle/WvT1wiN1qDtmnspy7