How we teach computers to understand pictures | Fei Fei Li

Fei-Fei Li: Resimleri anlamaları için bilgisayarları nasıl eğitiyoruz

1,162,036 views

2015-03-23 ・ TED


New videos

How we teach computers to understand pictures | Fei Fei Li

Fei-Fei Li: Resimleri anlamaları için bilgisayarları nasıl eğitiyoruz

1,162,036 views ・ 2015-03-23

TED


Videoyu oynatmak için lütfen aşağıdaki İngilizce altyazılara çift tıklayınız.

Çeviri: Ömer Elveren Gözden geçirme: Ramazan Şen
00:14
Let me show you something.
0
14366
3738
Müsadenizle size bazı şeyler göstermek istiyorum.
(Video) Kız: Tamam, burada yatağın üzerinde oturan bir kedi var.
00:18
(Video) Girl: Okay, that's a cat sitting in a bed.
1
18104
4156
Çocuk fili okşuyor.
00:22
The boy is petting the elephant.
2
22260
4040
00:26
Those are people that are going on an airplane.
3
26300
4354
Buradaki insanlar uçağa gidiyorlar.
00:30
That's a big airplane.
4
30654
2810
Bu büyük bir uçak.
00:33
Fei-Fei Li: This is a three-year-old child
5
33464
2206
Fei-Fei Li: Üç yaşında küçük bir kız çocuğu
00:35
describing what she sees in a series of photos.
6
35670
3679
fotoğraflarda ne gördüğünü anlatıyor.
00:39
She might still have a lot to learn about this world,
7
39349
2845
Henüz, dünya hakkında öğrenmesi gereken çok şey var
00:42
but she's already an expert at one very important task:
8
42194
4549
fakat çok önemli bir alanda uzman olmuş bile:
00:46
to make sense of what she sees.
9
46743
2846
gördüklerini anlamlandırma.
00:50
Our society is more technologically advanced than ever.
10
50229
4226
Toplumumuz teknolojik olarak her zamankinden daha fazla ilerlemiş durumda.
00:54
We send people to the moon, we make phones that talk to us
11
54455
3629
İnsanları aya gönderiyoruz, bizimle konuşabilen ya da radyo kanallarını
00:58
or customize radio stations that can play only music we like.
12
58084
4946
sadece sevdiğimiz müzikleri çalması için düzenleyebilen telefonlar yapıyoruz.
01:03
Yet, our most advanced machines and computers
13
63030
4055
En gelişmiş makinelerimiz ve bilgisayarlarımız
01:07
still struggle at this task.
14
67085
2903
hâlâ bu özelliği elde etmeye çalışıyorlar.
01:09
So I'm here today to give you a progress report
15
69988
3459
Bugün, bilgisayar görme yetisi üzerine yapılan ileri düzeydeki
01:13
on the latest advances in our research in computer vision,
16
73447
4047
araştırmalarımızın işleyişi hakkında size bilgi vermek için buradayım.
01:17
one of the most frontier and potentially revolutionary
17
77494
4161
Bilgisayar biliminde, en önde ve devrim niteliğinde
01:21
technologies in computer science.
18
81655
3206
olan teknolojik gelişmelerden biri.
01:24
Yes, we have prototyped cars that can drive by themselves,
19
84861
4551
Evet, kendini sürebilen araçların prototiplerine sahibiz,
01:29
but without smart vision, they cannot really tell the difference
20
89412
3853
fakat akıllı görme yetisine sahip olmadan, üzerinden geçilebilecek buruşmuş bir
01:33
between a crumpled paper bag on the road, which can be run over,
21
93265
3970
kağıt torba ile sakınılması gereken aynı boyuttaki bir kaya
01:37
and a rock that size, which should be avoided.
22
97235
3340
arasındaki farkı söyleyebilmeleri mümkün değil.
01:41
We have made fabulous megapixel cameras,
23
101415
3390
Mükemmel çözünürlükte kameralar yapmamıza rağmen,
01:44
but we have not delivered sight to the blind.
24
104805
3135
görebilmelerini sağlayamamıştık.
01:48
Drones can fly over massive land,
25
108420
3305
İnsansız hava araçları koca bir araziyi uçabilirler,
01:51
but don't have enough vision technology
26
111725
2134
ama yağmur ormanlarındaki değişimleri izlememize yardımcı olabilecek
01:53
to help us to track the changes of the rainforests.
27
113859
3461
düzeyde yeterli bir görüş kabiliyetine sahip değiller.
01:57
Security cameras are everywhere,
28
117320
2950
Güvenlik kameraları her yerde,
02:00
but they do not alert us when a child is drowning in a swimming pool.
29
120270
5067
fakat bir çocuk havuzda boğuluyorken bizi uyaramıyorlar.
02:06
Photos and videos are becoming an integral part of global life.
30
126167
5595
Fotoğraf ve videolar gündelik hayatın bir parçası haline geliyorlar.
02:11
They're being generated at a pace that's far beyond what any human,
31
131762
4087
Herhangi bir insan veya bazı grupların görme umuduyla
02:15
or teams of humans, could hope to view,
32
135849
2783
hızlı bir şekilde çoğalıyorlar,
02:18
and you and I are contributing to that at this TED.
33
138632
3921
buradaki TED konuşmaları ile sizler ve ben de buna katkı sağlıyoruz.
02:22
Yet our most advanced software is still struggling at understanding
34
142553
5232
En iyi yazılımımız hala bu devasa içeriği
anlamaya ve yönetmeye çabalıyor.
02:27
and managing this enormous content.
35
147785
3876
02:31
So in other words, collectively as a society,
36
151661
5272
Başka bir anlamda, toplumun tamamı olarak
02:36
we're very much blind,
37
156933
1746
büyük bir görme kaybına sahibiz
02:38
because our smartest machines are still blind.
38
158679
3387
çünkü en iyi makinelerimiz hala göremiyorlar.
02:43
"Why is this so hard?" you may ask.
39
163526
2926
"Neden bu kadar zor ki bu?" diye soracaksınız.
02:46
Cameras can take pictures like this one
40
166452
2693
Kameralar burada da olduğu gibi fotoğraf çekebilirler,
02:49
by converting lights into a two-dimensional array of numbers
41
169145
3994
ışığın iki boyutlu sayı dizilerine çevrilmiş hali ile,
02:53
known as pixels,
42
173139
1650
ki bunlara pikseller diyoruz.
02:54
but these are just lifeless numbers.
43
174789
2251
Fakat burada sadece ölü sayılar bulunmakta.
02:57
They do not carry meaning in themselves.
44
177040
3111
Kendi içlerinde herhangi bir anlam taşımıyorlar.
03:00
Just like to hear is not the same as to listen,
45
180151
4343
Nasıl ki duymak ile dinlemek aynı anlama gelmiyorsa
03:04
to take pictures is not the same as to see,
46
184494
4040
fotoğraf çekmek ile görmek de aynı şeyi ifade etmiyor.
03:08
and by seeing, we really mean understanding.
47
188534
3829
Görmek derken ciddi manada "anlamayı" kastediyoruz.
03:13
In fact, it took Mother Nature 540 million years of hard work
48
193293
6177
Aslında, bu yetiye sahip olabilmemiz
tabiat ananın 540 milyon yılını aldı.
03:19
to do this task,
49
199470
1973
03:21
and much of that effort
50
201443
1881
Bu çabanın çoğu, beynin görsel
03:23
went into developing the visual processing apparatus of our brains,
51
203324
5271
işleme bölümünün gelişimine gitti
03:28
not the eyes themselves.
52
208595
2647
sadece gözlerin kendisine değil.
03:31
So vision begins with the eyes,
53
211242
2747
Yani görmek gözlerde başlıyor,
03:33
but it truly takes place in the brain.
54
213989
3518
ama asıl olarak beynin bir bölümünde anlam kazanıyor.
03:38
So for 15 years now, starting from my Ph.D. at Caltech
55
218287
5060
15 sene önce, Caltech'deki doktorama başladığımda
03:43
and then leading Stanford's Vision Lab,
56
223347
2926
ve sonra Stanford Görsel Laboratuvarını yönlendirdiğimde
03:46
I've been working with my mentors, collaborators and students
57
226273
4396
mentorlerim, iş ortaklarım ve öğrencilerimle birlikte
03:50
to teach computers to see.
58
230669
2889
bilgisayarlara görmeyi öğretmek için çalışıyorduk.
03:54
Our research field is called computer vision and machine learning.
59
234658
3294
Araştırma alanımız bilgisayar görme yetisi ve makine öğrenimi olarak anılıyordu.
03:57
It's part of the general field of artificial intelligence.
60
237952
3878
Yapay zeka bölümünün genel bir dalı olarak geçiyordu.
04:03
So ultimately, we want to teach the machines to see just like we do:
61
243000
5493
Nihayetinde, makinelere tıpkı bizim gibi görebilmelerini öğretmek istedik,
04:08
naming objects, identifying people, inferring 3D geometry of things,
62
248493
5387
nesnelerin isimlendirilmesi, insanların tanımlanması, 3B geometrileri tahmin
04:13
understanding relations, emotions, actions and intentions.
63
253880
5688
ilişkileri anlama, duygular, olaylar ve şiddet.
04:19
You and I weave together entire stories of people, places and things
64
259568
6153
Şu anda insanların, yerlerin ve eşyaların bütün hikayesini
04:25
the moment we lay our gaze on them.
65
265721
2164
gözler önüne serip beraber dokuyalım.
04:28
The first step towards this goal is to teach a computer to see objects,
66
268955
5583
Bu amaca doğru atılacak ilk adım bilgisayara gördüğü şeyleri öğretmek,
04:34
the building block of the visual world.
67
274538
3368
sanal dünyanın yapı taşı bu.
04:37
In its simplest terms, imagine this teaching process
68
277906
4434
Basit anlamda bu öğretme sürecini bi hayal edin,
04:42
as showing the computers some training images
69
282340
2995
bilgisayara belirli bir nesnenin ya da bir kedinin diyelim
04:45
of a particular object, let's say cats,
70
285335
3321
deneme amaçlı resimlerini göstermek gibi
04:48
and designing a model that learns from these training images.
71
288656
4737
ve bu resimlerden öğrenilmiş bir model tasarlamayı.
04:53
How hard can this be?
72
293393
2044
Bu ne kadar zor olabilir ki?
04:55
After all, a cat is just a collection of shapes and colors,
73
295437
4052
Sonuç olarak, bir kedi sadece şekillerin ve renklerin bir derlemesi
04:59
and this is what we did in the early days of object modeling.
74
299489
4086
ve bu ilk zamanlarda yaptığımız nesne modellemesi.
05:03
We'd tell the computer algorithm in a mathematical language
75
303575
3622
Algoritmasını sayısal bir dille bilgisayara öğretmemiz gerekiyordu
05:07
that a cat has a round face, a chubby body,
76
307197
3343
bu kedi yuvarak bir yüze, dolgun bir vücuda
05:10
two pointy ears, and a long tail,
77
310540
2299
iki noktada kulaklara ve uzun bir kuyruğa sahip
05:12
and that looked all fine.
78
312839
1410
her şey yolunda gibi.
05:14
But what about this cat?
79
314859
2113
Peki, ya bu kedi?
05:16
(Laughter)
80
316972
1091
(Gülüşmeler)
05:18
It's all curled up.
81
318063
1626
Hepsi iç içe.
05:19
Now you have to add another shape and viewpoint to the object model.
82
319689
4719
Bu nesne için için farklı bir şekil ve farklı bir bakış açısı eklemeniz gerek.
05:24
But what if cats are hidden?
83
324408
1715
Peki ya kediler gizlenirse?
05:27
What about these silly cats?
84
327143
2219
Bu absürd kedilere ne demeli?
05:31
Now you get my point.
85
331112
2417
Şimdi ne demek istediğimi anladınız.
05:33
Even something as simple as a household pet
86
333529
3367
Evdeki kedi gibi basit bir şey için bile
05:36
can present an infinite number of variations to the object model,
87
336896
4504
sonsuz çeşitlilikte nesne modellemesi yapmak mümkün
05:41
and that's just one object.
88
341400
2233
ve bu sadece bir nesne.
05:44
So about eight years ago,
89
344573
2492
Yaklaşık sekiz yıl önce,
05:47
a very simple and profound observation changed my thinking.
90
347065
5030
oldukça basit ama yoğun bir gözlem fikrimi değiştirdi.
05:53
No one tells a child how to see,
91
353425
2685
Hiç kimse bir çocuğa nasıl görebileceğini öğretmez,
05:56
especially in the early years.
92
356110
2261
özellikle de erken yaşlarda.
05:58
They learn this through real-world experiences and examples.
93
358371
5000
Gerçek dünya tecrübeleri ve örnekleriyle öğrenirler bunu.
06:03
If you consider a child's eyes
94
363371
2740
Bir çocuğun gözlerini düşünecek olursanız
06:06
as a pair of biological cameras,
95
366111
2554
sanki bir çift biyolojik kameraymış gibi,
06:08
they take one picture about every 200 milliseconds,
96
368665
4180
yaklaşık her 200 milisaniyede bir fotoğraf çekerler,
06:12
the average time an eye movement is made.
97
372845
3134
göz hareketinden oluşmuş ortalama bir zaman dilimi.
06:15
So by age three, a child would have seen hundreds of millions of pictures
98
375979
5550
Yani üç yaşında bir çocuk, gerçek hayatta yüz milyonlarca
06:21
of the real world.
99
381529
1834
fotoğraf görmüş olacak.
06:23
That's a lot of training examples.
100
383363
2280
Bu oldukça fazla deneme örneği.
06:26
So instead of focusing solely on better and better algorithms,
101
386383
5989
Sadece daha iyi algoritmalara odaklanmak yerine,
06:32
my insight was to give the algorithms the kind of training data
102
392372
5272
sezilerim algoritmalara bir tür eğitici veri vermek üzerineydi,
06:37
that a child was given through experiences
103
397644
3319
tıpkı bir çocuğa sayıca ve kalitece
06:40
in both quantity and quality.
104
400963
3878
deneyimleri yoluyla verilmiş gibi.
06:44
Once we know this,
105
404841
1858
Bunu anlayınca,
06:46
we knew we needed to collect a data set
106
406699
2971
bir tür veri havuzuna
06:49
that has far more images than we have ever had before,
107
409670
4459
sahip olduğumuz resimlerden daha fazla, hatta binlerce kat daha fazla
06:54
perhaps thousands of times more,
108
414129
2577
ihtiyacımız olduğunu biliyorduk.
06:56
and together with Professor Kai Li at Princeton University,
109
416706
4111
Princeton Üniversitesinden Prof. Kai Li ile birlikte
07:00
we launched the ImageNet project in 2007.
110
420817
4752
2007 senesinde ImageNet projesini başlattık.
07:05
Luckily, we didn't have to mount a camera on our head
111
425569
3838
Şanslıyız ki başımızın üzerine bir kamera alıp
07:09
and wait for many years.
112
429407
1764
yıllarca beklememize gerek kalmadı.
07:11
We went to the Internet,
113
431171
1463
İnternete başvurduk.
07:12
the biggest treasure trove of pictures that humans have ever created.
114
432634
4436
İnsanların oluşturduğu en büyük resim definesi.
07:17
We downloaded nearly a billion images
115
437070
3041
Yaklaşık bir milyar resim indirdik
07:20
and used crowdsourcing technology like the Amazon Mechanical Turk platform
116
440111
5880
ve crowdsourcing teknolojisini kullandık. Resimleri tanımlamada bize yardımcı olmada
07:25
to help us to label these images.
117
445991
2339
Amazon Mechanical Turk platformu gibi.
07:28
At its peak, ImageNet was one of the biggest employers
118
448330
4900
ImageNet, Amazon Mechanical Turk çalışanlarına işveren en büyük
07:33
of the Amazon Mechanical Turk workers:
119
453230
2996
kurumlardan biri oldu.
07:36
together, almost 50,000 workers
120
456226
3854
Dünya genelinde 167 ülkeden
07:40
from 167 countries around the world
121
460080
4040
neredeyse 50,000 çalışan
07:44
helped us to clean, sort and label
122
464120
3947
yaklaşık bir milyar resmi
eleyip, sınıflandırma ve tanımlamada bize yardımcı oldu.
07:48
nearly a billion candidate images.
123
468067
3575
07:52
That was how much effort it took
124
472612
2653
Bu çaba, erken gelişim dönemindeki
07:55
to capture even a fraction of the imagery
125
475265
3900
bir çocuğun algıladığı görüntülerin sadece belli bir bölümünü
07:59
a child's mind takes in in the early developmental years.
126
479165
4171
elde edebilmemiz içindi.
08:04
In hindsight, this idea of using big data
127
484148
3902
Nihayet, bilgisayar algoritmalarını eğitmek için
08:08
to train computer algorithms may seem obvious now,
128
488050
4550
big datanın kullanılması fikri şu anda mümkün hale geldi,
08:12
but back in 2007, it was not so obvious.
129
492600
4110
fakat 2007 senesine dönersek, bu mümkün değildi.
08:16
We were fairly alone on this journey for quite a while.
130
496710
3878
Bu yolculukta uzun bir süre tam anlamıyla kendi başımızaydık.
08:20
Some very friendly colleagues advised me to do something more useful for my tenure,
131
500588
5003
Samimi bazı arkadaşlarım kadrom için daha kullanışlı şeyler yapmamı tavsiye ettiler,
08:25
and we were constantly struggling for research funding.
132
505591
4342
ve aynı zamanda araştırma fonu oluşturmak için durmaksızın çabalıyorduk.
08:29
Once, I even joked to my graduate students
133
509933
2485
Hatta, master öğrencilerime ImageNet fonu
08:32
that I would just reopen my dry cleaner's shop to fund ImageNet.
134
512418
4063
için kuru temizleme mağazamı tekrar açma konusunda şaka yapıyordum.
08:36
After all, that's how I funded my college years.
135
516481
4761
Üniversite yıllarımda bu şekilde geçiniyordum.
08:41
So we carried on.
136
521242
1856
Sonra devam ettik.
08:43
In 2009, the ImageNet project delivered
137
523098
3715
2009 senesinde, ImageNet projesi
08:46
a database of 15 million images
138
526813
4042
her gün ingilizce kelimelerle 22,000
08:50
across 22,000 classes of objects and things
139
530855
4805
nesne ve eşya sınıfı ile
08:55
organized by everyday English words.
140
535660
3320
15 milyonluk bir resim veritabanına ulaştı.
08:58
In both quantity and quality,
141
538980
2926
Sayı ve kalite olarak,
09:01
this was an unprecedented scale.
142
541906
2972
emsalsiz bir ölçekti bu.
09:04
As an example, in the case of cats,
143
544878
3461
Örneğin, kedi kategorisinde,
09:08
we have more than 62,000 cats
144
548339
2809
görünüş ve poz
09:11
of all kinds of looks and poses
145
551148
4110
ile evcil ve yaban türlerinin tümüyle
09:15
and across all species of domestic and wild cats.
146
555258
5223
62 binden fazla kedi bulunmakta.
09:20
We were thrilled to have put together ImageNet,
147
560481
3344
Bunları ImageNet olarak toparladığımızdan heyecanlıydık
09:23
and we wanted the whole research world to benefit from it,
148
563825
3738
ve sonra bütün dünya araştırmalarında bunlardan faydalanılsın istedik,
09:27
so in the TED fashion, we opened up the entire data set
149
567563
4041
bu yüzden TED fashion'da bütün veri havuzumuzu
09:31
to the worldwide research community for free.
150
571604
3592
global araştırma topluluklarına ücretsiz bir şekilde açtık.
09:36
(Applause)
151
576636
4000
(Alkış)
09:41
Now that we have the data to nourish our computer brain,
152
581416
4538
Artık, bilgisayarımızın beynini besleyecek veriye sahibiz,
09:45
we're ready to come back to the algorithms themselves.
153
585954
3737
algoritmaların kendilerine dönecek kadar da hazırız.
09:49
As it turned out, the wealth of information provided by ImageNet
154
589691
5178
ImageNet projesinin sağladığı bilgi zenginliği, sonunda
09:54
was a perfect match to a particular class of machine learning algorithms
155
594869
4806
"evrişimli sinirsel ağ" olarak ifade edilen makine öğrenme algoritmalarının
09:59
called convolutional neural network,
156
599675
2415
özel bir sınıfıyla mükemmel bir şekilde eşleşmişti,
10:02
pioneered by Kunihiko Fukushima, Geoff Hinton, and Yann LeCun
157
602090
5248
öncülüğünü Kunihiko Fukushima, Geoff Hinton ve Yann LeCun'un yaptığı
10:07
back in the 1970s and '80s.
158
607338
3645
1970 ve 80'lerin öncesindeki bir alan.
10:10
Just like the brain consists of billions of highly connected neurons,
159
610983
5619
Beyinde meydana gelen milyarlarca yüksek bağlantılı sinirler gibi,
10:16
a basic operating unit in a neural network
160
616602
3854
sinir ağının basit bir çalışma birimine
10:20
is a neuron-like node.
161
620456
2415
"nöron benzeri" düğümü deniyor.
10:22
It takes input from other nodes
162
622871
2554
Başka düğümlerden girdi alıyorlar
10:25
and sends output to others.
163
625425
2718
ve diğer düğümlere gönderiyorlar.
10:28
Moreover, these hundreds of thousands or even millions of nodes
164
628143
4713
Dahası, bu yüzbinlerce hatta milyonlarca düğüm
10:32
are organized in hierarchical layers,
165
632856
3227
hiyerarşik tabakalarla düzenleniyorlar
10:36
also similar to the brain.
166
636083
2554
tıpkı beyin gibi.
10:38
In a typical neural network we use to train our object recognition model,
167
638637
4783
Normal bir sinir ağında nesne tanıma modelimizi eğitmek için,
10:43
it has 24 million nodes,
168
643420
3181
24 milyon düğüm,
10:46
140 million parameters,
169
646601
3297
140 milyon değişken,
10:49
and 15 billion connections.
170
649898
2763
ve 15 milyar bağlantı kullandık.
10:52
That's an enormous model.
171
652661
2415
Bu muazzam bir modeldi.
10:55
Powered by the massive data from ImageNet
172
655076
3901
ImageNet'den elde edilen büyük veri ile
10:58
and the modern CPUs and GPUs to train such a humongous model,
173
658977
5433
oldukça muazzam bir modeli eğitmek için kullanılan modern CPU ve GPU'lar sayesinde
11:04
the convolutional neural network
174
664410
2369
evrişimli sinirsel ağ
11:06
blossomed in a way that no one expected.
175
666779
3436
hiçbirimizin hayal edemeyeceği bir şekilde gelişti.
11:10
It became the winning architecture
176
670215
2508
Nesne tanımlamada etkileyeci yeni sonuçlar üretmek için
11:12
to generate exciting new results in object recognition.
177
672723
5340
başarılı bir mimari olmaya başladı.
11:18
This is a computer telling us
178
678063
2810
Bu bilgisayarın bize söylediği,
11:20
this picture contains a cat
179
680873
2300
bu fotoğrafta bir kedinin olduğu
11:23
and where the cat is.
180
683173
1903
ve kedinin nerede olduğu.
11:25
Of course there are more things than cats,
181
685076
2112
Elbette orada kedilerden daha fazlası var,
11:27
so here's a computer algorithm telling us
182
687188
2438
burada ise bilgisayar algoritmasının bize söylediği
11:29
the picture contains a boy and a teddy bear;
183
689626
3274
resimde bir çocuk ile oyuncak bir ayının;
11:32
a dog, a person, and a small kite in the background;
184
692900
4366
bir köpeğin, bir kişinin ve arkaplanda küçük bir uçurtmanın;
11:37
or a picture of very busy things
185
697266
3135
ya da çok karışık bir resimin
11:40
like a man, a skateboard, railings, a lampost, and so on.
186
700401
4644
bir adam, bir kaykay, korkuluklar, lamba direği v.b. gibi şeyler olduğu.
11:45
Sometimes, when the computer is not so confident about what it sees,
187
705045
5293
Bazen, bilgisayar ne gördüğü hakkında emin olamayınca
11:51
we have taught it to be smart enough
188
711498
2276
çok fazla düşünmek yerine yeterince
11:53
to give us a safe answer instead of committing too much,
189
713774
3878
mantıklı bir cevap vermesini öğrettik,
11:57
just like we would do,
190
717652
2811
tıpkı bizim yapacağımız gibi
12:00
but other times our computer algorithm is remarkable at telling us
191
720463
4666
fakat başka zamanlarda bilgisayar algoritmamız bize dikkate değer şeyler
12:05
what exactly the objects are,
192
725129
2253
tam olarak nesnelerin ne olduğunu
12:07
like the make, model, year of the cars.
193
727382
3436
marka, model ve üretim yılı gibi şeyleri söylüyor.
12:10
We applied this algorithm to millions of Google Street View images
194
730818
5386
Bu algoritmayı Google Sokak Görüntüleme ile yüzlerce Amerika şehrinden
12:16
across hundreds of American cities,
195
736204
3135
alınmış resimlere uyguladık
12:19
and we have learned something really interesting:
196
739339
2926
ve gerçekten ilginç şeyler öğrendik:
12:22
first, it confirmed our common wisdom
197
742265
3320
öncelikle, hepimizin bildiği gibi araç
12:25
that car prices correlate very well
198
745585
3290
fiyatlarının aile gelir düzeyiyle
12:28
with household incomes.
199
748875
2345
doğrudan ilişkili olduğunu teyit etti
12:31
But surprisingly, car prices also correlate well
200
751220
4527
fakat ilginçtir ki, araç fiyatları aynı zamanda
12:35
with crime rates in cities,
201
755747
2300
şehirdeki suç oranları
12:39
or voting patterns by zip codes.
202
759007
3963
ya da posta kodlarından oy verme alanları ile de bağlantılı.
12:44
So wait a minute. Is that it?
203
764060
2206
Peki biraz düşünün, bu oldu mu?
12:46
Has the computer already matched or even surpassed human capabilities?
204
766266
5153
Bilgisayar henüz insan kabiliyetlerine erişebildi mi hatta daha üstün geldi mi ?
12:51
Not so fast.
205
771419
2138
Hayır, o kadar hızlı değil.
12:53
So far, we have just taught the computer to see objects.
206
773557
4923
Şu ana dek, sadece bilgisayara nesneleri görmesini öğrettik.
12:58
This is like a small child learning to utter a few nouns.
207
778480
4644
Bu küçük bir çocuğun bir kaç kelime söylemesini öğrenmesi gibi bir sey.
13:03
It's an incredible accomplishment,
208
783124
2670
İnanılmaz bir başarıdır bu,
13:05
but it's only the first step.
209
785794
2460
fakat bu sadece ilk adımdır.
13:08
Soon, another developmental milestone will be hit,
210
788254
3762
Sonrasında, başka bir gelişimsel dönüm noktası açığa çıkar,
13:12
and children begin to communicate in sentences.
211
792016
3461
ve çocuk cümlelerle iletişim kurmaya başlar.
13:15
So instead of saying this is a cat in the picture,
212
795477
4224
Yani, "bu resimdeki bir kedidir" demek yerine
13:19
you already heard the little girl telling us this is a cat lying on a bed.
213
799701
5202
dinlediğiniz gibi küçük kız bize "bu yatağın üzerinde uzanan bir kedidir" diyor
13:24
So to teach a computer to see a picture and generate sentences,
214
804903
5595
Bilgisayarı resimleri görmek ve cümle kurmak için eğitmek,
13:30
the marriage between big data and machine learning algorithm
215
810498
3948
big data ile makine öğrenim algoritmasının beraberliği için
13:34
has to take another step.
216
814446
2275
bir adım daha atılmalı.
13:36
Now, the computer has to learn from both pictures
217
816721
4156
Şimdilik, bilgisayarın her resimden
13:40
as well as natural language sentences
218
820877
2856
insanlar tarafından oluşturulmuş kadar
13:43
generated by humans.
219
823733
3322
iyi cümleler öğrenmesi gerek.
13:47
Just like the brain integrates vision and language,
220
827055
3853
Beynin görsellik ve dili bütünleştirdiği gibi,
13:50
we developed a model that connects parts of visual things
221
830908
5201
biz de ufak görsel parçacıklar gibi görsel şeylerle
13:56
like visual snippets
222
836109
1904
cümlelerdeki kelime ve ifadeleri
13:58
with words and phrases in sentences.
223
838013
4203
birleştirecek bir model geliştirdik.
14:02
About four months ago,
224
842216
2763
Yaklaşık dört ay önce,
14:04
we finally tied all this together
225
844979
2647
sonunda bütün bunları bağladık
14:07
and produced one of the first computer vision models
226
847626
3784
ve bir fotoğrafı ilk kez gördüğünde
14:11
that is capable of generating a human-like sentence
227
851410
3994
bir insan gibi cümle kurabilme yeteneğine sahip
14:15
when it sees a picture for the first time.
228
855404
3506
ilk bilgisayar görme modelinden bir tane yaptık.
14:18
Now, I'm ready to show you what the computer says
229
858910
4644
Şu anda, bilgisayarın konuşmamızın başında
14:23
when it sees the picture
230
863554
1975
küçük kızın gördüğü resimleri gördüğünde
14:25
that the little girl saw at the beginning of this talk.
231
865529
3830
neler söylediğini size göstermeye hazırım.
14:31
(Video) Computer: A man is standing next to an elephant.
232
871519
3344
(Video) Bilgisayar: Bir adam filin yanında duruyor.
14:36
A large airplane sitting on top of an airport runway.
233
876393
3634
Geniş bir uçak, uçak pistinin üstünde oturuyor.
14:41
FFL: Of course, we're still working hard to improve our algorithms,
234
881057
4212
FFL: Tabii, hala sıkı bir şekilde algoritmamızı geliştirmek için çalışıyoruz
14:45
and it still has a lot to learn.
235
885269
2596
ve henüz öğreneceği çok sey var.
14:47
(Applause)
236
887865
2291
(Alkış)
14:51
And the computer still makes mistakes.
237
891556
3321
Bilgisayar henüz hatalar yapmakta.
14:54
(Video) Computer: A cat lying on a bed in a blanket.
238
894877
3391
Bilgisayar: Bir kedi battaniyenin içinde yatakta uzanıyor.
14:58
FFL: So of course, when it sees too many cats,
239
898268
2553
FFL: Tabii, oldukça fazla kedi gördüğünden
15:00
it thinks everything might look like a cat.
240
900821
2926
herşeyin kediye benzeyebileceğini düşünüyor.
15:05
(Video) Computer: A young boy is holding a baseball bat.
241
905317
2864
Bilgisayar: Genç erkek bir beysbol sopasını tutuyor.
15:08
(Laughter)
242
908181
1765
(Gülüşmeler)
15:09
FFL: Or, if it hasn't seen a toothbrush, it confuses it with a baseball bat.
243
909946
4583
FFL: Ya da, henüz bir diş fırçası görmemişse, beysbol sopasıyla karıştırıyor
15:15
(Video) Computer: A man riding a horse down a street next to a building.
244
915309
3434
Bilgisayar: Bir adam binanın kenarından atını sokak aşağı sürüyor.
15:18
(Laughter)
245
918743
2023
(Gülüşmeler)
15:20
FFL: We haven't taught Art 101 to the computers.
246
920766
3552
FFL: Henüz bilgisayarlara Sanat 101 dersini öğretmedik.
15:25
(Video) Computer: A zebra standing in a field of grass.
247
925768
2884
Bilgisayar: Bir zebra otlukların içinde duruyor.
15:28
FFL: And it hasn't learned to appreciate the stunning beauty of nature
248
928652
3367
FFL: Ve henüz doğanın büyüleci güzelliğini
15:32
like you and I do.
249
932019
2438
takdir etmeyi bizim gibi öğrenmedi.
15:34
So it has been a long journey.
250
934457
2832
Uzun bir yolculuktu.
15:37
To get from age zero to three was hard.
251
937289
4226
Sıfırdan üç yaşına getirmek oldukça zordu.
15:41
The real challenge is to go from three to 13 and far beyond.
252
941515
5596
Asıl zor olan üç yaşından on üç yaş ve daha ötesine götürebilmek.
15:47
Let me remind you with this picture of the boy and the cake again.
253
947111
4365
Size bu resmi tekrar hatırlatmak istiyorum, çocuk ve kekin olduğu.
15:51
So far, we have taught the computer to see objects
254
951476
4064
Şu ana dek, bilgisayara nesneleri görebilmesini
15:55
or even tell us a simple story when seeing a picture.
255
955540
4458
hatta gördüğü resimden küçük bir hikaye anlatmasını bile öğrettik.
15:59
(Video) Computer: A person sitting at a table with a cake.
256
959998
3576
Bilgisayar: Biri yaş pastanın olduğu masada oturuyor.
16:03
FFL: But there's so much more to this picture
257
963574
2630
FFL: Fakat bu resimde sadece bir kişi ve pastadan
16:06
than just a person and a cake.
258
966204
2270
daha fazlası var.
16:08
What the computer doesn't see is that this is a special Italian cake
259
968474
4467
Bilgisayarın göremediği şey, onun sadece Paskalya süresince
16:12
that's only served during Easter time.
260
972941
3217
servis edilen özel bir İtalyan pastası olduğu.
16:16
The boy is wearing his favorite t-shirt
261
976158
3205
Çocuk, babası tarafından Sidney gezisinden sonra kendisine hediye edilen
16:19
given to him as a gift by his father after a trip to Sydney,
262
979363
3970
en sevdiği tişörtünü giyiyor,
16:23
and you and I can all tell how happy he is
263
983333
3808
hepimiz onun nasıl mutlu olduğunu
16:27
and what's exactly on his mind at that moment.
264
987141
3203
ve şu anda kafasından geçenleri söyleyebiliriz.
16:31
This is my son Leo.
265
991214
3125
Bu benim oğlum Leo.
16:34
On my quest for visual intelligence,
266
994339
2624
Görsel zeka araştırmalarımda,
16:36
I think of Leo constantly
267
996963
2391
durmaksızın Leo'yu
16:39
and the future world he will live in.
268
999354
2903
ve içinde yaşayacağı geleceği düşünüyorum.
16:42
When machines can see,
269
1002257
2021
Makineler görebildiğinde,
16:44
doctors and nurses will have extra pairs of tireless eyes
270
1004278
4712
doktor ve hemşireler, tanı koymak ve hastalarla ilgilenmek için
16:48
to help them to diagnose and take care of patients.
271
1008990
4092
ek olarak yorulmayan göz çiftlerine sahip olacaklar.
16:53
Cars will run smarter and safer on the road.
272
1013082
4383
Arabalar yollarda daha güvenli daha akıllı bir şekilde gidecek.
16:57
Robots, not just humans,
273
1017465
2694
Robotlar, sadece insanlar değil,
17:00
will help us to brave the disaster zones to save the trapped and wounded.
274
1020159
4849
enkaz bölgelerinde tutsak ve yaralıları kurtarmada bizimle göğüs gerecekler.
17:05
We will discover new species, better materials,
275
1025798
3796
Yeni tür, daha iyi malzemeler bulacak
17:09
and explore unseen frontiers with the help of the machines.
276
1029594
4509
ve makinelerin yardımıyla, görünmeyen sınırları keşfedeceğiz.
17:15
Little by little, we're giving sight to the machines.
277
1035113
4167
Azar azar, makinelere görme yetisini veriyoruz.
17:19
First, we teach them to see.
278
1039280
2798
Önce, biz onlara görmeyi öğretiyoruz.
17:22
Then, they help us to see better.
279
1042078
2763
Sonra, onlar daha iyi görebilmemiz için bize yardım ediyor.
17:24
For the first time, human eyes won't be the only ones
280
1044841
4165
Öncelikle, dünyamızı keşfetmek ve düşünmek için gözlerimiz
17:29
pondering and exploring our world.
281
1049006
2934
sadece insan gözleri olmayacak.
17:31
We will not only use the machines for their intelligence,
282
1051940
3460
Makineleri sadece zekaları için kullanmıyor,
17:35
we will also collaborate with them in ways that we cannot even imagine.
283
1055400
6179
aynı zamanda hayal bile edemeyeceğimiz bir şekilde onlarla iş birliği yapıyoruz.
17:41
This is my quest:
284
1061579
2161
Benim araştırmam bu:
17:43
to give computers visual intelligence
285
1063740
2712
bilgisayarlara görsel zekayı vermek
17:46
and to create a better future for Leo and for the world.
286
1066452
5131
ve Leo için, dünya için daha iyi bir gelecek oluşturmak.
17:51
Thank you.
287
1071583
1811
Teşekkürler.
17:53
(Applause)
288
1073394
3785
(Alkış)
Bu web sitesi hakkında

Bu site size İngilizce öğrenmek için yararlı olan YouTube videolarını tanıtacaktır. Dünyanın dört bir yanından birinci sınıf öğretmenler tarafından verilen İngilizce derslerini göreceksiniz. Videoyu oradan oynatmak için her video sayfasında görüntülenen İngilizce altyazılara çift tıklayın. Altyazılar video oynatımı ile senkronize olarak kayar. Herhangi bir yorumunuz veya isteğiniz varsa, lütfen bu iletişim formunu kullanarak bizimle iletişime geçin.

https://forms.gle/WvT1wiN1qDtmnspy7