How we teach computers to understand pictures | Fei Fei Li

1,115,930 views ・ 2015-03-23

TED


아래 영문자막을 더블클릭하시면 영상이 재생됩니다.

번역: Juhyeon Kim 검토: Jihyeon J. Kim
00:14
Let me show you something.
0
14366
3738
이걸 보시죠.
00:18
(Video) Girl: Okay, that's a cat sitting in a bed.
1
18104
4156
(영상) 소녀: "고양이가 침대에 앉아 있습니다."
00:22
The boy is petting the elephant.
2
22260
4040
"소년이 코끼리를 쓰다듬고 있습니다."
00:26
Those are people that are going on an airplane.
3
26300
4354
"사람들이 비행기에 타고 있습니다."
00:30
That's a big airplane.
4
30654
2810
"큰 비행기입니다."
00:33
Fei-Fei Li: This is a three-year-old child
5
33464
2206
이건 세 살짜리 아이가 사진을 보고 설명하는 것입니다.
00:35
describing what she sees in a series of photos.
6
35670
3679
00:39
She might still have a lot to learn about this world,
7
39349
2845
그녀는 아직 이 세상에 대해 배울 것이 많지만,
00:42
but she's already an expert at one very important task:
8
42194
4549
한 가지 일에서만큼은 이미 전문가 수준입니다.
00:46
to make sense of what she sees.
9
46743
2846
본 것을 이해하는 일이죠.
00:50
Our society is more technologically advanced than ever.
10
50229
4226
우리 사회는 그 어느 때보다 기술적으로 진보하고 있습니다.
00:54
We send people to the moon, we make phones that talk to us
11
54455
3629
우리는 달에 사람을 보내고, 말을 하는 전화를 만들거나
00:58
or customize radio stations that can play only music we like.
12
58084
4946
좋아하는 곡만 방송하는 맞춤형 라디오를 만듭니다.
01:03
Yet, our most advanced machines and computers
13
63030
4055
그러나 첨단 기계와 컴퓨터로도
01:07
still struggle at this task.
14
67085
2903
애를 먹는 일이 있습니다.
01:09
So I'm here today to give you a progress report
15
69988
3459
저는 오늘 컴퓨터 비전 연구의
01:13
on the latest advances in our research in computer vision,
16
73447
4047
최신 동향에 대해 말하고자 합니다
01:17
one of the most frontier and potentially revolutionary
17
77494
4161
컴퓨터 과학에서 가장 선도적이고 혁명적인 기술이죠.
01:21
technologies in computer science.
18
81655
3206
01:24
Yes, we have prototyped cars that can drive by themselves,
19
84861
4551
스스로 운전하는 자동차 시험판을 만들더라도
01:29
but without smart vision, they cannot really tell the difference
20
89412
3853
똑똑한 인식 능력이 없다면
01:33
between a crumpled paper bag on the road, which can be run over,
21
93265
3970
도로 위에 있는 것이 밟아도 될 종이 봉투인지
01:37
and a rock that size, which should be avoided.
22
97235
3340
피해야 할 돌덩이인지 구분할 수 없습니다.
01:41
We have made fabulous megapixel cameras,
23
101415
3390
수백만 화소의 엄청난 카메라를 만들더라도
01:44
but we have not delivered sight to the blind.
24
104805
3135
시각장애인의 눈이 되지는 못합니다.
01:48
Drones can fly over massive land,
25
108420
3305
무인기가 광활한 땅을 날 수 있어도
01:51
but don't have enough vision technology
26
111725
2134
컴퓨터 비전 기술이 없으면
01:53
to help us to track the changes of the rainforests.
27
113859
3461
열대 우림의 변화를 추적하지 못합니다.
01:57
Security cameras are everywhere,
28
117320
2950
감시 카메라가 도처에 있어도
02:00
but they do not alert us when a child is drowning in a swimming pool.
29
120270
5067
수영장에서 물에 빠진 아이를 보고 우리에게 경고해 주지는 않습니다.
02:06
Photos and videos are becoming an integral part of global life.
30
126167
5595
사진과 비디오는 지구 생활의 불가결한 부분이 되고 있습니다.
02:11
They're being generated at a pace that's far beyond what any human,
31
131762
4087
어떤 개인이나 단체가 다 볼 수 없을 분량의
02:15
or teams of humans, could hope to view,
32
135849
2783
영상이 만들어지고 있습니다.
02:18
and you and I are contributing to that at this TED.
33
138632
3921
여기 TED도 일조하고 있지요.
02:22
Yet our most advanced software is still struggling at understanding
34
142553
5232
그러나 가장 진보한 소프트웨어도 아직까지는
02:27
and managing this enormous content.
35
147785
3876
이 방대한 영상을 이해하고 관리하는데 애를 먹고 있습니다.
02:31
So in other words, collectively as a society,
36
151661
5272
달리 말하자면 사회 전체적으로
02:36
we're very much blind,
37
156933
1746
우리는 장님과 같습니다.
02:38
because our smartest machines are still blind.
38
158679
3387
우리의 가장 똑똑한 기계가 아직까지 장님이니까요.
02:43
"Why is this so hard?" you may ask.
39
163526
2926
"그게 왜 어렵지?" 하고 물으실 수 있어요.
02:46
Cameras can take pictures like this one
40
166452
2693
카메라는 이런 사진을 찍을 수 있고
02:49
by converting lights into a two-dimensional array of numbers
41
169145
3994
빛을 숫자의 2차원 배열인
02:53
known as pixels,
42
173139
1650
픽셀로 변환할 수 있지만,
02:54
but these are just lifeless numbers.
43
174789
2251
이는 그저 죽은 숫자일 뿐입니다.
02:57
They do not carry meaning in themselves.
44
177040
3111
그 자체에 의미는 없습니다.
03:00
Just like to hear is not the same as to listen,
45
180151
4343
'들리는' 것과 '듣는' 것이 똑같지 않듯이
03:04
to take pictures is not the same as to see,
46
184494
4040
사진을 '찍는' 것과 '보는' 것은 똑같지 않습니다.
03:08
and by seeing, we really mean understanding.
47
188534
3829
'본다'는 말에는 '이해한다'는 뜻이 있습니다.
03:13
In fact, it took Mother Nature 540 million years of hard work
48
193293
6177
사실 자연은 5억 4천만년에 걸쳐
03:19
to do this task,
49
199470
1973
이 작업을 했는데요.
03:21
and much of that effort
50
201443
1881
그 노력의 대부분은
03:23
went into developing the visual processing apparatus of our brains,
51
203324
5271
우리 뇌의 시각처리능력을 발달시키는데 소요되었고
03:28
not the eyes themselves.
52
208595
2647
눈을 만드는데 소요되지 않았습니다.
03:31
So vision begins with the eyes,
53
211242
2747
시각현상은 눈에서 시작되지만
03:33
but it truly takes place in the brain.
54
213989
3518
사실상 나타나는 곳은 뇌 안쪽이죠.
03:38
So for 15 years now, starting from my Ph.D. at Caltech
55
218287
5060
저는 최근 15년간 캘리포니아 공대 박사 과정에서부터
03:43
and then leading Stanford's Vision Lab,
56
223347
2926
스탠포드대 컴퓨터 비전 연구실을 이끌기까지
03:46
I've been working with my mentors, collaborators and students
57
226273
4396
지도교수, 공동연구자, 학생들과 함께
03:50
to teach computers to see.
58
230669
2889
컴퓨터에게 '보는 법'을 가르쳐왔습니다.
03:54
Our research field is called computer vision and machine learning.
59
234658
3294
저희 연구 분야를 컴퓨터 비전과 기계 학습이라고 합니다.
03:57
It's part of the general field of artificial intelligence.
60
237952
3878
인공지능 일반 분야에 속하죠.
04:03
So ultimately, we want to teach the machines to see just like we do:
61
243000
5493
궁극적으로 우리는 기계가 인간처럼 볼 수 있게 하려고 합니다.
04:08
naming objects, identifying people, inferring 3D geometry of things,
62
248493
5387
물체와 사람을 식별하고, 3차원 기하구조를 추측하고,
04:13
understanding relations, emotions, actions and intentions.
63
253880
5688
관계, 감정, 행동과 의도를 이해하게 하는 겁니다.
04:19
You and I weave together entire stories of people, places and things
64
259568
6153
여러분과 저는 한번 보기만 해도
04:25
the moment we lay our gaze on them.
65
265721
2164
사람, 장소, 사물로 이야기를 엮어낼 수 있습니다.
04:28
The first step towards this goal is to teach a computer to see objects,
66
268955
5583
이런 목표를 향한 첫걸음이 컴퓨터를 가르쳐
04:34
the building block of the visual world.
67
274538
3368
사물, 시각 세계의 구성요소를 보게 하는 것입니다.
04:37
In its simplest terms, imagine this teaching process
68
277906
4434
간단히 말해, 이런 학습 과정을 상상해보세요.
04:42
as showing the computers some training images
69
282340
2995
컴퓨터에 특정 사물의 훈련용 이미지를 보여줍니다.
04:45
of a particular object, let's say cats,
70
285335
3321
고양이라고 해보죠.
04:48
and designing a model that learns from these training images.
71
288656
4737
그리고 그 훈련용 이미지로 학습하는 모델을 설계합니다.
04:53
How hard can this be?
72
293393
2044
간단하게 들리는데요. 얼마나 어려울 수 있을까요?
04:55
After all, a cat is just a collection of shapes and colors,
73
295437
4052
고양이는 모양과 색깔의 집합이고,
04:59
and this is what we did in the early days of object modeling.
74
299489
4086
이것이 우리가 초창기 객체 모델링으로 한 일이죠.
05:03
We'd tell the computer algorithm in a mathematical language
75
303575
3622
우리는 컴퓨터 알고리즘을 수학적 언어로 표현합니다.
05:07
that a cat has a round face, a chubby body,
76
307197
3343
고양이는 둥근 얼굴과 통통한 몸,
05:10
two pointy ears, and a long tail,
77
310540
2299
두 개의 뾰족한 귀, 긴 꼬리가 있다고 가르칩니다.
05:12
and that looked all fine.
78
312839
1410
다 괜찮아 보였습니다.
05:14
But what about this cat?
79
314859
2113
그런데 이 고양이는 어떨까요?
05:16
(Laughter)
80
316972
1091
(웃음)
05:18
It's all curled up.
81
318063
1626
몸을 말고 있습니다.
05:19
Now you have to add another shape and viewpoint to the object model.
82
319689
4719
이제 객체 모델에 다른 모양과 관점을 추가합니다.
05:24
But what if cats are hidden?
83
324408
1715
그런데 만약 고양이가 숨어 있으면요?
05:27
What about these silly cats?
84
327143
2219
이런 웃기는 고양이들은요?
05:31
Now you get my point.
85
331112
2417
이제 제 말을 아시겠죠.
05:33
Even something as simple as a household pet
86
333529
3367
집안의 애완동물처럼 단순한 사물조차
05:36
can present an infinite number of variations to the object model,
87
336896
4504
객체 모델에 무한한 변형이 존재할 수 있고,
05:41
and that's just one object.
88
341400
2233
그게 한 개의 객체일 뿐이죠.
05:44
So about eight years ago,
89
344573
2492
약 8년 전
05:47
a very simple and profound observation changed my thinking.
90
347065
5030
단순하고도 깊은 관찰이 제 생각을 바꾸었습니다.
05:53
No one tells a child how to see,
91
353425
2685
아이에게 보는 법을 가르칠 순 없죠.
05:56
especially in the early years.
92
356110
2261
특히 어린 시절에 말이죠.
05:58
They learn this through real-world experiences and examples.
93
358371
5000
아이들은 현실세계의 경험과 사례로 보는 법을 배웁니다.
06:03
If you consider a child's eyes
94
363371
2740
만약 아이의 눈을
06:06
as a pair of biological cameras,
95
366111
2554
생물학적 카메라 한쌍이라 치면
06:08
they take one picture about every 200 milliseconds,
96
368665
4180
200밀리초마다 한 장씩 사진을 찍는 셈이죠.
06:12
the average time an eye movement is made.
97
372845
3134
눈이 움직이는 평균 시간이에요.
06:15
So by age three, a child would have seen hundreds of millions of pictures
98
375979
5550
아이는 세 살까지 수억장의 현실세계 사진을 보게 됩니다.
06:21
of the real world.
99
381529
1834
06:23
That's a lot of training examples.
100
383363
2280
방대한 양의 학습 사례죠.
06:26
So instead of focusing solely on better and better algorithms,
101
386383
5989
그래서 제 생각엔 더 나은 알고리즘에만 집중하기보다,
06:32
my insight was to give the algorithms the kind of training data
102
392372
5272
알고리즘에 주는 학습 데이터를
06:37
that a child was given through experiences
103
397644
3319
아이가 경험하는 것과 같이 만들어야 했습니다.
06:40
in both quantity and quality.
104
400963
3878
양적으로나 질적으로 말이죠.
06:44
Once we know this,
105
404841
1858
이걸 알게 되자,
06:46
we knew we needed to collect a data set
106
406699
2971
우리는 이전보다 훨씬 많은 데이터를 모아야 했습니다.
06:49
that has far more images than we have ever had before,
107
409670
4459
06:54
perhaps thousands of times more,
108
414129
2577
거의 수천배였죠.
06:56
and together with Professor Kai Li at Princeton University,
109
416706
4111
그래서 전 프린스턴 대학의 카이 리 교수와 함께
07:00
we launched the ImageNet project in 2007.
110
420817
4752
2007년 이미지넷 프로젝트를 시작했습니다.
07:05
Luckily, we didn't have to mount a camera on our head
111
425569
3838
다행히도 우리는 머리에 카메라를 매달고
07:09
and wait for many years.
112
429407
1764
몇년씩 기다릴 필요는 없었습니다.
07:11
We went to the Internet,
113
431171
1463
인터넷이 있었거든요.
07:12
the biggest treasure trove of pictures that humans have ever created.
114
432634
4436
인류가 만든 최대의 사진 창고죠.
07:17
We downloaded nearly a billion images
115
437070
3041
우리는 거의 10억장의 이미지를 다운로드했고
07:20
and used crowdsourcing technology like the Amazon Mechanical Turk platform
116
440111
5880
아마존 MTurk 같은 크라우드 소싱 기술을 사용해
07:25
to help us to label these images.
117
445991
2339
이미지에 라벨을 붙였습니다.
07:28
At its peak, ImageNet was one of the biggest employers
118
448330
4900
가장 최고치에서는 이미지넷이
07:33
of the Amazon Mechanical Turk workers:
119
453230
2996
아마존 MTurk 일꾼들의 최대 고용주였습니다.
07:36
together, almost 50,000 workers
120
456226
3854
5만명 가까운 작업자가
07:40
from 167 countries around the world
121
460080
4040
세계 167개국에서
07:44
helped us to clean, sort and label
122
464120
3947
약 10억장의 후보 이미지의
07:48
nearly a billion candidate images.
123
468067
3575
정리 분류 작업을 도왔습니다.
07:52
That was how much effort it took
124
472612
2653
아이의 성장 초기에
07:55
to capture even a fraction of the imagery
125
475265
3900
이미지의 일부라도 수집하는데
07:59
a child's mind takes in in the early developmental years.
126
479165
4171
얼마나 많은 노력이 드는가 하는 것과 같았죠.
08:04
In hindsight, this idea of using big data
127
484148
3902
지나고 보니, 컴퓨터 알고리즘의 훈련에
08:08
to train computer algorithms may seem obvious now,
128
488050
4550
빅데이터를 사용한다는 아이디어는 이제 확실한 것 같습니다만,
08:12
but back in 2007, it was not so obvious.
129
492600
4110
2007년 당시에는 그렇지 않았습니다.
08:16
We were fairly alone on this journey for quite a while.
130
496710
3878
우리 혼자 이런 일을 한 게 꽤 오래 됐습니다.
08:20
Some very friendly colleagues advised me to do something more useful for my tenure,
131
500588
5003
친절한 동료는 종신교수가 되려면 더 유용한 일을 하라고 조언했고,
08:25
and we were constantly struggling for research funding.
132
505591
4342
우리는 늘 연구 자금 문제에 시달렸죠.
08:29
Once, I even joked to my graduate students
133
509933
2485
저는 이미지넷의 자금 조달을 위해 세탁소를 다시 열어야겠다고
08:32
that I would just reopen my dry cleaner's shop to fund ImageNet.
134
512418
4063
대학원생들에게 농담을 했죠.
08:36
After all, that's how I funded my college years.
135
516481
4761
제가 대학 학비를 마련한 방법이거든요.
08:41
So we carried on.
136
521242
1856
우리는 계속 진행했습니다.
08:43
In 2009, the ImageNet project delivered
137
523098
3715
2009년에 이미지넷 프로젝트는
08:46
a database of 15 million images
138
526813
4042
객체와 사물을 2만2천개 범주로 분류한
08:50
across 22,000 classes of objects and things
139
530855
4805
1천5백만장 이미지의 데이터베이스를 만들었고
08:55
organized by everyday English words.
140
535660
3320
일상적인 영단어로 표현했습니다.
08:58
In both quantity and quality,
141
538980
2926
양적으로나 질적으로나
09:01
this was an unprecedented scale.
142
541906
2972
전례 없는 규모였죠.
09:04
As an example, in the case of cats,
143
544878
3461
예를 들어, 고양이의 경우
09:08
we have more than 62,000 cats
144
548339
2809
6만 2천장의 이미지가
09:11
of all kinds of looks and poses
145
551148
4110
다양한 모양과 자세,
09:15
and across all species of domestic and wild cats.
146
555258
5223
집고양이부터 들고양이까지 모든 종류를 망라합니다.
09:20
We were thrilled to have put together ImageNet,
147
560481
3344
우리는 이미지넷을 만든 것에 흥분했고
09:23
and we wanted the whole research world to benefit from it,
148
563825
3738
모든 연구자들과 혜택을 나누고자 했습니다.
09:27
so in the TED fashion, we opened up the entire data set
149
567563
4041
그래서 TED 방식으로 모든 데이터를
09:31
to the worldwide research community for free.
150
571604
3592
전세계의 연구자 커뮤니티에 무료로 공개했습니다.
09:36
(Applause)
151
576636
4000
(박수)
09:41
Now that we have the data to nourish our computer brain,
152
581416
4538
이제 우리는 컴퓨터 두뇌에 영양을 공급할 데이터가 있고,
09:45
we're ready to come back to the algorithms themselves.
153
585954
3737
알고리즘 자체로 돌아올 준비가 되었죠.
09:49
As it turned out, the wealth of information provided by ImageNet
154
589691
5178
결과적으로 이미지넷의 풍부한 정보는
09:54
was a perfect match to a particular class of machine learning algorithms
155
594869
4806
기계 학습 알고리즘의 특정 분류에 딱 들어맞았는데,
09:59
called convolutional neural network,
156
599675
2415
이를 합성곱 신경망이라고 합니다.
10:02
pioneered by Kunihiko Fukushima, Geoff Hinton, and Yann LeCun
157
602090
5248
쿠니히코 후쿠시마, 제프리 힌튼, 양 루캉이
10:07
back in the 1970s and '80s.
158
607338
3645
1970~80년대에 개척한 영역이죠.
10:10
Just like the brain consists of billions of highly connected neurons,
159
610983
5619
마치 뇌가 고도로 연결된 뉴런 수십억개로 구성된 것처럼
10:16
a basic operating unit in a neural network
160
616602
3854
신경망의 기본 단위는
10:20
is a neuron-like node.
161
620456
2415
뉴런과 같은 노드입니다.
10:22
It takes input from other nodes
162
622871
2554
다른 노드에서 입력을 받고
10:25
and sends output to others.
163
625425
2718
다른 노드로 출력을 보냅니다.
10:28
Moreover, these hundreds of thousands or even millions of nodes
164
628143
4713
게다가 이런 수십만, 수백만의 노드는
10:32
are organized in hierarchical layers,
165
632856
3227
계층 형태로 조직화됩니다.
10:36
also similar to the brain.
166
636083
2554
뇌와 마찬가지죠.
10:38
In a typical neural network we use to train our object recognition model,
167
638637
4783
우리가 사물 인식 모델을 훈련하려고 사용한 전형적인 신경망에는
10:43
it has 24 million nodes,
168
643420
3181
2천4백만의 노드,
10:46
140 million parameters,
169
646601
3297
1억4천만의 매개변수,
10:49
and 15 billion connections.
170
649898
2763
150억의 결합이 존재합니다.
10:52
That's an enormous model.
171
652661
2415
어마어마한 모델이죠.
10:55
Powered by the massive data from ImageNet
172
655076
3901
이미지넷의 방대한 데이터와
10:58
and the modern CPUs and GPUs to train such a humongous model,
173
658977
5433
현대의 CPU와 GPU에 힘입어
11:04
the convolutional neural network
174
664410
2369
합성곱 신경망은
11:06
blossomed in a way that no one expected.
175
666779
3436
아무도 예상치 못한 방식으로 꽃피었습니다.
11:10
It became the winning architecture
176
670215
2508
사물의 인식에 있어
11:12
to generate exciting new results in object recognition.
177
672723
5340
흥미롭고도 새로운 결과를 내는 우수한 구조가 되었습니다.
11:18
This is a computer telling us
178
678063
2810
이 컴퓨터는 우리에게
11:20
this picture contains a cat
179
680873
2300
이 사진에 고양이가 있는지,
11:23
and where the cat is.
180
683173
1903
어디에 있는지 말해줍니다.
11:25
Of course there are more things than cats,
181
685076
2112
물론 고양이 이외의 것도 인식할 수 있고,
11:27
so here's a computer algorithm telling us
182
687188
2438
여기서 컴퓨터 알고리즘은 사진 속에
11:29
the picture contains a boy and a teddy bear;
183
689626
3274
소년과 테디 베어가 있다고 말해줍니다.
11:32
a dog, a person, and a small kite in the background;
184
692900
4366
개, 사람, 배경에 작은 연이 있습니다.
11:37
or a picture of very busy things
185
697266
3135
또는 많은 것이 찍힌 사진에서
11:40
like a man, a skateboard, railings, a lampost, and so on.
186
700401
4644
사람, 스케이트 보드, 난간, 가로등 같은 것을 가려냅니다.
11:45
Sometimes, when the computer is not so confident about what it sees,
187
705045
5293
때때로 컴퓨터가 보는 것이 무엇인지 확신하지 못할 때는
11:51
we have taught it to be smart enough
188
711498
2276
우리는 컴퓨터를 가르쳐서
11:53
to give us a safe answer instead of committing too much,
189
713774
3878
억측을 하기 보다는 안전한 대답을 하게 합니다.
11:57
just like we would do,
190
717652
2811
사람과 마찬가지죠.
12:00
but other times our computer algorithm is remarkable at telling us
191
720463
4666
반면 컴퓨터 알고리즘은 놀랍게도
12:05
what exactly the objects are,
192
725129
2253
사물이 정확히 무엇인지 말해주기도 합니다.
12:07
like the make, model, year of the cars.
193
727382
3436
자동차의 차종, 모델, 연식 같은 것이죠.
12:10
We applied this algorithm to millions of Google Street View images
194
730818
5386
수백개 미국 도시에서 찍은 구글 스크리트 뷰 이미지
12:16
across hundreds of American cities,
195
736204
3135
수백만장에 알고리즘을 적용했더니
12:19
and we have learned something really interesting:
196
739339
2926
흥미로운 것을 발견했습니다.
12:22
first, it confirmed our common wisdom
197
742265
3320
먼저, 일반적으로 예상하듯이
12:25
that car prices correlate very well
198
745585
3290
자동차 가격이 가계 수입과
12:28
with household incomes.
199
748875
2345
매우 관련이 있다는 것이었습니다.
12:31
But surprisingly, car prices also correlate well
200
751220
4527
하지만 놀랍게도, 자동차 가격은
12:35
with crime rates in cities,
201
755747
2300
도시의 범죄율과도 관련이 있었고,
12:39
or voting patterns by zip codes.
202
759007
3963
도시구역별 투표 경향과도 관련이 있었습니다.
12:44
So wait a minute. Is that it?
203
764060
2206
잠깐만요. 그런가요?
12:46
Has the computer already matched or even surpassed human capabilities?
204
766266
5153
컴퓨터는 이미 인간의 능력을 따라잡거나 추월한 것인가요?
12:51
Not so fast.
205
771419
2138
그렇지는 않습니다.
12:53
So far, we have just taught the computer to see objects.
206
773557
4923
지금까지 우리는 컴퓨터에 사물 인식을 가르쳤을 뿐이에요.
12:58
This is like a small child learning to utter a few nouns.
207
778480
4644
마치 어린 아이가 명사 몇개를 배운 것과 같죠.
13:03
It's an incredible accomplishment,
208
783124
2670
엄청난 성과이지만
13:05
but it's only the first step.
209
785794
2460
그저 첫 걸음에 불과합니다.
13:08
Soon, another developmental milestone will be hit,
210
788254
3762
곧 다음 개발 목표에 이를 것이고,
13:12
and children begin to communicate in sentences.
211
792016
3461
어린 아이는 문장으로 소통을 하기 시작할 겁니다.
13:15
So instead of saying this is a cat in the picture,
212
795477
4224
그래서 사진을 보고 '고양이입니다' 하는 대신
13:19
you already heard the little girl telling us this is a cat lying on a bed.
213
799701
5202
여러분이 이미 들었듯 '고양이가 침대에 누워 있다'고 합니다.
13:24
So to teach a computer to see a picture and generate sentences,
214
804903
5595
컴퓨터가 사진을 보고 문장을 만들게 가르치려면,
13:30
the marriage between big data and machine learning algorithm
215
810498
3948
빅 데이터와 기계 학습 알고리즘의 결합이
13:34
has to take another step.
216
814446
2275
또 한발짝 나아가야 합니다.
13:36
Now, the computer has to learn from both pictures
217
816721
4156
이제 컴퓨터는 사진 뿐만 아니라
13:40
as well as natural language sentences
218
820877
2856
사람이 만든 자연 언어 문장도
13:43
generated by humans.
219
823733
3322
배워야 합니다.
13:47
Just like the brain integrates vision and language,
220
827055
3853
뇌가 시각과 언어를 결합하듯이,
13:50
we developed a model that connects parts of visual things
221
830908
5201
우리가 개발한 모델은 이미지의 단편과 같은
13:56
like visual snippets
222
836109
1904
시각적 요소를
13:58
with words and phrases in sentences.
223
838013
4203
문장 속 단어나 문구와 연결합니다.
14:02
About four months ago,
224
842216
2763
약 4달 전
14:04
we finally tied all this together
225
844979
2647
우리는 마침내 이 모두를 엮어
14:07
and produced one of the first computer vision models
226
847626
3784
최초의 컴퓨터 비전 모델 하나를 만들었습니다.
14:11
that is capable of generating a human-like sentence
227
851410
3994
사진을 처음 보았을때 사람과 같이
14:15
when it sees a picture for the first time.
228
855404
3506
문장을 만들어내는 모델입니다.
14:18
Now, I'm ready to show you what the computer says
229
858910
4644
이제, 여러분께 컴퓨터가 사진을 보고
14:23
when it sees the picture
230
863554
1975
말하는 것을 보여드리겠습니다.
14:25
that the little girl saw at the beginning of this talk.
231
865529
3830
앞서 어린 소녀가 봤던 사진입니다.
(컴퓨터) "남자가 코끼리 옆에 서 있습니다."
14:31
(Video) Computer: A man is standing next to an elephant.
232
871519
3344
14:36
A large airplane sitting on top of an airport runway.
233
876393
3634
"큰 비행기가 공항 활주로 끝에 있습니다."
14:41
FFL: Of course, we're still working hard to improve our algorithms,
234
881057
4212
물론, 우리는 여전히 알고리즘을 개량하려고 일하고 있고
14:45
and it still has a lot to learn.
235
885269
2596
배워야 할 게 많습니다.
14:47
(Applause)
236
887865
2291
(박수)
14:51
And the computer still makes mistakes.
237
891556
3321
컴퓨터는 여전히 실수를 저지릅니다.
14:54
(Video) Computer: A cat lying on a bed in a blanket.
238
894877
3391
(컴퓨터) "고양이가 침대 위 이불 안에 있습니다."
14:58
FFL: So of course, when it sees too many cats,
239
898268
2553
고양이를 너무 많이 봐서
15:00
it thinks everything might look like a cat.
240
900821
2926
뭐든지 고양이로 보이는지도 모르죠.
15:05
(Video) Computer: A young boy is holding a baseball bat.
241
905317
2864
(컴퓨터) "어린 소년이 야구 방망이를 들고 있습니다."
15:08
(Laughter)
242
908181
1765
(웃음)
15:09
FFL: Or, if it hasn't seen a toothbrush, it confuses it with a baseball bat.
243
909946
4583
칫솔을 본 적이 없다면 야구 방망이와 혼동합니다.
15:15
(Video) Computer: A man riding a horse down a street next to a building.
244
915309
3434
(컴퓨터) "남자가 말을 타고 건물 옆 길을 내려갑니다."
15:18
(Laughter)
245
918743
2023
(웃음)
15:20
FFL: We haven't taught Art 101 to the computers.
246
920766
3552
우리는 컴퓨터에게 미술을 가르치지 않았습니다.
15:25
(Video) Computer: A zebra standing in a field of grass.
247
925768
2884
(컴퓨터) "얼룩말이 초원에 서있습니다"
15:28
FFL: And it hasn't learned to appreciate the stunning beauty of nature
248
928652
3367
컴퓨터는 자연의 경이로운 아름다움에 감상하는 것을
15:32
like you and I do.
249
932019
2438
배우지도 않았습니다.
15:34
So it has been a long journey.
250
934457
2832
이는 오랜 여정이었습니다.
15:37
To get from age zero to three was hard.
251
937289
4226
0세에서 3세까지 가는 건 힘들었습니다.
15:41
The real challenge is to go from three to 13 and far beyond.
252
941515
5596
하지만 진짜 도전은 3세에서 13세, 그 이상으로 나아가는 것입니다.
15:47
Let me remind you with this picture of the boy and the cake again.
253
947111
4365
이 소년과 케이크의 사진을 다시 보시죠.
15:51
So far, we have taught the computer to see objects
254
951476
4064
지금까지 우리는 컴퓨터에 사물을 식별하고
15:55
or even tell us a simple story when seeing a picture.
255
955540
4458
간단한 말을 하는 것을 가르쳤습니다.
15:59
(Video) Computer: A person sitting at a table with a cake.
256
959998
3576
(컴퓨터) "한 사람이 케이크가 있는 테이블에 앉아 있습니다."
16:03
FFL: But there's so much more to this picture
257
963574
2630
그러나 이 사진에는 사람과 케이크 이외에
16:06
than just a person and a cake.
258
966204
2270
더 많은 것이 들어있죠.
16:08
What the computer doesn't see is that this is a special Italian cake
259
968474
4467
컴퓨터가 보지 못하는 것은 이 특별한 이태리 케이크가
16:12
that's only served during Easter time.
260
972941
3217
부활절에만 먹는 것이란 겁니다.
16:16
The boy is wearing his favorite t-shirt
261
976158
3205
소년은 자기가 좋아하는 티셔츠를 입고 있는데
16:19
given to him as a gift by his father after a trip to Sydney,
262
979363
3970
아이 아버지가 시드니 여행을 다녀와 선물로 준 것입니다.
16:23
and you and I can all tell how happy he is
263
983333
3808
여러분과 저는 이 아이가 얼마나 기뻐하는지,
16:27
and what's exactly on his mind at that moment.
264
987141
3203
저 순간 무슨 생각을 하는지 이야기할 수 있습니다.
16:31
This is my son Leo.
265
991214
3125
제 아들 레오입니다.
16:34
On my quest for visual intelligence,
266
994339
2624
시각 지능에 대한 탐구를 하며
16:36
I think of Leo constantly
267
996963
2391
저는 항상 레오와
16:39
and the future world he will live in.
268
999354
2903
레오가 살 미래세계를 생각합니다.
16:42
When machines can see,
269
1002257
2021
기계가 인식을 하게 되면,
16:44
doctors and nurses will have extra pairs of tireless eyes
270
1004278
4712
의사와 간호사는 쉬지 않는 기계 눈을 이용해
16:48
to help them to diagnose and take care of patients.
271
1008990
4092
환자를 진단하고 돌볼 수 있겠지요.
16:53
Cars will run smarter and safer on the road.
272
1013082
4383
자동차는 더 똑똑하고 안전하게 도로를 주행할 겁니다.
16:57
Robots, not just humans,
273
1017465
2694
인간 뿐 아니라 로봇이
17:00
will help us to brave the disaster zones to save the trapped and wounded.
274
1020159
4849
재난 지역에서 갇히고 부상당한 사람을 구하는 걸 도울 겁니다.
17:05
We will discover new species, better materials,
275
1025798
3796
우리는 기계의 도움으로 새로운 종, 더 나은 물질을 발견하고
17:09
and explore unseen frontiers with the help of the machines.
276
1029594
4509
보지 못한 개척지를 탐험하게 될 겁니다.
17:15
Little by little, we're giving sight to the machines.
277
1035113
4167
조금씩 우리는 기계에게 시각을 주고 있습니다.
17:19
First, we teach them to see.
278
1039280
2798
처음에 우리는 기계에게 보는 것을 가르쳤습니다.
17:22
Then, they help us to see better.
279
1042078
2763
다음엔, 기계가 우리를 도와 더 잘 보게 할 겁니다.
17:24
For the first time, human eyes won't be the only ones
280
1044841
4165
처음으로, 인간의 눈이 아닌 것이
17:29
pondering and exploring our world.
281
1049006
2934
세계를 생각하고 탐험하게 되었습니다.
17:31
We will not only use the machines for their intelligence,
282
1051940
3460
우리는 인공지능 때문에 기계를 이용할 뿐만 아니라
17:35
we will also collaborate with them in ways that we cannot even imagine.
283
1055400
6179
상상치 못했던 방식으로 기계와 협력하게 될 것입니다.
17:41
This is my quest:
284
1061579
2161
이것이 제 탐구입니다.
17:43
to give computers visual intelligence
285
1063740
2712
컴퓨터에 시각 지능을 부여하는 것,
17:46
and to create a better future for Leo and for the world.
286
1066452
5131
그리고 레오와 세계를 위해서 더 나은 미래를 만드는 것입니다.
17:51
Thank you.
287
1071583
1811
감사합니다.
17:53
(Applause)
288
1073394
3785
(박수)
이 웹사이트 정보

이 사이트는 영어 학습에 유용한 YouTube 동영상을 소개합니다. 전 세계 최고의 선생님들이 가르치는 영어 수업을 보게 될 것입니다. 각 동영상 페이지에 표시되는 영어 자막을 더블 클릭하면 그곳에서 동영상이 재생됩니다. 비디오 재생에 맞춰 자막이 스크롤됩니다. 의견이나 요청이 있는 경우 이 문의 양식을 사용하여 문의하십시오.

https://forms.gle/WvT1wiN1qDtmnspy7