The wonderful and terrifying implications of computers that can learn | Jeremy Howard

598,999 views ・ 2014-12-16

TED


아래 영문자막을 더블클릭하시면 영상이 재생됩니다.

번역: Gemma Lee 검토: Mingyu Choi
00:12
It used to be that if you wanted to get a computer to do something new,
0
12880
4013
예전에는 컴퓨터가 새로운 일을 하게 만들려면
00:16
you would have to program it.
1
16893
1554
프로그램을 짜야 했습니다.
00:18
Now, programming, for those of you here that haven't done it yourself,
2
18447
3411
프로그래밍을 해본 적이 없는 분들은
00:21
requires laying out in excruciating detail
3
21858
3502
목표를 달성하기 위해서
컴퓨터가 해야 할 일을 매 단계마다
00:25
every single step that you want the computer to do
4
25360
3367
00:28
in order to achieve your goal.
5
28727
2362
고통스러울정도로 세세하게 설정해야 합니다.
00:31
Now, if you want to do something that you don't know how to do yourself,
6
31089
3496
자, 하는 방법을 모르는 일을 여러분이 하고 싶다면
00:34
then this is going to be a great challenge.
7
34585
2063
그건 아주 커다란 도전이 되겠죠.
00:36
So this was the challenge faced by this man, Arthur Samuel.
8
36648
3483
이것이 아서 사무엘이 직면한 도전이었습니다.
00:40
In 1956, he wanted to get this computer
9
40131
4077
1956년 그는 컴퓨터가
00:44
to be able to beat him at checkers.
10
44208
2340
서양장기에서 그를 이기기를 바랬습니다.
00:46
How can you write a program,
11
46548
2040
프로그램을 어떻게 짤 수 있을까요?
00:48
lay out in excruciating detail, how to be better than you at checkers?
12
48588
3806
서양장기에서 여러분보다 잘하도록 극심한 세부사항을 쓸 수 있을까요?
00:52
So he came up with an idea:
13
52394
1722
그는 새로운 생각을 했습니다.
00:54
he had the computer play against itself thousands of times
14
54116
3724
컴퓨터가 스스로와 수천 번의 서양장기를 두게 해서
00:57
and learn how to play checkers.
15
57840
2524
서양장기 두는 법을 배우게 했습니다.
01:00
And indeed it worked, and in fact, by 1962,
16
60364
3180
그 방법은 정말 효과가 있었고 사실 1962년에
01:03
this computer had beaten the Connecticut state champion.
17
63544
4017
이 컴퓨터는 코네티컷 주의 우승자를 무찔렀습니다.
01:07
So Arthur Samuel was the father of machine learning,
18
67561
2973
그래서 아서 사무엘은 기계 학습의 아버지였고
01:10
and I have a great debt to him,
19
70534
1717
저는 그분께 큰 빚을 지고 있죠.
01:12
because I am a machine learning practitioner.
20
72251
2763
왜냐하면 저는 기계 학습 기술자이니까요.
01:15
I was the president of Kaggle,
21
75014
1465
저는 캐글의 회장인데
01:16
a community of over 200,000 machine learning practictioners.
22
76479
3388
캐글은 20만 명이 넘는 기계 학습 기술자들의 동호회입니다.
01:19
Kaggle puts up competitions
23
79867
2058
캐글은 이전까지 풀지 못했던 문제를
01:21
to try and get them to solve previously unsolved problems,
24
81925
3708
해결하기 위한 대회를 주최하는데
01:25
and it's been successful hundreds of times.
25
85633
3837
수백번 성공했습니다.
01:29
So from this vantage point, I was able to find out
26
89470
2470
그래서 이런 유리한 시점에서 저는 기계 학습이
01:31
a lot about what machine learning can do in the past, can do today,
27
91940
3950
과거와 현재에 할 수 있는 일과 미래에 할 수 있는 일을
01:35
and what it could do in the future.
28
95890
2362
많이 알 수 있었습니다.
01:38
Perhaps the first big success of machine learning commercially was Google.
29
98252
4423
아마도 기계 학습이 상업에서 최초로 가장 크게 성공한 것은 구글이었습니다.
01:42
Google showed that it is possible to find information
30
102675
3109
구글은 컴퓨터 알고리즘을 사용해서
01:45
by using a computer algorithm,
31
105784
1752
정보를 찾을 수 있음을 보여줬는데
01:47
and this algorithm is based on machine learning.
32
107536
2901
이 알고리즘은 기계 학습을 바탕으로 합니다.
01:50
Since that time, there have been many commercial successes of machine learning.
33
110437
3886
그때부터 기계 학습의 상업적 성공이 많이 있었습니다.
01:54
Companies like Amazon and Netflix
34
114323
1837
아마존과 넷플릭스 같은 회사들은
01:56
use machine learning to suggest products that you might like to buy,
35
116160
3716
기계 학습을 이용해서 여러분이 사고 싶은 상품이나
01:59
movies that you might like to watch.
36
119876
2020
보고 싶은 영화를 제안합니다.
02:01
Sometimes, it's almost creepy.
37
121896
1807
때로는 오싹할 지경이죠.
02:03
Companies like LinkedIn and Facebook
38
123703
1954
링크드인과 페이스북 같은 회사들은
02:05
sometimes will tell you about who your friends might be
39
125657
2594
누가 여러분의 친구인지를 말해줄 겁니다.
02:08
and you have no idea how it did it,
40
128251
1977
어떻게 그렇게 하는지 여러분은 모릅니다.
02:10
and this is because it's using the power of machine learning.
41
130228
2967
그 이유는 기계 학습의 힘을 이용하기 때문이죠.
02:13
These are algorithms that have learned how to do this from data
42
133195
2957
이 알고리즘은 하는 방법을 손으로 쓴 프로그램 보다는
02:16
rather than being programmed by hand.
43
136152
3247
데이터에서 배웠습니다.
02:19
This is also how IBM was successful
44
139399
2478
IBM이 왓슨을 이용해 "제퍼디"에서
02:21
in getting Watson to beat the two world champions at "Jeopardy,"
45
141877
3862
2명의 세계 챔피언을 성공적으로 무찌른 이유이기도 합니다.
02:25
answering incredibly subtle and complex questions like this one.
46
145739
3225
이처럼 아주 미묘하고 복잡한 질문에 대답했죠.
02:28
["The ancient 'Lion of Nimrud' went missing from this city's national museum in 2003 (along with a lot of other stuff)"]
47
148964
2835
["고대 '니무르드의 사자'가 2003년 이 도시의 박물관에서 사라졌습니다."
02:31
This is also why we are now able to see the first self-driving cars.
48
151799
3235
이 때문에 우리는 이제 최초의 무인 자동차를 볼 수 있습니다.
02:35
If you want to be able to tell the difference between, say,
49
155034
2822
나무와 보행자의 차이점, 그게 아주 중요한데
02:37
a tree and a pedestrian, well, that's pretty important.
50
157856
2632
그걸 구별하고 싶을 때
02:40
We don't know how to write those programs by hand,
51
160488
2587
손으로 프로그램을 어떻게 써야할지 모르지만
02:43
but with machine learning, this is now possible.
52
163075
2997
기계 학습으로 이제 가능합니다.
02:46
And in fact, this car has driven over a million miles
53
166072
2608
사실 이 자동차는 일반 도로에서 사고 없이
02:48
without any accidents on regular roads.
54
168680
3506
수백만 km를 달렸습니다.
02:52
So we now know that computers can learn,
55
172196
3914
이제 우리는 컴퓨터가 배울 수 있고
02:56
and computers can learn to do things
56
176110
1900
우리가 실제로 하는 방법을
02:58
that we actually sometimes don't know how to do ourselves,
57
178010
2838
모르는 일도 할 수 있도록 배울 수 있음을 압니다.
03:00
or maybe can do them better than us.
58
180848
2885
어쩌면 우리보다 잘할 수도 있어요.
03:03
One of the most amazing examples I've seen of machine learning
59
183733
4195
기계 학습에서 가장 놀라운 예가
03:07
happened on a project that I ran at Kaggle
60
187928
2392
제가 캐글에서 하는 프로젝트에서 일어났습니다.
03:10
where a team run by a guy called Geoffrey Hinton
61
190320
3591
토론토 대학 출신의 제프리 힌튼이
03:13
from the University of Toronto
62
193911
1552
이끄는 팀은
03:15
won a competition for automatic drug discovery.
63
195463
2677
자동 신약 개발을 위한 대회에서 이겼습니다.
03:18
Now, what was extraordinary here is not just that they beat
64
198140
2847
자, 여기서 놀라운 사실은 그들이 머크 또는 국제 학회가
03:20
all of the algorithms developed by Merck or the international academic community,
65
200987
4013
개발한 알고리즘을 이겼을 뿐만 아니라
03:25
but nobody on the team had any background in chemistry or biology or life sciences,
66
205000
5061
어떤 팀원도 화학, 생물학, 생명과학에 관한 지식이 없었다는 점입니다.
03:30
and they did it in two weeks.
67
210061
2169
그들은 2주안에 완성했죠.
03:32
How did they do this?
68
212230
1381
어떻게 했을까요?
03:34
They used an extraordinary algorithm called deep learning.
69
214421
2921
그들은 심화 학습이라는 놀라운 알고리즘을 사용했습니다.
03:37
So important was this that in fact the success was covered
70
217342
2949
이것은 사실 아주 중요해서 몇 주가 지난 뒤
03:40
in The New York Times in a front page article a few weeks later.
71
220291
3121
뉴욕 타임즈에서 앞면 기사로 다뤘습니다.
03:43
This is Geoffrey Hinton here on the left-hand side.
72
223412
2735
왼쪽이 제프리 힌튼입니다.
03:46
Deep learning is an algorithm inspired by how the human brain works,
73
226147
4341
심화 학습은 사람의 뇌가 작용하는 방식에 영감을 받아서 만든
03:50
and as a result it's an algorithm
74
230488
1812
알고리즘으로 그 결과
03:52
which has no theoretical limitations on what it can do.
75
232300
3841
할 수 있는 일에 대한 이론적 한계가 없습니다.
03:56
The more data you give it and the more computation time you give it,
76
236141
2823
더 많은 데이터와 더 많은 계산 시간을 줄수록
03:58
the better it gets.
77
238964
1312
더 좋은 결과를 냅니다.
04:00
The New York Times also showed in this article
78
240276
2339
뉴욕 타임즈는 이 기사에서
04:02
another extraordinary result of deep learning
79
242615
2242
심화 학습의 또다른 놀라운 결과를 보여줬는데
04:04
which I'm going to show you now.
80
244857
2712
여러분께 보여드리죠.
04:07
It shows that computers can listen and understand.
81
247569
4941
컴퓨터가 듣고 이해할 수 있음을 보여줍니다.
04:12
(Video) Richard Rashid: Now, the last step
82
252510
2711
(영상) 리챠드 라시드: 제가 이 과정에서
04:15
that I want to be able to take in this process
83
255221
3025
마지막으로 보여드릴 단계는
04:18
is to actually speak to you in Chinese.
84
258246
4715
실제 중국어로 말하는 것입니다.
04:22
Now the key thing there is,
85
262961
2635
중요한 점은
04:25
we've been able to take a large amount of information from many Chinese speakers
86
265596
5002
많은 중국인들로부터 엄청난 양의 정보를 모을 수 있었고
04:30
and produce a text-to-speech system
87
270598
2530
글자를 음성으로 바꾸는 시스템을 만들어
04:33
that takes Chinese text and converts it into Chinese language,
88
273128
4673
중국 글자를 중국 말로 변환시키고
04:37
and then we've taken an hour or so of my own voice
89
277801
4128
제 목소리를 한 시간 정도 녹음해서
04:41
and we've used that to modulate
90
281929
1891
표준 문자 - 음성 변환 시스템을 조절해서
04:43
the standard text-to-speech system so that it would sound like me.
91
283820
4544
제 목소리처럼 나도록 만들었습니다.
04:48
Again, the result's not perfect.
92
288364
2540
역시 결과는 완벽하지 않습니다.
04:50
There are in fact quite a few errors.
93
290904
2648
사실 오류가 상당히 있었습니다.
04:53
(In Chinese)
94
293552
2484
(중국어)
04:56
(Applause)
95
296036
3367
(박수)
05:01
There's much work to be done in this area.
96
301446
3576
아직 많은 작업이 필요합니다.
05:05
(In Chinese)
97
305022
3645
(중국어)
05:08
(Applause)
98
308667
3433
(박수)
05:13
Jeremy Howard: Well, that was at a machine learning conference in China.
99
313345
3399
제레미 하워드 : 중국에서 열린 기계 학습 회의였습니다.
05:16
It's not often, actually, at academic conferences
100
316744
2370
학술 회의에서 실제로
05:19
that you do hear spontaneous applause,
101
319114
1897
즉흥적인 박수를 듣기는 쉽지 않죠.
05:21
although of course sometimes at TEDx conferences, feel free.
102
321011
3676
그래도 TEDx 회의에서는 자유롭게 하세요.
05:24
Everything you saw there was happening with deep learning.
103
324687
2795
거기서 본 모든 것이 심화 학습으로 일어났습니다.
05:27
(Applause) Thank you.
104
327482
1525
(박수) 감사합니다.
05:29
The transcription in English was deep learning.
105
329007
2282
영어로 옮겨쓰기는 심화 학습이었죠.
05:31
The translation to Chinese and the text in the top right, deep learning,
106
331289
3412
중국어 번역과 오른쪽 위의 글자도 심화 학습이었고
05:34
and the construction of the voice was deep learning as well.
107
334701
3307
목소리로 재생하는 것 역시 심화 학습이었습니다.
05:38
So deep learning is this extraordinary thing.
108
338008
3234
그래서 심화 학습은 놀라운 것입니다.
05:41
It's a single algorithm that can seem to do almost anything,
109
341242
3099
하나의 알고리즘인데 거의 모든 일을 할 수 있어 보입니다.
05:44
and I discovered that a year earlier, it had also learned to see.
110
344341
3111
제가 1년 전에 발견했는데 보는 법도 배웠습니다.
05:47
In this obscure competition from Germany
111
347452
2176
독일의 애매한 대회인
05:49
called the German Traffic Sign Recognition Benchmark,
112
349628
2597
독일 교통 신호 인식 성능평가에서
05:52
deep learning had learned to recognize traffic signs like this one.
113
352225
3393
심화 학습은 이런 교통 신호를 인식하는 법을 배웠습니다.
05:55
Not only could it recognize the traffic signs
114
355618
2094
교통 신호를 인식할 뿐만 아니라
05:57
better than any other algorithm,
115
357712
1758
어떤 알고리즘보다 낫고
05:59
the leaderboard actually showed it was better than people,
116
359470
2719
성적이 사람보다 2배 정도
06:02
about twice as good as people.
117
362189
1852
나은 결과를 보였습니다.
06:04
So by 2011, we had the first example
118
364041
1996
2011년 우리는 사람보다
06:06
of computers that can see better than people.
119
366037
3405
잘 볼 수 있는 컴퓨터의 첫번째 예를 가졌습니다.
06:09
Since that time, a lot has happened.
120
369442
2049
그후로 많은 일이 일어났죠.
06:11
In 2012, Google announced that they had a deep learning algorithm
121
371491
3514
2012년 구글은 심화 학습 알고리즘을 만들었다고 발표했습니다.
06:15
watch YouTube videos
122
375005
1415
유튜브 동영상을 보고
06:16
and crunched the data on 16,000 computers for a month,
123
376420
3437
한 달에 1만6천 대의 컴퓨터 데이터를 처리해서
06:19
and the computer independently learned about concepts such as people and cats
124
379857
4361
컴퓨터는 그냥 동영상을 보는 것만으로 사람과 고양이 같은 개념을
06:24
just by watching the videos.
125
384218
1809
스스로 학습했습니다.
06:26
This is much like the way that humans learn.
126
386027
2352
사람이 배우는 방법과 비슷하죠.
06:28
Humans don't learn by being told what they see,
127
388379
2740
사람들은 보는 것을 알려줘서 배우는 게 아니라
06:31
but by learning for themselves what these things are.
128
391119
3331
그것이 뭔지 스스로 배웁니다.
06:34
Also in 2012, Geoffrey Hinton, who we saw earlier,
129
394450
3369
또한 2012년 우리가 앞서 봤던 제프리 힌튼은
06:37
won the very popular ImageNet competition,
130
397819
2858
아주 유명한 이미지넷 대회에서 우승했는데
06:40
looking to try to figure out from one and a half million images
131
400677
4141
1백만 5천장의 사진을 보고 그게 어떤 사진인지
06:44
what they're pictures of.
132
404818
1438
맞추는 내용이죠.
06:46
As of 2014, we're now down to a six percent error rate
133
406256
3533
2014년 이제 영상 인식에서 6%의 오차율까지
06:49
in image recognition.
134
409789
1453
내려갔습니다.
06:51
This is better than people, again.
135
411242
2026
이것도 사람보다 낫습니다.
06:53
So machines really are doing an extraordinarily good job of this,
136
413268
3769
기계는 정말 놀라울만큼 일을 잘하고 있고
06:57
and it is now being used in industry.
137
417037
2269
이제 산업에서 사용됩니다.
06:59
For example, Google announced last year
138
419306
3042
예를 들어, 구글은 작년에
07:02
that they had mapped every single location in France in two hours,
139
422348
4585
프랑스의 구석구석을 2시간 안에 지도로 만들었다고 발표했는데
07:06
and the way they did it was that they fed street view images
140
426933
3447
그들이 한 방법은 길거리에서 찍은 사진을
07:10
into a deep learning algorithm to recognize and read street numbers.
141
430380
4319
심화 학습 알고리즘에 입력해서 주소를 인식하고 읽게 했습니다.
07:14
Imagine how long it would have taken before:
142
434699
2220
이전에는 얼마나 오래 걸렸을지 생각해보세요.
07:16
dozens of people, many years.
143
436919
3355
수십명의 사람들이 몇 년동안 했겠죠.
07:20
This is also happening in China.
144
440274
1911
이것은 중국에서도 일어나고 있습니다.
07:22
Baidu is kind of the Chinese Google, I guess,
145
442185
4036
바이두는 중국판 구글이라고 제가 추측하는데
07:26
and what you see here in the top left
146
446221
2283
왼쪽 위에서 보는 것은
07:28
is an example of a picture that I uploaded to Baidu's deep learning system,
147
448504
3974
바이두의 심화 학습 시스템에 제가 올린 사진의 예이고
07:32
and underneath you can see that the system has understood what that picture is
148
452478
3769
그 아래에 그 사진이 뭔지를 시스템이 이해하고
07:36
and found similar images.
149
456247
2236
비슷한 사진들을 찾아놓은 것을 볼 수 있죠.
07:38
The similar images actually have similar backgrounds,
150
458483
2736
비슷한 사진들은 실제로 비슷한 배경과
07:41
similar directions of the faces,
151
461219
1658
비슷한 얼굴 방향을 갖고 있고
07:42
even some with their tongue out.
152
462877
1788
혀를 내민 모습도 비슷하죠.
07:44
This is not clearly looking at the text of a web page.
153
464665
3030
이것은 웹페이지의 글자를 찾은 게 아닙니다.
07:47
All I uploaded was an image.
154
467695
1412
제가 올린 것은 사진이었죠.
07:49
So we now have computers which really understand what they see
155
469107
4021
이제 컴퓨터가 본 것을 정말 이해해서
07:53
and can therefore search databases
156
473128
1624
수천만 장의 사진이 든
07:54
of hundreds of millions of images in real time.
157
474752
3554
데이터베이스를 실시간으로 찾을 수 있습니다.
07:58
So what does it mean now that computers can see?
158
478306
3230
컴퓨터가 볼 수 있다는 게 무슨 의미일까요?
08:01
Well, it's not just that computers can see.
159
481536
2017
컴퓨터가 볼 수 있다는 것만이 아니라
08:03
In fact, deep learning has done more than that.
160
483553
2069
사실 심화 학습은 더 많은 일을 했습니다.
08:05
Complex, nuanced sentences like this one
161
485622
2948
이렇게 복잡하고 미묘한 문장은
08:08
are now understandable with deep learning algorithms.
162
488570
2824
이제 심화 학습 알고리즘으로 이해할 수 있습니다.
08:11
As you can see here,
163
491394
1303
여기서 보듯이
08:12
this Stanford-based system showing the red dot at the top
164
492697
2768
위에 있는 빨간점을 보여주는 스탠포드에 있는 시스템은
08:15
has figured out that this sentence is expressing negative sentiment.
165
495465
3919
이 문장이 부정적인 느낌을 표현하는 것을 알아냈습니다.
08:19
Deep learning now in fact is near human performance
166
499384
3406
심화 학습은 이제 사실 사람에 가깝게
08:22
at understanding what sentences are about and what it is saying about those things.
167
502802
5121
문장을 이해하고 그게 어떤 말을 하는지 압니다.
08:27
Also, deep learning has been used to read Chinese,
168
507923
2728
심화 학습은 또한 중국어를 읽는데 사용되었고
08:30
again at about native Chinese speaker level.
169
510651
3156
중국어 원어민 수준입니다.
08:33
This algorithm developed out of Switzerland
170
513807
2168
이 알고리즘은 스위스에서 개발되었는데
08:35
by people, none of whom speak or understand any Chinese.
171
515975
3356
개발자 중 중국어를 할 수 있는 사람이 아무도 없었습니다.
08:39
As I say, using deep learning
172
519331
2051
심화 학습을 사용하는 것은
08:41
is about the best system in the world for this,
173
521382
2219
사람의 이해에 비해서도
08:43
even compared to native human understanding.
174
523601
5117
세계 최고의 시스템에 관한 것입니다.
08:48
This is a system that we put together at my company
175
528718
2964
이것은 우리가 회사에서
08:51
which shows putting all this stuff together.
176
531682
2046
모든 것을 다 통합해서 만든 시스템입니다.
08:53
These are pictures which have no text attached,
177
533728
2461
이것들은 글자가 없는 사진들로서
08:56
and as I'm typing in here sentences,
178
536189
2352
제가 문장을 입력하면
08:58
in real time it's understanding these pictures
179
538541
2969
실시간으로 그 사진들을 이해해서
09:01
and figuring out what they're about
180
541510
1679
그게 어떤 사진인지 알고
09:03
and finding pictures that are similar to the text that I'm writing.
181
543189
3163
제가 쓰는 글에 대해 비슷한 사진을 찾아줍니다.
09:06
So you can see, it's actually understanding my sentences
182
546352
2756
보다시피 제가 쓴 글을 이해하고
09:09
and actually understanding these pictures.
183
549108
2224
이 사진들을 실제로 이해합니다.
09:11
I know that you've seen something like this on Google,
184
551332
2559
여러분은 구글에서 이와 비슷한 것을 봤을 텐데
09:13
where you can type in things and it will show you pictures,
185
553891
2775
여러분이 글자를 입력하면 사진을 보여줍니다.
09:16
but actually what it's doing is it's searching the webpage for the text.
186
556666
3424
하지만 실제로는 그 글자가 있는 웹페이지를 찾는 거죠.
09:20
This is very different from actually understanding the images.
187
560090
3001
이것은 사진을 실제로 이해하는 것과 아주 다릅니다.
09:23
This is something that computers have only been able to do
188
563091
2752
이것은 컴퓨터가 지난 몇 달동안
09:25
for the first time in the last few months.
189
565843
3248
처음으로 할 수 있었던 일입니다.
09:29
So we can see now that computers can not only see but they can also read,
190
569091
4091
이제 컴퓨터는 볼 수 있을 뿐만 아니라 읽을 수도 있고
09:33
and, of course, we've shown that they can understand what they hear.
191
573182
3765
물론 들은 것도 이해할 수 있음을 봤습니다.
09:36
Perhaps not surprising now that I'm going to tell you they can write.
192
576947
3442
컴퓨터가 쓸 줄 안다고 얘기해도 이제는 놀라지 않으실 거에요.
09:40
Here is some text that I generated using a deep learning algorithm yesterday.
193
580389
4783
이것은 심화 학습 알고리즘을 사용해서 어제 제가 만든 글입니다.
09:45
And here is some text that an algorithm out of Stanford generated.
194
585172
3924
이것은 스탠포드에서 만든 알고리즘으로 만든 글입니다.
09:49
Each of these sentences was generated
195
589096
1764
이 글은 각각의 사진을
09:50
by a deep learning algorithm to describe each of those pictures.
196
590860
4249
설명하기 위해 심화 학습 알고리즘이 만들었습니다.
09:55
This algorithm before has never seen a man in a black shirt playing a guitar.
197
595109
4472
이 알고리즘은 검은색 셔츠를 입고 기타를 치는 남자를 본 적이 없습니다.
09:59
It's seen a man before, it's seen black before,
198
599581
2220
남자를 본 적이 있고 검은 색을 본 적이 있고
10:01
it's seen a guitar before,
199
601801
1599
기타를 본 적은 있어요.
10:03
but it has independently generated this novel description of this picture.
200
603400
4294
그런데 스스로 이 사진을 훌륭하게 설명했습니다.
10:07
We're still not quite at human performance here, but we're close.
201
607694
3502
아직도 사람보다는 못하지만 꽤 가까이 왔습니다.
10:11
In tests, humans prefer the computer-generated caption
202
611196
4068
실험에서 사람들은 컴퓨터가 만들어낸 캡션을
10:15
one out of four times.
203
615264
1527
4회당 1회 꼴로 좋아했습니다.
10:16
Now this system is now only two weeks old,
204
616791
2064
이 시스템은 이제 2주가 되었는데
10:18
so probably within the next year,
205
618855
1846
아마도 내년 안으로
10:20
the computer algorithm will be well past human performance
206
620701
2801
지금 진행되는 속도로 봐서 컴퓨터 알고리즘이
10:23
at the rate things are going.
207
623502
1862
사람을 앞지를 것입니다.
10:25
So computers can also write.
208
625364
3049
컴퓨터는 쓸 수도 있습니다.
10:28
So we put all this together and it leads to very exciting opportunities.
209
628413
3475
그래서 이 모든 기능을 합하면 아주 흥미로운 기회가 생기겠죠.
10:31
For example, in medicine,
210
631888
1492
예를 들어 의학에서
10:33
a team in Boston announced that they had discovered
211
633380
2525
보스턴의 팀은 종양에서
10:35
dozens of new clinically relevant features
212
635905
2949
임상적으로 관련된 수십가지의 특징을 새롭게 발견했는데
10:38
of tumors which help doctors make a prognosis of a cancer.
213
638854
4266
이것으로 의사들이 암을 예측하는데 도움을 줄 수 있습니다.
10:44
Very similarly, in Stanford,
214
644220
2296
스탠포드에서도 비슷하게
10:46
a group there announced that, looking at tissues under magnification,
215
646516
3663
한 그룹이 조직을 확대경으로 보는
10:50
they've developed a machine learning-based system
216
650179
2381
기계 학습을 기반으로 한 시스템을 개발했는데
10:52
which in fact is better than human pathologists
217
652560
2582
사실 암 환자의 생존율을 예측하는데
10:55
at predicting survival rates for cancer sufferers.
218
655142
4377
병리학자보다 낫다고 합니다.
10:59
In both of these cases, not only were the predictions more accurate,
219
659519
3245
두 경우 모두 예측이 더 정확할 뿐만 아니라
11:02
but they generated new insightful science.
220
662764
2502
통찰력있는 과학을 새로 만들어냈습니다.
11:05
In the radiology case,
221
665276
1505
방사선학의 경우
11:06
they were new clinical indicators that humans can understand.
222
666781
3095
사람이 이해할 수 있는 새로운 임상 징후가 있었습니다.
11:09
In this pathology case,
223
669876
1792
병리학의 경우
11:11
the computer system actually discovered that the cells around the cancer
224
671668
4500
컴퓨터 시스템은 진단을 하는데
11:16
are as important as the cancer cells themselves
225
676168
3340
실제로 암주변의 세포가 암 세포 만큼이나
11:19
in making a diagnosis.
226
679508
1752
중요하다는 사실을 발견했습니다.
11:21
This is the opposite of what pathologists had been taught for decades.
227
681260
5361
이는 병리학자가 수십년동안 가르친 사실과 반대됩니다.
11:26
In each of those two cases, they were systems developed
228
686621
3292
각각의 경우에서 시스템은
11:29
by a combination of medical experts and machine learning experts,
229
689913
3621
의학 전문과와 기계 학습 전문가가 함께 개발했지만
11:33
but as of last year, we're now beyond that too.
230
693534
2741
작년에 그걸 뛰어넘었습니다.
11:36
This is an example of identifying cancerous areas
231
696275
3549
이것은 현미경으로 사람의 조직에서
11:39
of human tissue under a microscope.
232
699824
2530
암 조직을 밝히는 예입니다.
11:42
The system being shown here can identify those areas more accurately,
233
702354
4613
여기서 보는 시스템은 암 조직을 더 정확히 판별할 수 있고
11:46
or about as accurately, as human pathologists,
234
706967
2775
병리학자만큼이나 정확하게 판별할 수 있지만
11:49
but was built entirely with deep learning using no medical expertise
235
709742
3392
의학 전문가를 쓰지 않고 그 분야에 지식이 전혀 없는 사람들이
11:53
by people who have no background in the field.
236
713134
2526
심화 학습 만으로 만들었습니다.
11:56
Similarly, here, this neuron segmentation.
237
716730
2555
마찬가지로 여기 신경 분할인데
11:59
We can now segment neurons about as accurately as humans can,
238
719285
3668
사람만큼이나 정확하게 신경을 분할할 수 있지만
12:02
but this system was developed with deep learning
239
722953
2717
이 시스템은 의학에 배경지식이 없는 사람들이
12:05
using people with no previous background in medicine.
240
725670
3251
심화 학습을 이용해서 만들었습니다.
12:08
So myself, as somebody with no previous background in medicine,
241
728921
3227
그래서 저처럼 의학에 배경지식이 없는 사람이
12:12
I seem to be entirely well qualified to start a new medical company,
242
732148
3727
새로운 의료 회사를 시작하는데 아주 적합한 사람처럼 보여서
12:15
which I did.
243
735875
2146
실제로 그렇게 했죠.
12:18
I was kind of terrified of doing it,
244
738021
1740
공포를 느꼈지만
12:19
but the theory seemed to suggest that it ought to be possible
245
739761
2889
이론은 이런 데이터 분석기법을 이용해서
12:22
to do very useful medicine using just these data analytic techniques.
246
742650
5492
아주 유용한 의학이 가능함을 제시해주고 있었죠.
12:28
And thankfully, the feedback has been fantastic,
247
748142
2480
그리고 감사하게도 평가는 좋았습니다.
12:30
not just from the media but from the medical community,
248
750622
2356
미디어 뿐만 아니라 의학계에서도
12:32
who have been very supportive.
249
752978
2344
아주 긍정적이었습니다.
12:35
The theory is that we can take the middle part of the medical process
250
755322
4149
그 이론은 의료 과정의 중간 부분을 우리가 가져와서
12:39
and turn that into data analysis as much as possible,
251
759471
2893
최대한 데이터 분석을 한 뒤
12:42
leaving doctors to do what they're best at.
252
762364
3065
의사들에게 그들이 잘하는 일을 맡기는 거죠.
12:45
I want to give you an example.
253
765429
1602
예를 보여드리겠습니다.
12:47
It now takes us about 15 minutes to generate a new medical diagnostic test
254
767031
4944
새로운 의료 진단 실험을 하는데 15분쯤 걸리는데
12:51
and I'll show you that in real time now,
255
771975
1954
이제 실시간으로 보여드리죠.
12:53
but I've compressed it down to three minutes by cutting some pieces out.
256
773929
3487
몇 단계를 생략해서 3분으로 줄였습니다.
12:57
Rather than showing you creating a medical diagnostic test,
257
777416
3061
의료 진단 실험을 하는 것을 보여주는 대신
13:00
I'm going to show you a diagnostic test of car images,
258
780477
3369
자동차 사진의 진단 실험을 보여드리겠습니다.
13:03
because that's something we can all understand.
259
783846
2222
왜냐하면 우리 모두 이해할 수 있는 거니까요.
13:06
So here we're starting with about 1.5 million car images,
260
786068
3201
여기서 150만 개의 자동차 사진으로 시작하죠.
13:09
and I want to create something that can split them into the angle
261
789269
3206
사진을 찍은 각도로
13:12
of the photo that's being taken.
262
792475
2223
분류하는 뭔가를 만들고 싶어요.
13:14
So these images are entirely unlabeled, so I have to start from scratch.
263
794698
3888
이 사진들은 모두 제목도 없어서 처음부터 시작해야 됩니다.
13:18
With our deep learning algorithm,
264
798586
1865
심화 학습 알고리즘으로
13:20
it can automatically identify areas of structure in these images.
265
800451
3707
이 사진들의 구조를 자동으로 구별할 수 있습니다.
13:24
So the nice thing is that the human and the computer can now work together.
266
804158
3620
좋은 점은 사람과 컴퓨터가 함께 일할 수 있다는 거죠.
13:27
So the human, as you can see here,
267
807778
2178
사람은 여기서 보다시피
13:29
is telling the computer about areas of interest
268
809956
2675
컴퓨터한테 관심분야를 말하고
13:32
which it wants the computer then to try and use to improve its algorithm.
269
812631
4650
컴퓨터가 알고리즘을 개선하죠.
13:37
Now, these deep learning systems actually are in 16,000-dimensional space,
270
817281
4296
자, 이 심화 학습 시스템은 실제로 1만6천 차원의 공간을 가집니다.
13:41
so you can see here the computer rotating this through that space,
271
821577
3432
컴퓨터가 이것을 그 공간사이로 회전하는 것을 볼 수 있습니다.
13:45
trying to find new areas of structure.
272
825009
1992
새로운 구조를 발견하려는 거죠.
13:47
And when it does so successfully,
273
827001
1781
컴퓨터가 성공적으로 끝내면
13:48
the human who is driving it can then point out the areas that are interesting.
274
828782
4004
그걸 작동하는 사람은 관심있는 분야를 가리킵니다.
13:52
So here, the computer has successfully found areas,
275
832786
2422
여기서 컴퓨터는 그 분야를 성공적으로 찾아냈는데
13:55
for example, angles.
276
835208
2562
이 경우는 각도이죠.
13:57
So as we go through this process,
277
837770
1606
우리가 이 과정을 거쳐가면서
13:59
we're gradually telling the computer more and more
278
839376
2340
컴퓨터한테 우리가 찾고 있는 구조에 대해서
14:01
about the kinds of structures we're looking for.
279
841716
2428
단계적으로 더 많이 말해줍니다.
14:04
You can imagine in a diagnostic test
280
844144
1772
진단 실험에서
14:05
this would be a pathologist identifying areas of pathosis, for example,
281
845916
3350
병리학자가 병적 상태인 곳을 밝혀내거나
14:09
or a radiologist indicating potentially troublesome nodules.
282
849266
5026
방사선의가 문제가 있을 수 있는 혹을 가르키는 것을 상상할 수 있습니다.
14:14
And sometimes it can be difficult for the algorithm.
283
854292
2559
알고리즘에서 어려운 부분도 있습니다.
14:16
In this case, it got kind of confused.
284
856851
1964
이 경우 약간 헷갈렸어요.
14:18
The fronts and the backs of the cars are all mixed up.
285
858815
2550
자동차의 앞과 뒤가 모두 섞여버렸죠.
14:21
So here we have to be a bit more careful,
286
861365
2072
그래서 여기서 좀더 주의해서
14:23
manually selecting these fronts as opposed to the backs,
287
863437
3232
뒤가 아니라 앞을 수동으로 선택해서
14:26
then telling the computer that this is a type of group
288
866669
5506
컴퓨터에게 우리가 관심있는 부분이 이 부분이라고
14:32
that we're interested in.
289
872175
1348
얘기를 해야합니다.
14:33
So we do that for a while, we skip over a little bit,
290
873523
2677
그래서 한동안 그 작업을 하고 좀 더 건너뛰면
14:36
and then we train the machine learning algorithm
291
876200
2246
이런 수백 가지 일을 바탕으로
14:38
based on these couple of hundred things,
292
878446
1974
기계 학습 알고리즘을 훈련시켜
14:40
and we hope that it's gotten a lot better.
293
880420
2025
앞으로 더 나아지기를 바랍니다.
14:42
You can see, it's now started to fade some of these pictures out,
294
882445
3073
보다시피 시스템은 사진들 일부를 사라지게 만들면서
14:45
showing us that it already is recognizing how to understand some of these itself.
295
885518
4708
이 사진들을 이해하는 법을 이미 인식하고 있음을 보여줍니다.
14:50
We can then use this concept of similar images,
296
890226
2902
우리는 비슷한 사진의 개념을 이용해서
14:53
and using similar images, you can now see,
297
893128
2094
이제 여러분이 보는 것과 같이
14:55
the computer at this point is able to entirely find just the fronts of cars.
298
895222
4019
이 시점에서 컴퓨터는 자동차의 앞만 찾을 수 있습니다.
14:59
So at this point, the human can tell the computer,
299
899241
2948
이 시점에서 사람은 컴퓨터에게
15:02
okay, yes, you've done a good job of that.
300
902189
2293
좋아, 잘 했어. 라고 말할 수 있죠.
15:05
Sometimes, of course, even at this point
301
905652
2185
물론 어떤 경우는 이 시점에도
15:07
it's still difficult to separate out groups.
302
907837
3674
그룹으로 나누기가 어렵습니다.
15:11
In this case, even after we let the computer try to rotate this for a while,
303
911511
3884
이 경우 컴퓨터가 한동안 이것을 회전하게 내버려둬도
15:15
we still find that the left sides and the right sides pictures
304
915399
3345
왼쪽과 오른쪽이 뒤섞인 것을
15:18
are all mixed up together.
305
918744
1478
볼 수 있습니다.
15:20
So we can again give the computer some hints,
306
920222
2140
그래서 컴퓨터한테 다시 힌트를 줘서
15:22
and we say, okay, try and find a projection that separates out
307
922362
2976
심화 학습 알고리즘을 이용해서
15:25
the left sides and the right sides as much as possible
308
925338
2607
왼쪽과 오른쪽을 가능한 분리시키는
15:27
using this deep learning algorithm.
309
927945
2122
투사도를 찾아라고 합니다.
15:30
And giving it that hint -- ah, okay, it's been successful.
310
930067
2942
그 힌트를 주면 성공입니다.
15:33
It's managed to find a way of thinking about these objects
311
933009
2882
이들 물체들을 분리해내는
15:35
that's separated out these together.
312
935891
2380
방법을 스스로 찾은 거죠.
15:38
So you get the idea here.
313
938271
2438
여기서 생각을 얻을 수 있죠.
15:40
This is a case not where the human is being replaced by a computer,
314
940709
8197
사람이 컴퓨터로 대체되는 경우가 아니라
15:48
but where they're working together.
315
948906
2640
함께 일합니다.
15:51
What we're doing here is we're replacing something that used to take a team
316
951546
3550
우리가 여기서 하는 일은
15:55
of five or six people about seven years
317
955096
2002
5-6명의 팀이 7년쯤 걸리는 일을
15:57
and replacing it with something that takes 15 minutes
318
957098
2605
한 사람이 15분 걸려서
15:59
for one person acting alone.
319
959703
2505
하는 일로 대체합니다.
16:02
So this process takes about four or five iterations.
320
962208
3950
이 과정은 4 - 5 번 반복합니다.
16:06
You can see we now have 62 percent
321
966158
1859
보다시피 150만 장의 사진의
16:08
of our 1.5 million images classified correctly.
322
968017
2959
62%가 제대로 분류된 것을 볼 수 있죠.
16:10
And at this point, we can start to quite quickly
323
970976
2472
이 시점에서 우리는
16:13
grab whole big sections,
324
973448
1297
전체를 빠르게 잡아서
16:14
check through them to make sure that there's no mistakes.
325
974745
2919
실수가 없는지 확인합니다.
16:17
Where there are mistakes, we can let the computer know about them.
326
977664
3952
실수가 있으면 컴퓨터에게 알리죠.
16:21
And using this kind of process for each of the different groups,
327
981616
3045
각각의 다른 그룹에서 이런 과정을 통해
16:24
we are now up to an 80 percent success rate
328
984661
2487
150만 장의 사진을 분류하는데
16:27
in classifying the 1.5 million images.
329
987148
2415
80%의 성공율을 보입니다.
16:29
And at this point, it's just a case
330
989563
2078
이 시점에서는
16:31
of finding the small number that aren't classified correctly,
331
991641
3579
바르게 분류되지 않은 적은 숫자를 찾아
16:35
and trying to understand why.
332
995220
2888
이유를 알아내는 과정입니다.
16:38
And using that approach,
333
998108
1743
그런 방식으로
16:39
by 15 minutes we get to 97 percent classification rates.
334
999851
4121
15분 안에 우리는 97%의 분류율을 얻습니다.
16:43
So this kind of technique could allow us to fix a major problem,
335
1003972
4600
이런 기술은 우리가 중요한 문제를 고칠 수 있게 하는데
16:48
which is that there's a lack of medical expertise in the world.
336
1008578
3036
그것은 세계에서 의료 전문가가 부족하다는 사실입니다.
16:51
The World Economic Forum says that there's between a 10x and a 20x
337
1011614
3489
세계 경제 포럼은 개발도상국에서
16:55
shortage of physicians in the developing world,
338
1015103
2624
10배에서 20배의 의사가 부족하다고 말했는데
16:57
and it would take about 300 years
339
1017727
2113
그 문제를 고치기 위해
16:59
to train enough people to fix that problem.
340
1019840
2894
충분한 인원을 교육시키려면 300년이 걸립니다.
17:02
So imagine if we can help enhance their efficiency
341
1022734
2885
이런 심화 학습 방식을 사용해서
17:05
using these deep learning approaches?
342
1025619
2839
그들의 효율을 높일 수 있다고 상상해보세요.
17:08
So I'm very excited about the opportunities.
343
1028458
2232
저는 그런 기회에 대해 아주 흥분했습니다.
17:10
I'm also concerned about the problems.
344
1030690
2589
저는 그 문제도 걱정합니다.
17:13
The problem here is that every area in blue on this map
345
1033279
3124
여기서 문제는 이 지도에서 파란색으로 표시된 곳은
17:16
is somewhere where services are over 80 percent of employment.
346
1036403
3769
서비스가 고용의 80% 이상을 차지합니다.
17:20
What are services?
347
1040172
1787
무슨 서비스일까요?
17:21
These are services.
348
1041959
1514
이런 서비스입니다.
17:23
These are also the exact things that computers have just learned how to do.
349
1043473
4154
이것들은 컴퓨터가 방금 배운 것과 똑같습니다.
17:27
So 80 percent of the world's employment in the developed world
350
1047627
3804
개발된 세상에서 고용의 80%가
17:31
is stuff that computers have just learned how to do.
351
1051431
2532
컴퓨터가 방금 배운 것입니다.
17:33
What does that mean?
352
1053963
1440
그게 뭘 뜻합니까?
17:35
Well, it'll be fine. They'll be replaced by other jobs.
353
1055403
2583
글쎄, 괜찮을거에요. 다른 일자리로 대체되겠죠.
17:37
For example, there will be more jobs for data scientists.
354
1057986
2707
예를 들면, 데이터 과학자한테 더 많은 일이 있을 겁니다.
17:40
Well, not really.
355
1060693
817
그렇지 않아요.
17:41
It doesn't take data scientists very long to build these things.
356
1061510
3118
데이터 과학자가 이런 것을 만드는데 오래 걸리지 않습니다.
17:44
For example, these four algorithms were all built by the same guy.
357
1064628
3252
예를 들어, 4가지 알고리즘이 모두 한 사람이 만들었죠.
17:47
So if you think, oh, it's all happened before,
358
1067880
2438
여러분이 이전에도 이런 일이 벌어졌다고 생각한다면
17:50
we've seen the results in the past of when new things come along
359
1070318
3808
과거에 새로운 것이 나타났을 때 그 결과를 본 적이 있죠.
17:54
and they get replaced by new jobs,
360
1074126
2252
새로운 일자리로 대체되었고
17:56
what are these new jobs going to be?
361
1076378
2116
새로운 일자리는 어떤 것일까요?
17:58
It's very hard for us to estimate this,
362
1078494
1871
이것을 예측하기가 정말 어렵습니다.
18:00
because human performance grows at this gradual rate,
363
1080365
2739
왜냐하면 사람의 성과는 이렇게 점진적인데
18:03
but we now have a system, deep learning,
364
1083104
2562
심화 학습 시스템은
18:05
that we know actually grows in capability exponentially.
365
1085666
3227
능력이 기하급수적으로 증가하는 것을 압니다.
18:08
And we're here.
366
1088893
1605
우리는 여기에 있죠.
18:10
So currently, we see the things around us
367
1090498
2061
현재 우리는 주변을 보면서 말해요.
18:12
and we say, "Oh, computers are still pretty dumb." Right?
368
1092559
2676
"컴퓨터는 정말 바보야." 그렇지?
18:15
But in five years' time, computers will be off this chart.
369
1095235
3429
하지만 5년 안에 컴퓨터는 이 도표밖으로 나갈 겁니다.
18:18
So we need to be starting to think about this capability right now.
370
1098664
3865
그래서 이 능력을 지금 당장 생각해야 합니다.
18:22
We have seen this once before, of course.
371
1102529
2050
물론 전에도 이걸 본 적이 있습니다.
18:24
In the Industrial Revolution,
372
1104579
1387
산업 혁명에서
18:25
we saw a step change in capability thanks to engines.
373
1105966
2851
엔진 덕분에 능력이 한 단계 달라졌죠.
18:29
The thing is, though, that after a while, things flattened out.
374
1109667
3138
하지만 시간이 좀 흐른 뒤 오름세가 멈췄습니다.
18:32
There was social disruption,
375
1112805
1702
사회적 분열이 있었지만
18:34
but once engines were used to generate power in all the situations,
376
1114507
3439
엔진을 사용해서 모든 상황에서 동력을 만들어내자
18:37
things really settled down.
377
1117946
2354
모든게 안정되었죠.
18:40
The Machine Learning Revolution
378
1120300
1473
기계 학습 혁명은
18:41
is going to be very different from the Industrial Revolution,
379
1121773
2909
산업 혁명과는 아주 다릅니다.
18:44
because the Machine Learning Revolution, it never settles down.
380
1124682
2950
기계 학습 혁명은 절대 안정되지 않을 거니까요.
18:47
The better computers get at intellectual activities,
381
1127632
2982
컴퓨터의 지능활동이 더 나을수록
18:50
the more they can build better computers to be better at intellectual capabilities,
382
1130614
4248
더 나은 컴퓨터를 만들테고 그 컴퓨터는 지적 능력이 더 뛰어나겠죠.
18:54
so this is going to be a kind of change
383
1134862
1908
그래서 이것은 세계가 실제로
18:56
that the world has actually never experienced before,
384
1136770
2478
경험해본 적이 없는 변화가 될 것입니다.
18:59
so your previous understanding of what's possible is different.
385
1139248
3306
여러분이 이전에 가능하다고 이해한 것들이 이제는 다릅니다.
19:02
This is already impacting us.
386
1142974
1780
이것은 이미 우리에게 영향을 주고 있습니다.
19:04
In the last 25 years, as capital productivity has increased,
387
1144754
3630
지난 25년간 자본 생산량은 증가했지만
19:08
labor productivity has been flat, in fact even a little bit down.
388
1148400
4188
노동 생산량은 변화가 없었고 사실 조금 감소했습니다.
19:13
So I want us to start having this discussion now.
389
1153408
2741
그래서 이런 토론을 지금부터 시작하고 싶습니다.
19:16
I know that when I often tell people about this situation,
390
1156149
3027
제가 이런 상황을 사람들에게 종종 얘기하면
19:19
people can be quite dismissive.
391
1159176
1490
사람들은 아주 무시합니다.
19:20
Well, computers can't really think,
392
1160666
1673
컴퓨터는 진짜 생각할 수 없어.
19:22
they don't emote, they don't understand poetry,
393
1162339
3028
감정을 드러내지 못하고 시도 이해를 못하지.
19:25
we don't really understand how they work.
394
1165367
2521
우리는 컴퓨터가 어떻게 작동하는지 정말 이해할 수 없어.
19:27
So what?
395
1167888
1486
그러니 어쩌라고?
19:29
Computers right now can do the things
396
1169374
1804
컴퓨터는 지금
19:31
that humans spend most of their time being paid to do,
397
1171178
2719
사람들이 돈받고 하는 일을 할 수 있습니다.
19:33
so now's the time to start thinking
398
1173897
1731
그래서 이제는 우리가
19:35
about how we're going to adjust our social structures and economic structures
399
1175628
4387
이런 새로운 현실을 인식하도록 사회적, 경제적 구조를 조정하는 법을
19:40
to be aware of this new reality.
400
1180015
1840
생각해봐야 할 때입니다.
19:41
Thank you.
401
1181855
1533
감사합니다.
19:43
(Applause)
402
1183388
802
(박수)
이 웹사이트 정보

이 사이트는 영어 학습에 유용한 YouTube 동영상을 소개합니다. 전 세계 최고의 선생님들이 가르치는 영어 수업을 보게 될 것입니다. 각 동영상 페이지에 표시되는 영어 자막을 더블 클릭하면 그곳에서 동영상이 재생됩니다. 비디오 재생에 맞춰 자막이 스크롤됩니다. 의견이나 요청이 있는 경우 이 문의 양식을 사용하여 문의하십시오.

https://forms.gle/WvT1wiN1qDtmnspy7