How we teach computers to understand pictures | Fei Fei Li

1,159,394 views ・ 2015-03-23

TED


Vui lòng nhấp đúp vào phụ đề tiếng Anh bên dưới để phát video.

Translator: Tran Le Reviewer: Tan Doan Nhut
00:14
Let me show you something.
0
14366
3738
Để tôi cho bạn xem cái này.
00:18
(Video) Girl: Okay, that's a cat sitting in a bed.
1
18104
4156
(Video) Bé gái: Okay, đó là một con mèo ngồi trên giường
00:22
The boy is petting the elephant.
2
22260
4040
Đứa trẻ đang vuốt ve con voi
00:26
Those are people that are going on an airplane.
3
26300
4354
Những người này đang chuẩn bị lên máy bay.
00:30
That's a big airplane.
4
30654
2810
Đó là một cái máy bay lớn.
00:33
Fei-Fei Li: This is a three-year-old child
5
33464
2206
Fei Fei Li: Đây là một bé gái ba tuổi
00:35
describing what she sees in a series of photos.
6
35670
3679
đang miêu tả những gì mà em nhìn thấy trong loạt hình.
00:39
She might still have a lot to learn about this world,
7
39349
2845
Em vẫn còn nhiều điều để khám phá về thế giới này,
00:42
but she's already an expert at one very important task:
8
42194
4549
nhưng em hoàn toàn đã trở thành chuyên gia trong một nhiệm vụ rất quan trọng:
00:46
to make sense of what she sees.
9
46743
2846
hiểu được những thứ mà em thấy.
Xã hội của chúng ta đã trở nên tiến bộ về mặt công nghệ hơn bao giờ hết.
00:50
Our society is more technologically advanced than ever.
10
50229
4226
00:54
We send people to the moon, we make phones that talk to us
11
54455
3629
Chúng ta gửi con người lên mặt trăng, chúng ta chế tạo ra điện thoại
00:58
or customize radio stations that can play only music we like.
12
58084
4946
hoăc điều chỉnh những đài phát thanh chỉ chơi loại nhạc chúng ta yêu thích.
01:03
Yet, our most advanced machines and computers
13
63030
4055
Nhưng mà, những thiết bị và máy vi tính tối tân nhất
01:07
still struggle at this task.
14
67085
2903
vẫn còn đang xoay xở trong nhiệm vụ này
01:09
So I'm here today to give you a progress report
15
69988
3459
Vì thế mà tôi ở đây để báo cáo với bạn về quá trình
01:13
on the latest advances in our research in computer vision,
16
73447
4047
của cải tiến mới nhất trong thí nghiệm đối với thị giác máy tính
01:17
one of the most frontier and potentially revolutionary
17
77494
4161
một trong những công nghệ dẫn đầu và có tiềm năng cách mạng
01:21
technologies in computer science.
18
81655
3206
trong khoa học máy tính.
01:24
Yes, we have prototyped cars that can drive by themselves,
19
84861
4551
Vâng, chúng ta đã có nguyên mẫu những chiếc xe lái tự động,
01:29
but without smart vision, they cannot really tell the difference
20
89412
3853
nhưng lại thiếu đi thị giác thông minh, chúng không phân biệt được sự khác nhau
01:33
between a crumpled paper bag on the road, which can be run over,
21
93265
3970
giữa một cái túi giấy rách trên đường, cái có thể cán qua,
01:37
and a rock that size, which should be avoided.
22
97235
3340
và một tảng đá với cùng kích thước, mà nên tránh sang một bên.
01:41
We have made fabulous megapixel cameras,
23
101415
3390
Chúng ta đã tạo nên những máy ảnh đắt đỏ hàng triệu điểm ảnh
01:44
but we have not delivered sight to the blind.
24
104805
3135
nhưng chúng ta chưa đưa ánh sáng đến cho người mù.
01:48
Drones can fly over massive land,
25
108420
3305
máy bay không người lái có thể bay qua vùng đất rộng lớn,
01:51
but don't have enough vision technology
26
111725
2134
nhưng không có đủ thị giác công nghệ
01:53
to help us to track the changes of the rainforests.
27
113859
3461
để giúp chúng ta theo dõi sự thay đổi của những rừng mưa nhiệt đới.
01:57
Security cameras are everywhere,
28
117320
2950
Máy quay an ninh ở khắp mọi nơi,
02:00
but they do not alert us when a child is drowning in a swimming pool.
29
120270
5067
nhưng không thể báo động cho chúng ta khi một đứa trẻ đang bị chìm trong hồ bơi.
02:06
Photos and videos are becoming an integral part of global life.
30
126167
5595
Hình ảnh và những thước phim trở thành một phần thiết yếu của đời sống toàn cầu.
02:11
They're being generated at a pace that's far beyond what any human,
31
131762
4087
Chúng đang được điều khiển với tốc độ vượt lên trên bất kỳ con người nào,
02:15
or teams of humans, could hope to view,
32
135849
2783
hay nhóm người, có thể hy vọng thấy được,
02:18
and you and I are contributing to that at this TED.
33
138632
3921
và bạn và tôi đang cống hiến cho điều đó ở TED này.
02:22
Yet our most advanced software is still struggling at understanding
34
142553
5232
Nhưng phần mềm tân tiến vẫn đang phải khó khăn xoay trở trong việc hiểu
02:27
and managing this enormous content.
35
147785
3876
và quản lý nội dung khổng lồ này.
02:31
So in other words, collectively as a society,
36
151661
5272
Vì vậy nói cách khác, tụ chung lại như là một xã hội,
02:36
we're very much blind,
37
156933
1746
chúng ta giống như bị mù,
02:38
because our smartest machines are still blind.
38
158679
3387
bởi vì chiếc máy thông minh nhất của chúng ta vẫn bị mù
02:43
"Why is this so hard?" you may ask.
39
163526
2926
"Tại sao lại khó đến vậy" bạn sẽ hỏi.
02:46
Cameras can take pictures like this one
40
166452
2693
Máy ảnh có thể chụp được những bức thế này
02:49
by converting lights into a two-dimensional array of numbers
41
169145
3994
bằng cách chuyển đổi ánh sáng thành dãy 2 chiều những con số,
02:53
known as pixels,
42
173139
1650
được biết đến như điểm ảnh,
02:54
but these are just lifeless numbers.
43
174789
2251
nhưng chúng giống như những con số chết.
02:57
They do not carry meaning in themselves.
44
177040
3111
Chúng không mang bất kỳ ý nghĩa nào cả.
03:00
Just like to hear is not the same as to listen,
45
180151
4343
Giống như nghe thì không phải là thưởng thức,
03:04
to take pictures is not the same as to see,
46
184494
4040
chụp ảnh không giống như nhìn thấy
03:08
and by seeing, we really mean understanding.
47
188534
3829
và với việc nhìn thấy, chúng tôi thực sự muốn nói là hiểu được.
03:13
In fact, it took Mother Nature 540 million years of hard work
48
193293
6177
Trong thực tế, mẹ thiên nhiên phải mất 540 triệu năm cật lực
03:19
to do this task,
49
199470
1973
mới làm được điều này,
03:21
and much of that effort
50
201443
1881
và hầu hết nỗ lực đó
03:23
went into developing the visual processing apparatus of our brains,
51
203324
5271
để đi đến việc phát triển quá trình của não bộ chúng ta,
03:28
not the eyes themselves.
52
208595
2647
không chỉ mỗi đôi mắt.
03:31
So vision begins with the eyes,
53
211242
2747
Vì thế mà cái nhìn bắt đầu với đôi mắt,
03:33
but it truly takes place in the brain.
54
213989
3518
nhưng thật sự diễn ra trong não bộ.
03:38
So for 15 years now, starting from my Ph.D. at Caltech
55
218287
5060
Vì thế mà 15 năm qua, bắt đầu với luận án tiến sĩ của tôi tại Caltech
03:43
and then leading Stanford's Vision Lab,
56
223347
2926
và sau đó là hướng dẫn phòng thí nghiệm Thị giác ở Stanford,
03:46
I've been working with my mentors, collaborators and students
57
226273
4396
tôi đã làm việc với cố vấn, đối tác và sinh viên
03:50
to teach computers to see.
58
230669
2889
để dạy cho máy tính cách nhìn.
03:54
Our research field is called computer vision and machine learning.
59
234658
3294
Lĩnh vực nghiên cứu của chúng tôi gọi là thị giác máy tính và máy móc học hỏi.
03:57
It's part of the general field of artificial intelligence.
60
237952
3878
Nó là một phần của lĩnh vực chung - trí thông minh nhân tạo.
04:03
So ultimately, we want to teach the machines to see just like we do:
61
243000
5493
Nên một cách tối ưu nhất, chúng tôi muốn dạy cho máy móc thấy được như chúng ta:
04:08
naming objects, identifying people, inferring 3D geometry of things,
62
248493
5387
kể tên đồ vật, nhận diện con người, những đồ vật 3D tương tự,
04:13
understanding relations, emotions, actions and intentions.
63
253880
5688
hiểu được những mối quan hệ, tình cảm, hành động và cả dự định.
04:19
You and I weave together entire stories of people, places and things
64
259568
6153
Bạn và tôi cùng nhau dệt nên toàn bộ câu chuyện về con người -nơi chốn -đồ vật.
04:25
the moment we lay our gaze on them.
65
265721
2164
giây phút mà chúng ta nhìn thấy chúng.
04:28
The first step towards this goal is to teach a computer to see objects,
66
268955
5583
Bước đầu tiên đạt được mục tiêu này là dạy cho máy tính nhìn những đồ vật,
04:34
the building block of the visual world.
67
274538
3368
những block nhà của thế giới thị giác.
04:37
In its simplest terms, imagine this teaching process
68
277906
4434
Nói một cách đơn giản nhất, tưởng tượng quá trình dạy học này
04:42
as showing the computers some training images
69
282340
2995
bằng cách chỉ cho máy tính một vài bức ảnh rèn luyện
04:45
of a particular object, let's say cats,
70
285335
3321
của những vậy cụ thể, ở đây là con mèo.
04:48
and designing a model that learns from these training images.
71
288656
4737
và thiết kế một hình mẫu học được từ những bức ảnh rèn luyện này.
04:53
How hard can this be?
72
293393
2044
Khó như thế nào nhỉ?
04:55
After all, a cat is just a collection of shapes and colors,
73
295437
4052
Nói cho cùng, một con mèo là tổ hợp của hình dạng và màu sắc,
04:59
and this is what we did in the early days of object modeling.
74
299489
4086
và đây là cái mà chúng tôi đã làm ở thời kỳ đầu của việc tạo lập vật thể.
05:03
We'd tell the computer algorithm in a mathematical language
75
303575
3622
Chúng tôi nói cho máy vi tính thuật toán dưới dạng ngôn ngữ toán học
05:07
that a cat has a round face, a chubby body,
76
307197
3343
rằng con mèo có mặt tròn, một thân hình mũm mĩm,
05:10
two pointy ears, and a long tail,
77
310540
2299
2 tai nhọn, và một cái đuôi dài,
05:12
and that looked all fine.
78
312839
1410
và cái đó nhìn có vẻ ổn.
05:14
But what about this cat?
79
314859
2113
Nhưng với con mèo này thì sao?
05:16
(Laughter)
80
316972
1091
(Tiếng cười)
05:18
It's all curled up.
81
318063
1626
toàn là những đường cong lên.
05:19
Now you have to add another shape and viewpoint to the object model.
82
319689
4719
Bây giờ bạn lại có một hình dạng và góc nhìn khác đến vật thể khác.
05:24
But what if cats are hidden?
83
324408
1715
Nhưng nếu như con mèo bị ẩn đi thì sao?
05:27
What about these silly cats?
84
327143
2219
Thế còn những con mèo ngố này ?
05:31
Now you get my point.
85
331112
2417
Bây giờ bạn đã hiểu ý của tôi rồi đó.
05:33
Even something as simple as a household pet
86
333529
3367
Thậm chí thứ đơn giản như một vật nuôi trong nhà
05:36
can present an infinite number of variations to the object model,
87
336896
4504
cũng có thể mang một con số vô tận những thay đổi đối với một vật thể mẫu,
05:41
and that's just one object.
88
341400
2233
và nó mới chỉ là một vật thể mà thôi.
05:44
So about eight years ago,
89
344573
2492
Vì vậy mà khoảng 8 năm trước,
05:47
a very simple and profound observation changed my thinking.
90
347065
5030
một sự quan sát đơn giản và sâu sắc đã thay đổi suy nghĩ của tôi.
05:53
No one tells a child how to see,
91
353425
2685
Không ai nói cho một đứa trẻ biết chúng phải nhìn như thế nào,
05:56
especially in the early years.
92
356110
2261
đặc biệt là trong những năm đầu đời.
05:58
They learn this through real-world experiences and examples.
93
358371
5000
Chúng học hỏi qua những trãi nghiệm thế giới thực và qua những ví dụ.
06:03
If you consider a child's eyes
94
363371
2740
Nếu như bạn xem xét đôi mắt của một đứa trẻ
như một cặp máy quay phim sinh học
06:06
as a pair of biological cameras,
95
366111
2554
06:08
they take one picture about every 200 milliseconds,
96
368665
4180
chúng chụp một ảnh trong mỗi 200 mili giây
06:12
the average time an eye movement is made.
97
372845
3134
khoảng thời gian trung bình một cử động mắt được thực hiện.
06:15
So by age three, a child would have seen hundreds of millions of pictures
98
375979
5550
Vì vậy mà đến ba tuổi, một đứa trẻ có thể đã nhìn hàng triệu những bức ảnh
06:21
of the real world.
99
381529
1834
của thế giới thực.
06:23
That's a lot of training examples.
100
383363
2280
Đó là rất nhiều những ví dụ rèn luyện.
06:26
So instead of focusing solely on better and better algorithms,
101
386383
5989
Nên thay vì chú trọng vào mỗi việc làm cho thuật toán ngày một tốt hơn
06:32
my insight was to give the algorithms the kind of training data
102
392372
5272
ý định của tôi là cho những thuật toán một dạng rèn luyện dữ liệu
06:37
that a child was given through experiences
103
397644
3319
mà một đứa trẻ có được nhờ kinh nghiệm
06:40
in both quantity and quality.
104
400963
3878
về cả lượng cả chất.
06:44
Once we know this,
105
404841
1858
Một khi chúng tôi nhận ra điều này,
06:46
we knew we needed to collect a data set
106
406699
2971
chúng tôi biết mình cần phải thu thập một cơ sở dữ liệu
06:49
that has far more images than we have ever had before,
107
409670
4459
có nhiều hình ảnh hơn những gì mà chúng tôi đã từng có trước đây,
thậm chí là gấp hàng ngàn lần nữa,
06:54
perhaps thousands of times more,
108
414129
2577
06:56
and together with Professor Kai Li at Princeton University,
109
416706
4111
và cùng với giáo sư Kai Li ở đại học Princeton,
07:00
we launched the ImageNet project in 2007.
110
420817
4752
chúng tôi triển khai dự án ImageNet vào năm 2007.
07:05
Luckily, we didn't have to mount a camera on our head
111
425569
3838
May mắn thay, chúng tôi không cần phải gắn camera trên đâu
07:09
and wait for many years.
112
429407
1764
và đợi chờ nhiều năm nữa.
Chúng tôi lên mạng,
07:11
We went to the Internet,
113
431171
1463
07:12
the biggest treasure trove of pictures that humans have ever created.
114
432634
4436
nguồn tài nguyên ảnh lớn nhất mà con người đã từng tạo ra.
07:17
We downloaded nearly a billion images
115
437070
3041
Chúng tôi tải xuống gần một triệu bức
07:20
and used crowdsourcing technology like the Amazon Mechanical Turk platform
116
440111
5880
và sử dụng công nghệ nguồn đám đông như nền tảng Amazon Mechanical Tuck
07:25
to help us to label these images.
117
445991
2339
để giúp chúng tôi phân loại những hình ảnh này.
07:28
At its peak, ImageNet was one of the biggest employers
118
448330
4900
Vào đỉnh điểm, ImageNet là một trong số những ông chủ lớn nhất
07:33
of the Amazon Mechanical Turk workers:
119
453230
2996
của những nhân viên Amazon Mechanical Turk
07:36
together, almost 50,000 workers
120
456226
3854
cùng nhau, gần 50000 nhân viên
07:40
from 167 countries around the world
121
460080
4040
từ 167 quốc gia trên thế giới
giúp chúng tôi dọn dẹp, sắp xếp và phân loại
07:44
helped us to clean, sort and label
122
464120
3947
gần một triệu tấm ảnh ứng viên.
07:48
nearly a billion candidate images.
123
468067
3575
07:52
That was how much effort it took
124
472612
2653
Đó mới thấy phải mất rất nhiều nổ lực
07:55
to capture even a fraction of the imagery
125
475265
3900
để nắm bắt được thậm chí chỉ là một mảnh hình ảnh
của trí óc trẻ con trong những năm tháng phát triển đầu đời
07:59
a child's mind takes in in the early developmental years.
126
479165
4171
Trong nhận thức muộn màng, ý tưởng sử dụng dữ liệu lớn
08:04
In hindsight, this idea of using big data
127
484148
3902
để hướng dẫn một thuật toán vi tính có thể hiển nhiên vào lúc này,
08:08
to train computer algorithms may seem obvious now,
128
488050
4550
nhưng trở lại năm 2007, nó không hiển nhiên như vậy.
08:12
but back in 2007, it was not so obvious.
129
492600
4110
08:16
We were fairly alone on this journey for quite a while.
130
496710
3878
Chúng tôi gần như là đơn độc trên hành trình này trong một thời gian dài.
Một vài đồng nghiệp thân thiện khuyên tôi làm cái gì khác có lợi hơn cho chức vụ,
08:20
Some very friendly colleagues advised me to do something more useful for my tenure,
131
500588
5003
và chúng tôi liên tục phải xoay xở tìm nguồn tài trợ cho dự án.
08:25
and we were constantly struggling for research funding.
132
505591
4342
Một lần, tôi đùa với những học viên cao học của mình
08:29
Once, I even joked to my graduate students
133
509933
2485
08:32
that I would just reopen my dry cleaner's shop to fund ImageNet.
134
512418
4063
tôi sẽ mở lại shop giặt là để tài trợ cho ImageNet
Dù gì, thì đó là cách mà tôi trang trải cho những năm tháng đại học của mình.
08:36
After all, that's how I funded my college years.
135
516481
4761
Vì thế mà chúng tôi tiếp tục.
08:41
So we carried on.
136
521242
1856
Năm 2009, dự án ImageNet chuyển tải
08:43
In 2009, the ImageNet project delivered
137
523098
3715
08:46
a database of 15 million images
138
526813
4042
một cơ sở dữ liệu của 15 triệu tấm ảnh
08:50
across 22,000 classes of objects and things
139
530855
4805
trong 22000 lớp đối tượng và đồ vật
08:55
organized by everyday English words.
140
535660
3320
được tổ chức theo từng từ tiếng Anh thông dụng.
08:58
In both quantity and quality,
141
538980
2926
Về cả số lượng và chất lượng,
09:01
this was an unprecedented scale.
142
541906
2972
đây là một quy mô chưa từng có
09:04
As an example, in the case of cats,
143
544878
3461
Lấy ví dụ, trong trường hợp của mèo,
09:08
we have more than 62,000 cats
144
548339
2809
chúng tôi có hơn 62000 con mèo
09:11
of all kinds of looks and poses
145
551148
4110
đủ mọi loại hình dạng và kiểu dáng
09:15
and across all species of domestic and wild cats.
146
555258
5223
và trong tất cả những loài mèo nhà hay mèo hoang.
09:20
We were thrilled to have put together ImageNet,
147
560481
3344
Chúng tôi hứng khởi để cùng nhau xây dựng nên ImageNet,
09:23
and we wanted the whole research world to benefit from it,
148
563825
3738
và chúng tôi muốn cả thế giới nghiên cứu được hưởng lợi từ nó,
09:27
so in the TED fashion, we opened up the entire data set
149
567563
4041
vì vậy mà ở TED, chúng tôi mở toàn bộ hệ thống dữ liệu
09:31
to the worldwide research community for free.
150
571604
3592
cho cộng đồng nghiên cứu quốc tế
miễn phí
09:36
(Applause)
151
576636
4000
(vỗ tay)
09:41
Now that we have the data to nourish our computer brain,
152
581416
4538
Bây giờ chúng ta đã có dữ liệu để nuôi sống não bộ máy tính của chúng ta,
09:45
we're ready to come back to the algorithms themselves.
153
585954
3737
chúng ta đã sẵn sàng quay trở lại với những thuật toán .
09:49
As it turned out, the wealth of information provided by ImageNet
154
589691
5178
Vì hóa ra là, sự dồi dào của những nguồn thông tin bởi ImageNet
09:54
was a perfect match to a particular class of machine learning algorithms
155
594869
4806
là một sự kết hợp hoàn hảo cho việc học những thuật toán của máy tính
09:59
called convolutional neural network,
156
599675
2415
gọi là mạng lưới nơ ron đan chéo,
10:02
pioneered by Kunihiko Fukushima, Geoff Hinton, and Yann LeCun
157
602090
5248
tiên phong bởi Kunihiko Fukushima, Geoff Hinton, và Yann LeCun
10:07
back in the 1970s and '80s.
158
607338
3645
từ những năm 1970 và 1980
10:10
Just like the brain consists of billions of highly connected neurons,
159
610983
5619
Giống như não bộ, nó bao gồm hàng triệu những nơ ron kết nối chặt chẽ với nhau,
10:16
a basic operating unit in a neural network
160
616602
3854
một đơn vị cơ bản trong mạng lưới neron
10:20
is a neuron-like node.
161
620456
2415
là những nút giống như neron
10:22
It takes input from other nodes
162
622871
2554
Cần phải có dữ liệu đầu vào từ nút này
10:25
and sends output to others.
163
625425
2718
và gửi dữ liệu đầu ra cho nút khác.
10:28
Moreover, these hundreds of thousands or even millions of nodes
164
628143
4713
Hơn nữa, hàng trăm ngàn hoặc thậm chí hàng triệu nút
10:32
are organized in hierarchical layers,
165
632856
3227
được sắp xếp trong những lớp trật tự,
10:36
also similar to the brain.
166
636083
2554
cũng gần giống như não bộ.
10:38
In a typical neural network we use to train our object recognition model,
167
638637
4783
Trong mạng lưới điển hình chúng tôi dùng để huấn luyện những mẫu nhận diện vật thể
10:43
it has 24 million nodes,
168
643420
3181
có 24 triệu nút,
10:46
140 million parameters,
169
646601
3297
140 triệu thông số,
10:49
and 15 billion connections.
170
649898
2763
và 15 tỉ liên kết.
10:52
That's an enormous model.
171
652661
2415
Đó là một mẫu cực kỳ lớn.
10:55
Powered by the massive data from ImageNet
172
655076
3901
Hỗ trợ bởi dữ liệu khổng lồ từ ImageNet
10:58
and the modern CPUs and GPUs to train such a humongous model,
173
658977
5433
và những CPUs và GPUs hiện đại để huấn luyện cho một mẫu cực lớn.
11:04
the convolutional neural network
174
664410
2369
mạng lưới những nơ ron đan chéo
11:06
blossomed in a way that no one expected.
175
666779
3436
phát triển đến mức không ai có thể dự đoán được.
11:10
It became the winning architecture
176
670215
2508
Nó trở thành kiến trúc được dùng để
11:12
to generate exciting new results in object recognition.
177
672723
5340
điều hành những kết quả mới xuất hiện trong nhận diện vật thể.
11:18
This is a computer telling us
178
678063
2810
Đây là một chiếc máy tính nói với chúng ta rằng
11:20
this picture contains a cat
179
680873
2300
bức hình này bao gồm một con mèo
11:23
and where the cat is.
180
683173
1903
và nơi mà con mèo đang ở.
11:25
Of course there are more things than cats,
181
685076
2112
Dĩ nhiên là còn nhiều thứ hơn là con mèo,
11:27
so here's a computer algorithm telling us
182
687188
2438
nên đây là một thuật toán nói với chúng ta rằng
11:29
the picture contains a boy and a teddy bear;
183
689626
3274
bức hình này bao gồm một đứa trẻ và một con gấu teddy;
11:32
a dog, a person, and a small kite in the background;
184
692900
4366
một con chó, một người, và một con diều nhỏ ở phía sau;
11:37
or a picture of very busy things
185
697266
3135
hay một bức tranh của những thứ lộn xộn
11:40
like a man, a skateboard, railings, a lampost, and so on.
186
700401
4644
như một người, một tấm ván trượt, tay vịn, một cái đèn đường, vân vân.
11:45
Sometimes, when the computer is not so confident about what it sees,
187
705045
5293
Đôi lúc, khi chiếc máy vi tính không chắc về những gì mà nó thấy,
11:51
we have taught it to be smart enough
188
711498
2276
chúng tôi đã dạy nó trở nên thông minh đủ
11:53
to give us a safe answer instead of committing too much,
189
713774
3878
để cho chúng ta một câu trả lời an toàn thay vì phụ thuộc quá nhiều,
11:57
just like we would do,
190
717652
2811
giống như cách mà chúng ta sẽ làm,
12:00
but other times our computer algorithm is remarkable at telling us
191
720463
4666
nhưng những lần khác những thuật toán thật sự ấn tượng với chúng tôi khi nói ra
12:05
what exactly the objects are,
192
725129
2253
chính xác những đặc tính của đối tượng,
12:07
like the make, model, year of the cars.
193
727382
3436
như là xuất xứ, hiệu, năm sản xuất của những chiếc xe.
12:10
We applied this algorithm to millions of Google Street View images
194
730818
5386
Chúng tôi ứng dụng thuật toán này cho hàng triệu ảnh chụp đường phố trên Google
12:16
across hundreds of American cities,
195
736204
3135
qua hàng trăm thành phố của Mỹ,
12:19
and we have learned something really interesting:
196
739339
2926
và chúng tôi đã nhận ra nhiều thứ rất thú vị:
12:22
first, it confirmed our common wisdom
197
742265
3320
đầu tiên, nó xác nhận sự hiểu biết chung của chúng ta
12:25
that car prices correlate very well
198
745585
3290
giá cả của những chiếc xe rất liên quan
12:28
with household incomes.
199
748875
2345
với thu nhập của hộ gia đình.
12:31
But surprisingly, car prices also correlate well
200
751220
4527
Nhưng bất ngờ là, giá của xe cũng tương ứng với
12:35
with crime rates in cities,
201
755747
2300
mức độ tội phạm trong những thành phố ,
12:39
or voting patterns by zip codes.
202
759007
3963
hoặc tỉ lệ bầu phiếu theo mã vùng.
Đợi một chút, có phải là vậy không?
12:44
So wait a minute. Is that it?
203
764060
2206
12:46
Has the computer already matched or even surpassed human capabilities?
204
766266
5153
Phải chăng máy vi tính thực sự đã đạt được hay thậm chí vượt qua khả năng con người?
12:51
Not so fast.
205
771419
2138
Không nhanh vậy đâu.
12:53
So far, we have just taught the computer to see objects.
206
773557
4923
Cho tới nay, chúng ta mới chỉ dạy cho máy vi tính nhìn thấy những vật thể.
12:58
This is like a small child learning to utter a few nouns.
207
778480
4644
Cái này giống như một đứa trẻ học cách bật ra một vài danh từ.
13:03
It's an incredible accomplishment,
208
783124
2670
Đó là một thành tựu đáng kinh ngạc,
13:05
but it's only the first step.
209
785794
2460
nhưng nó mới chỉ là bước đầu tiên.
13:08
Soon, another developmental milestone will be hit,
210
788254
3762
Nhanh thôi, những cột mốc phát triển khác sẽ đạt được,
13:12
and children begin to communicate in sentences.
211
792016
3461
và trẻ em bắt đầu giao tiếp bằng những câu.
13:15
So instead of saying this is a cat in the picture,
212
795477
4224
Vì vậy thay vì nói đây là một con mèo trong bức tranh,
13:19
you already heard the little girl telling us this is a cat lying on a bed.
213
799701
5202
bạn thật sự đã nghe đứa trẻ nhỏ nói rằng đây là một con mèo nằm trên một cái giường
13:24
So to teach a computer to see a picture and generate sentences,
214
804903
5595
Vì thế mà dạy một chiếc máy tính nhìn một ảnh và cấu thành những câu nói,
13:30
the marriage between big data and machine learning algorithm
215
810498
3948
sự liên kết giữa những dữ liệu lớn và thuật toán
13:34
has to take another step.
216
814446
2275
phải tiếp tục những bước tiếp theo.
13:36
Now, the computer has to learn from both pictures
217
816721
4156
Bây giờ, chiếc máy tính phải học cả những hình ảnh
13:40
as well as natural language sentences
218
820877
2856
lẫn ngôn ngữ câu tự nhiên
13:43
generated by humans.
219
823733
3322
được tạo lập bởi con người.
13:47
Just like the brain integrates vision and language,
220
827055
3853
Giống như não bộ kết hợp giữa cái nhìn và ngôn ngữ,
13:50
we developed a model that connects parts of visual things
221
830908
5201
chúng tôi phát triển một hình mẫu liên kết những phần của những vật thể
giống như những mẩu thông tin có thể trông thấy được
13:56
like visual snippets
222
836109
1904
13:58
with words and phrases in sentences.
223
838013
4203
với những từ ngữ và cụm từ trong câu.
14:02
About four months ago,
224
842216
2763
Khoảng 4 tháng trước,
14:04
we finally tied all this together
225
844979
2647
chúng tôi cuối cùng cũng liên kết chúng lại với nhau
14:07
and produced one of the first computer vision models
226
847626
3784
và tạo ra một trong những hình mẫu máy tính có thị giác đầu tiên
14:11
that is capable of generating a human-like sentence
227
851410
3994
có khả năng tạo ra một câu giống như con người
14:15
when it sees a picture for the first time.
228
855404
3506
khi nó thấy một bức ảnh lần đầu tiên.
14:18
Now, I'm ready to show you what the computer says
229
858910
4644
Bây giờ, tôi sẵn sàng cho bạn thấy điều mà máy vi tính nói
14:23
when it sees the picture
230
863554
1975
khi nó trông thấy bức ảnh
14:25
that the little girl saw at the beginning of this talk.
231
865529
3830
mà cô gái nhỏ đã thấy ở phần mở đầu của bài nói này.
(Video) Máy vi tính: Một người đàn ông đang đứng cạnh một con voi.
14:31
(Video) Computer: A man is standing next to an elephant.
232
871519
3344
14:36
A large airplane sitting on top of an airport runway.
233
876393
3634
Một máy bay lớn đậu phía trên một đường băng sân bay.
14:41
FFL: Of course, we're still working hard to improve our algorithms,
234
881057
4212
FFL: Dĩ nhiên, chúng tôi vẫn đang làm việc chăm chỉ để phát triển những thuật toán,
14:45
and it still has a lot to learn.
235
885269
2596
và vẫn còn rất nhiều thứ để học
14:47
(Applause)
236
887865
2291
(vỗ tay)
14:51
And the computer still makes mistakes.
237
891556
3321
Và máy tính vẫn còn mắc nhiều lỗi.
14:54
(Video) Computer: A cat lying on a bed in a blanket.
238
894877
3391
(Video) Máy tinh: một con mèo đang nằm trong chăn trên một cái giường
14:58
FFL: So of course, when it sees too many cats,
239
898268
2553
FFL: Nên đương nhiên, khi nó nhìn thấy quá nhiều mèo
15:00
it thinks everything might look like a cat.
240
900821
2926
nó sẽ nghĩ mọi thứ có thể nhìn giống như một con mèo.
15:05
(Video) Computer: A young boy is holding a baseball bat.
241
905317
2864
Máy tính: Một chàng trai trẻ đang cầm một cái vợt bóng chày
15:08
(Laughter)
242
908181
1765
(cười lớn)
15:09
FFL: Or, if it hasn't seen a toothbrush, it confuses it with a baseball bat.
243
909946
4583
FFL: Nếu nó chưa bao giờ thấy bàn chải, nó sẽ nhầm lẫn với một cái vợt bóng chày
15:15
(Video) Computer: A man riding a horse down a street next to a building.
244
915309
3434
Máy tính: Người đàn ông đang cưỡi ngựa xuống một con đường gần một tòa nhà.
15:18
(Laughter)
245
918743
2023
(cười lớn)
15:20
FFL: We haven't taught Art 101 to the computers.
246
920766
3552
FFL: Chúng tôi chưa dạy môn nghệ thuật cơ bản cho máy tính
15:25
(Video) Computer: A zebra standing in a field of grass.
247
925768
2884
Máy tính: Một con ngựa vằn đang đứng trên một bãi cỏ.
15:28
FFL: And it hasn't learned to appreciate the stunning beauty of nature
248
928652
3367
FFL: Và nó chưa được học để trân trọng vẻ đẹp tuyệt mỹ của thiên nhiên
15:32
like you and I do.
249
932019
2438
như tôi và bạn.
15:34
So it has been a long journey.
250
934457
2832
Vì thế nó là một hành trình dài.
15:37
To get from age zero to three was hard.
251
937289
4226
Để đi từ 0 tuổi đến 3 tuổi là đã khó.
15:41
The real challenge is to go from three to 13 and far beyond.
252
941515
5596
Thử thách thực sự là đi từ 3 đến 13 tuổi và còn xa hơn nữa.
15:47
Let me remind you with this picture of the boy and the cake again.
253
947111
4365
Để tôi nhắc cho bạn bức ảnh này về một bé trai và chiếc bánh một lần nữa.
15:51
So far, we have taught the computer to see objects
254
951476
4064
Trước đó, chúng ta đã dạy máy tính nhìn thấy những vật thể
15:55
or even tell us a simple story when seeing a picture.
255
955540
4458
hoặc kể một câu chuyện đơn giản khi nhìn thấy một bức ảnh.
15:59
(Video) Computer: A person sitting at a table with a cake.
256
959998
3576
Máy tính: Một người ngồi trên một cái bàn với một cái bánh.
16:03
FFL: But there's so much more to this picture
257
963574
2630
FFL: Nhưng còn rất nhiều thứ về bức ảnh này
16:06
than just a person and a cake.
258
966204
2270
hơn là chỉ một người và một cái bánh.
16:08
What the computer doesn't see is that this is a special Italian cake
259
968474
4467
Điều mà máy tính không thấy được đây là một chiếc bánh kiếu Ý rất đặc biệt
16:12
that's only served during Easter time.
260
972941
3217
chỉ ăn vào dịp Phục Sinh.
16:16
The boy is wearing his favorite t-shirt
261
976158
3205
Thằng bé đang mặc chiếc áo thun yêu thích của nó
16:19
given to him as a gift by his father after a trip to Sydney,
262
979363
3970
trao cho cậu như một món quà của bố cậu sau một chuyến đi đến Sydney.
16:23
and you and I can all tell how happy he is
263
983333
3808
và bạn và tôi có thể thấy được cậu bé trông vui đến thế nào
16:27
and what's exactly on his mind at that moment.
264
987141
3203
và điều thực sự trong tâm trí của nó vào lúc đó.
16:31
This is my son Leo.
265
991214
3125
Đây là con trai tôi Leo.
16:34
On my quest for visual intelligence,
266
994339
2624
Trong khi nghiên cứu về trí thông minh hình ảnh,
16:36
I think of Leo constantly
267
996963
2391
tôi không ngừng nghĩ về Leo
16:39
and the future world he will live in.
268
999354
2903
và tương lai mà nó sẽ sống.
16:42
When machines can see,
269
1002257
2021
Khi những chiếc máy có thể nhìn,
16:44
doctors and nurses will have extra pairs of tireless eyes
270
1004278
4712
bác sĩ và y tá sẽ có thêm những đôi mắt không mệt mỏi
16:48
to help them to diagnose and take care of patients.
271
1008990
4092
để giúp họ chẩn đoán và chăm sóc bệnh nhân.
16:53
Cars will run smarter and safer on the road.
272
1013082
4383
Những chiếc xe sẽ chạy nhanh hơn và an toàn hơn trên đường.
16:57
Robots, not just humans,
273
1017465
2694
Robots, không chỉ con người,
17:00
will help us to brave the disaster zones to save the trapped and wounded.
274
1020159
4849
giúp chúng ta đến với khu vực bị thiên tai để cứu những người mắc kẹt và thương vong.
17:05
We will discover new species, better materials,
275
1025798
3796
Và chúng ta sẽ khám phá ra những loài mới, vật liệu tốt hơn,
17:09
and explore unseen frontiers with the help of the machines.
276
1029594
4509
và khám phá những biên giới chưa tưng thấy với sự giúp đỡ của máy móc.
17:15
Little by little, we're giving sight to the machines.
277
1035113
4167
Từng chút từng chút một, chúng ta cho máy móc thị giác.
17:19
First, we teach them to see.
278
1039280
2798
Đầu tiên, chúng ta dạy chúng cách nhìn.
17:22
Then, they help us to see better.
279
1042078
2763
Sau đó, chúng sẽ giúp chúng ta nhìn rõ hơn.
17:24
For the first time, human eyes won't be the only ones
280
1044841
4165
Lần đầu tiên, đôi mắt của con người không còn là thứ duy nhất
17:29
pondering and exploring our world.
281
1049006
2934
nghĩ ngợi và khám phá thế giới này.
17:31
We will not only use the machines for their intelligence,
282
1051940
3460
Chúng ta sẽ không chỉ sử dụng máy móc nhờ sự thông minh của chúng,
17:35
we will also collaborate with them in ways that we cannot even imagine.
283
1055400
6179
chúng ta còn có thể hợp tác với chúng theo những cách không thể tưởng tượng nỗi.
17:41
This is my quest:
284
1061579
2161
Đây là mong muốn của tôi:
17:43
to give computers visual intelligence
285
1063740
2712
cho máy tính sự thông minh thị giác
17:46
and to create a better future for Leo and for the world.
286
1066452
5131
và tạo ra một tương lai tốt hơn cho Leo và cho thế giới.
17:51
Thank you.
287
1071583
1811
Cám ơn.
17:53
(Applause)
288
1073394
3785
(vỗ tay)
Về trang web này

Trang web này sẽ giới thiệu cho bạn những video YouTube hữu ích cho việc học tiếng Anh. Bạn sẽ thấy các bài học tiếng Anh được giảng dạy bởi các giáo viên hàng đầu từ khắp nơi trên thế giới. Nhấp đúp vào phụ đề tiếng Anh hiển thị trên mỗi trang video để phát video từ đó. Phụ đề cuộn đồng bộ với phát lại video. Nếu bạn có bất kỳ nhận xét hoặc yêu cầu nào, vui lòng liên hệ với chúng tôi bằng biểu mẫu liên hệ này.

https://forms.gle/WvT1wiN1qDtmnspy7