3 principles for creating safer AI | Stuart Russell

142,837 views ・ 2017-06-06

TED

Vui lòng nhấp đúp vào phụ đề tiếng Anh bên dưới để phát video.

Translator: Tân Nguyễn Reviewer: Ngoc Bui

Đây là Lee Sedol.

00:12

This is Lee Sedol.

12532

1552

00:14

Lee Sedol is one of the world's greatest Go players,

14108

3997

Lee Sedol là một trong những kì thủ cờ vây giỏi nhất thế giới,

cậu ấy đang có thứ mà các bạn của tôi ở thung lũng Silicon gọi là

00:18

and he's having what my friends in Silicon Valley call

18129

2885

00:21

a "Holy Cow" moment --

21038

1510

khoảnh khắc "Ôi Chúa ơi" --

00:22

(Laughter)

22572

1073

(Cười)

00:23

a moment where we realize

23669

2188

khoảnh khắc khi chúng ta nhận ra rằng

00:25

that AI is actually progressing a lot faster than we expected.

25881

3296

AI (trí tuệ nhân tạo) đã xử lí nhanh hơn nhiều so với chúng ta mong đợi.

00:29

So humans have lost on the Go board. What about the real world?

29974

3047

Vậy con người đã thua trên bàn cờ vây. Thế còn trong thế giới thực?

00:33

Well, the real world is much bigger,

33045

2100

Thế giới thực lớn hơn,

00:35

much more complicated than the Go board.

35169

2249

phức tạp hơn nhiều so với cờ vây.

00:37

It's a lot less visible,

37442

1819

Nó không dễ nhận thấy,

00:39

but it's still a decision problem.

39285

2038

nhưng nó vẫn là một vấn đề mang tính chọn lựa.

00:42

And if we think about some of the technologies

42768

2321

Và nếu chúng ta nghĩ về một số công nghệ

00:45

that are coming down the pike ...

45113

1749

đang được chú ý đến...

00:47

Noriko [Arai] mentioned that reading is not yet happening in machines,

47558

4335

Noriko [Arai] từng khẳng định máy móc vẫn chưa thể đọc,

00:51

at least with understanding.

51917

1500

ít nhất là với sự thấu hiểu.

00:53

But that will happen,

53441

1536

Nhưng điều đó sẽ xảy ra,

00:55

and when that happens,

55001

1771

và khi điều đó xảy ra,

00:56

very soon afterwards,

56796

1187

rất nhanh sau đó,

00:58

machines will have read everything that the human race has ever written.

58007

4572

máy móc sẽ đọc hết những thứ mà loài người đã viết.

01:03

And that will enable machines,

63670

2030

Và điều đấy sẽ cho phép máy móc,

01:05

along with the ability to look further ahead than humans can,

65724

2920

cùng với khả năng dự đoán xa hơn con người,

01:08

as we've already seen in Go,

68668

1680

như chúng ta đã thấy trong cờ vây,

01:10

if they also have access to more information,

70372

2164

nếu chúng cũng có thể tiếp cận nhiều thông tin hơn,

01:12

they'll be able to make better decisions in the real world than we can.

72560

4268

chúng sẽ có thể đưa ra những quyết định tốt hơn chúng ta trong thế giới thực.

01:18

So is that a good thing?

78612

1606

Vậy đó có phải là điều tốt?

01:21

Well, I hope so.

81718

2232

Tôi hi vọng vậy.

01:26

Our entire civilization, everything that we value,

86514

3255

Toàn bộ nền văn minh của loài người, tất cả những thứ chúng ta coi trọng,

01:29

is based on our intelligence.

89793

2068

đều dựa trên trí tuệ của chúng ta.

01:31

And if we had access to a lot more intelligence,

91885

3694

Và nếu chúng ta có thể sở hữu nhiều trí tuệ hơn,

01:35

then there's really no limit to what the human race can do.

95603

3302

những thứ con người có thể làm sẽ không có giới hạn.

01:40

And I think this could be, as some people have described it,

100485

3325

Và tôi nghĩ đây có thể là, như nhiều người đã miêu tả nó,

01:43

the biggest event in human history.

103834

2016

sự kiện lớn nhất trong lịch sử nhân loại.

[Chào mừng tới UTOPIA Hãy tận hưởng hành trình của bạn]

01:48

So why are people saying things like this,

108485

2829

Vậy tại sao mọi người lại nói những điều như thế này,

01:51

that AI might spell the end of the human race?

111338

2876

AI có thể là sự chấm dứt của loài người?

01:55

Is this a new thing?

115258

1659

Đây có phải là một điều mới mẻ?

01:56

Is it just Elon Musk and Bill Gates and Stephen Hawking?

116941

4110

Phải chăng chỉ có Elon Musk, Bill Gates và Stephen Hawking?

02:01

Actually, no. This idea has been around for a while.

121773

3262

Thực ra là không.

Ý tưởng này đã có trước đây.

02:05

Here's a quotation:

125059

1962

Đây là một trích dẫn:

02:07

"Even if we could keep the machines in a subservient position,

127045

4350

"Ngay cả khi chúng ta có thể giữ máy móc như một công cụ,

02:11

for instance, by turning off the power at strategic moments" --

131419

2984

chẳng hạn như, bằng cách tắt nguồn khi chúng ta muốn"--

02:14

and I'll come back to that "turning off the power" idea later on --

134427

3237

và tôi sẽ quay lại với khái niệm "tắt nguồn" sau --

02:17

"we should, as a species, feel greatly humbled."

137688

2804

chúng ta vẫn nên cảm thấy khiêm tốn hơn.

02:21

So who said this? This is Alan Turing in 1951.

141997

3448

Vậy ai đã nói điều này?

Chính là Alan Turing vào năm 1951.

Alan Turing, như bạn đã biết, là cha đẻ của khoa học máy tính,

02:26

Alan Turing, as you know, is the father of computer science

146120

2763

02:28

and in many ways, the father of AI as well.

148907

3048

và theo nhiều cách, ông cũng là cha đẻ của AI.

02:33

So if we think about this problem,

153059

1882

Nếu chúng ta nghĩ về vấn đề này,

02:34

the problem of creating something more intelligent than your own species,

154965

3787

tạo nên một loài thông minh hơn loài của chính bạn,

02:38

we might call this "the gorilla problem,"

158776

2622

có thể gọi nó là "vấn đề gorilla,"

02:42

because gorillas' ancestors did this a few million years ago,

162165

3750

bởi vì tổ tiên gorilla đã làm việc này từ hàng triệu năm trước,

02:45

and now we can ask the gorillas:

165939

1745

và bây giờ chúng ta có thể hỏi chúng:

02:48

Was this a good idea?

168572

1160

Đây có phải là một ý tưởng hay?

02:49

So here they are having a meeting to discuss whether it was a good idea,

169756

3530

Và chúng đang có một buổi họp để thảo luận xem đây có phải là một ý tưởng hay,

02:53

and after a little while, they conclude, no,

173310

3346

và sau một khoảng thời gian, chúng kết luận: Không,

02:56

this was a terrible idea.

176680

1345

đó là một ý tưởng tồi tệ.

02:58

Our species is in dire straits.

178049

1782

Chúng ta đang ở trong hoàn cảnh rất khó khăn.

03:00

In fact, you can see the existential sadness in their eyes.

180358

4263

Thậm chí, bạn có thể nhìn thấy nỗi buồn hiện hữu trong mắt chúng.

03:04

(Laughter)

184645

1640

(Cười)

Vậy cảm giác bất an rằng

03:06

So this queasy feeling that making something smarter than your own species

186309

4840

tạo ra một loài thông minh hơn chính loài của chúng ta

03:11

is maybe not a good idea --

191173

2365

có thể không phải là một ý kiến hay --

03:14

what can we do about that?

194308

1491

Chúng ta có thể làm gì nó?

03:15

Well, really nothing, except stop doing AI,

195823

4767

Thực sự là không gì cả,

trừ việc ngừng tạo ra AI,

03:20

and because of all the benefits that I mentioned

200614

2510

và bởi vì những lợi ích mà tôi vừa kể ra

cũng như tôi là một nhà nghiên cứu về AI,

03:23

and because I'm an AI researcher,

203148

1716

03:24

I'm not having that.

204888

1791

tôi sẽ không làm như thế.

03:27

I actually want to be able to keep doing AI.

207103

2468

Tôi vẫn muốn tiếp tục làm về AI.

03:30

So we actually need to nail down the problem a bit more.

210435

2678

Chúng ta cần phải cụ thể hóa vấn đề hơn một chút.

03:33

What exactly is the problem?

213137

1371

Chính xác thì đâu mới là vấn đề?

03:34

Why is better AI possibly a catastrophe?

214532

3246

Vì sao AI tốt hơn lại có thể đem lại nhiều tai họa?

03:39

So here's another quotation:

219218

1498

Đây là một câu trích dẫn khác:

03:41

"We had better be quite sure that the purpose put into the machine

221755

3335

"Chúng ta nên đảm bảo rằng mục đích mà chúng ta đưa vào máy móc

03:45

is the purpose which we really desire."

225114

2298

là mục đích mà chúng ta thực sự mong muốn."

03:48

This was said by Norbert Wiener in 1960,

228102

3498

Đây là câu nói của Norbert Wiener năm 1960,

03:51

shortly after he watched one of the very early learning systems

231624

4002

không lâu sau khi ông ấy được xem

một trong những hệ thống học tập thời đầu

03:55

learn to play checkers better than its creator.

235650

2583

học cách chơi cờ Đam giỏi hơn người tạo ra nó.

04:00

But this could equally have been said

240422

2683

Nhưng điều tương tự cũng đã được nói

04:03

by King Midas.

243129

1167

bởi vua Midas.

04:04

King Midas said, "I want everything I touch to turn to gold,"

244903

3134

Vua Midas đã từng bảo:

"Tôi muốn mọi thứ tôi chạm vào trở thành vàng."

04:08

and he got exactly what he asked for.

248061

2473

và ông ấy đã có chính xác những gì ông muốn.

04:10

That was the purpose that he put into the machine,

250558

2751

Đấy là mục đích mà ông đã đưa vào máy móc,

04:13

so to speak,

253333

1450

như đã nói,

04:14

and then his food and his drink and his relatives turned to gold

254807

3444

sau đó thì đồ ăn, thức uống và người thân của ông đều biến thành vàng

04:18

and he died in misery and starvation.

258275

2281

và ông đã qua đời trong đau khổ và đói kém.

04:22

So we'll call this "the King Midas problem"

262264

2341

Vậy nên chúng ta gọi đây là "vấn đề Vua Midas"

04:24

of stating an objective which is not, in fact,

264629

3305

khi chúng ta đưa ra một mục tiêu không trùng khớp với thứ chúng ta muốn.

04:27

truly aligned with what we want.

267958

2413

Hiện tại, chúng ta gọi đó là "vấn đề trùng khớp giá trị."

04:30

In modern terms, we call this "the value alignment problem."

270395

3253

04:36

Putting in the wrong objective is not the only part of the problem.

276867

3485

Tuy nhiên xác định sai mục tiêu không phải là vấn đề duy nhất.

04:40

There's another part.

280376

1152

Còn một phần nữa.

04:41

If you put an objective into a machine,

281980

1943

Nếu chúng ta đưa mục đích vào một cỗ máy,

04:43

even something as simple as, "Fetch the coffee,"

283947

2448

kể cả một thứ đơn giản như "đi lấy cà phê,"

04:47

the machine says to itself,

287728

1841

cỗ máy tự nói với chính nó,

04:50

"Well, how might I fail to fetch the coffee?

290553

2623

"Ừm, điều gì có thể làm việc đi lấy cà phê thất bại?"

04:53

Someone might switch me off.

293200

1580

Như ai đó có thể sẽ tắt tôi đi.

04:55

OK, I have to take steps to prevent that.

295465

2387

Ok, tôi phải ngăn chặn việc đó.

04:57

I will disable my 'off' switch.

297876

1906

Tôi sẽ vô hiệu hóa nút 'tắt' của tôi.

05:00

I will do anything to defend myself against interference

300354

2959

Tôi sẽ làm mọi thứ để bảo vệ bản thân

khỏi các thứ cản trở tôi đạt được mục đích đã được giao."

05:03

with this objective that I have been given."

303337

2629

05:05

So this single-minded pursuit

305990

2012

Vậy sự chuyên tâm theo đuổi này

theo một cách rất phòng ngự đối với mục tiêu mà, thật ra,

05:09

in a very defensive mode of an objective that is, in fact,

309033

2945

không tương ứng với mục đích chính của loài người --

05:12

not aligned with the true objectives of the human race --

100

312002

2814

05:15

that's the problem that we face.

101

315942

1862

đó là vấn đề mà chúng ta phải đối mặt.

05:18

And in fact, that's the high-value takeaway from this talk.

102

318827

4767

Và thực ra, đây là bài học đáng giá được rút ra từ bài nói này.

05:23

If you want to remember one thing,

103

323618

2055

Nếu bạn muốn nhớ một điều,

05:25

it's that you can't fetch the coffee if you're dead.

104

325697

2675

đó là bạn sẽ không thể lấy được cà phê nếu bạn chết.

05:28

(Laughter)

105

328396

1061

(Cười)

05:29

It's very simple. Just remember that. Repeat it to yourself three times a day.

106

329481

3829

Nó rất đơn giản, hãy nhớ nó.

Nhắc lại cho bản thân nghe 3 lần mỗi ngày.

05:33

(Laughter)

107

333334

1821

(Cười)

05:35

And in fact, this is exactly the plot

108

335179

2754

Và thực ra, đây chính là nội dung

05:37

of "2001: [A Space Odyssey]"

109

337957

2648

trong phim "2001: [A Space Odyssey]"

HAL có một mục tiêu, một nhiệm vụ,

05:41

HAL has an objective, a mission,

110

341046

2090

05:43

which is not aligned with the objectives of the humans,

111

343160

3732

không trùng với mục tiêu của loài người,

05:46

and that leads to this conflict.

112

346916

1810

và nó dẫn tới sự mâu thuẫn này.

05:49

Now fortunately, HAL is not superintelligent.

113

349314

2969

Nhưng may mắn là Hal không phải một cỗ máy siêu trí tuệ.

05:52

He's pretty smart, but eventually Dave outwits him

114

352307

3587

Nó khá thông minh,

nhưng cuối cùng Dave đã khuất phục được

05:55

and manages to switch him off.

115

355918

1849

và đã tắt nguồn nó thành công.

06:01

But we might not be so lucky.

116

361648

1619

Nhưng có thể chúng ta sẽ không may mắn như thế.

[Xin lỗi Dave. Tôi e rằng tôi không thể làm điều đó được.]

Vậy chúng ta sẽ phải làm gì?

06:08

So what are we going to do?

117

368013

1592

[AI hợp tác được với con người]

06:12

I'm trying to redefine AI

118

372191

2601

Tôi đang cố định nghĩa lại về AI

06:14

to get away from this classical notion

119

374816

2061

để thoát khỏi định nghĩa truyền thống

06:16

of machines that intelligently pursue objectives.

120

376901

4567

là máy móc mà theo đuổi mục tiêu một cách thông minh.

06:22

There are three principles involved.

121

382532

1798

Nó bao gồm ba nguyên tắc.

Thứ nhất,

06:24

The first one is a principle of altruism, if you like,

122

384354

3289

đó là nguyên tắc về lòng vị tha, nếu bạn thích,

06:27

that the robot's only objective

123

387667

3262

mục tiêu duy nhất của robot là

06:30

is to maximize the realization of human objectives,

124

390953

4246

hiện thực hóa tối đa mục tiêu của con người,

06:35

of human values.

125

395223

1390

các giá trị của con người.

06:36

And by values here I don't mean touchy-feely, goody-goody values.

126

396637

3330

Và giá trị ở đây tôi muốn nói không phải sự nhạy cảm hay đạo đức giả.

06:39

I just mean whatever it is that the human would prefer

127

399991

3787

Ý tôi là bất kể thứ gì mà con người muốn cuộc sống của họ trở nên giống thế.

06:43

their life to be like.

128

403802

1343

06:47

And so this actually violates Asimov's law

129

407184

2309

Và thực ra thì điều này đã vi phạm luật của Asimov

06:49

that the robot has to protect its own existence.

130

409517

2329

đó là robot phải tự bảo vệ sự tồn tại của nó.

06:51

It has no interest in preserving its existence whatsoever.

131

411870

3723

Nó không hứng thú duy trì sự tồn tại của mình bất kể thế nào.

06:57

The second law is a law of humility, if you like.

132

417240

3768

Luật thứ hai đó là luật về sự khiêm tốn, nếu bạn thích.

07:01

And this turns out to be really important to make robots safe.

133

421794

3743

Và điều này thật ra rất quan trọng để robot trở nên an toàn.

07:05

It says that the robot does not know

134

425561

3142

Nó nói rằng robot không hề biết

07:08

what those human values are,

135

428727

2028

những giá trị của con người là gì,

07:10

so it has to maximize them, but it doesn't know what they are.

136

430779

3178

nên nó phải tối ưu hóa chúng, nhưng không biết chúng là gì.

07:15

And that avoids this problem of single-minded pursuit

137

435074

2626

Do đó tránh khỏi rắc rối từ sự chuyên tâm theo đuổi mục đích.

07:17

of an objective.

138

437724

1212

07:18

This uncertainty turns out to be crucial.

139

438960

2172

Sự không chắc chắn này hóa ra lại rất quan trọng.

07:21

Now, in order to be useful to us,

140

441546

1639

Bây giờ, để trở nên có ích cho chúng ta,

07:23

it has to have some idea of what we want.

141

443209

2731

nó phải có một chút ý tưởng về thứ mà chúng ta muốn.

07:27

It obtains that information primarily by observation of human choices,

142

447043

5427

Nó thu nhận các thông tin này chủ yếu bằng việc quan sát con người lựa chọn,

07:32

so our own choices reveal information

143

452494

2801

vậy lựa chọn của chúng ta sẽ hé lộ thông tin

07:35

about what it is that we prefer our lives to be like.

144

455319

3300

về những thứ mà chúng ta muốn cuộc sống của mình trở nên như vậy.

07:40

So those are the three principles.

145

460452

1683

Vậy đó là ba nguyên tắc.

Hãy xem ta áp dụng chúng vào câu hỏi này như thế nào:

07:42

Let's see how that applies to this question of:

146

462159

2318

07:44

"Can you switch the machine off?" as Turing suggested.

147

464501

2789

"Bạn có thể tắt nguồn chiếc máy không?" như Turing đã đưa ra.

07:48

So here's a PR2 robot.

148

468893

2120

[Vấn đề tắt nguồn]

Đây là robot PR2.

Một cái ở phòng nghiên cứu chúng tôi có,

07:51

This is one that we have in our lab,

149

471037

1821

07:52

and it has a big red "off" switch right on the back.

150

472882

2903

và nó có một nút "tắt" lớn đỏ ở sau lưng.

07:56

The question is: Is it going to let you switch it off?

151

476361

2615

Câu hỏi là: Nó có để cho bạn tắt nó đi không?

Giả sử ta làm theo cách truyền thống,

07:59

If we do it the classical way,

152

479000

1465

08:00

we give it the objective of, "Fetch the coffee, I must fetch the coffee,

153

480489

3482

đưa cho nó mục tiêu là "Đi lấy cà phê",

"Tôi phải đi lấy cà phê",

08:03

I can't fetch the coffee if I'm dead,"

154

483995

2580

"Tôi không thể lấy cà phê nếu tôi chết",

08:06

so obviously the PR2 has been listening to my talk,

155

486599

3341

vậy rõ ràng PR2 đã nghe bài nói của tôi,

08:09

and so it says, therefore, "I must disable my 'off' switch,

156

489964

3753

và do đó nó nói: "Tôi phải vô hiệu hóa nút "tắt" của mình,

08:14

and probably taser all the other people in Starbucks

157

494796

2694

và có lẽ sốc điện tất cả những người trong Starbucks,

08:17

who might interfere with me."

158

497514

1560

những người có thể cản trở tôi."

08:19

(Laughter)

159

499098

2062

(Cười)

Vậy điều này có vẻ không thể tránh khỏi, đúng không?

08:21

So this seems to be inevitable, right?

160

501184

2153

08:23

This kind of failure mode seems to be inevitable,

161

503361

2398

Sự thất bại như thế này có vẻ không thể tránh được,

08:25

and it follows from having a concrete, definite objective.

162

505783

3543

và nó là kết quả của việc có một mục tiêu rõ ràng.

08:30

So what happens if the machine is uncertain about the objective?

163

510632

3144

Vậy sẽ thế nào nếu chiếc máy không chắc chắn với mục tiêu của mình?

08:33

Well, it reasons in a different way.

164

513800

2127

Nó sẽ lý luận theo một cách khác.

08:35

It says, "OK, the human might switch me off,

165

515951

2424

Nó nghĩ: "Chà, con người có thể sẽ tắt mình mất,

08:38

but only if I'm doing something wrong.

166

518964

1866

nhưng chỉ khi mình làm sai gì đó.

08:41

Well, I don't really know what wrong is,

167

521567

2475

Mình thực sự không biết thế nào là "sai",

nhưng mình biết là mình không muốn làm điều đó."

08:44

but I know that I don't want to do it."

168

524066

2044

Và đây là lúc áp dụng luật thứ nhất và thứ hai.

08:46

So that's the first and second principles right there.

169

526134

3010

08:49

"So I should let the human switch me off."

170

529168

3359

"Do đó mình nên để con người tắt mình đi."

08:53

And in fact you can calculate the incentive that the robot has

171

533541

3956

Và thực tế bạn có thể tính toán động lực

mà robot phải để con người tắt nó,

08:57

to allow the human to switch it off,

172

537521

2493

09:00

and it's directly tied to the degree

173

540038

1914

và nó liên kết trực tiếp

09:01

of uncertainty about the underlying objective.

174

541976

2746

với mức độ không chắc chắn về các mục tiêu tiềm ẩn.

09:05

And then when the machine is switched off,

175

545797

2949

Và khi mà chiếc máy đã được tắt đi,

09:08

that third principle comes into play.

176

548770

1805

thì đến lượt của luật thứ ba.

09:10

It learns something about the objectives it should be pursuing,

177

550599

3062

Nó sẽ học được gì đó về mục tiêu mà nó cần theo đuổi,

09:13

because it learns that what it did wasn't right.

178

553685

2533

vì nó học được những việc mình đã làm là không đúng.

09:16

In fact, we can, with suitable use of Greek symbols,

179

556242

3570

Thực tế, nếu sử dụng các kí hiệu La Mã thích hợp,

09:19

as mathematicians usually do,

180

559836

2131

như các nhà toán học hay làm,

09:21

we can actually prove a theorem

181

561991

1984

chúng ta thực sự có thể chứng minh mệnh đề

09:23

that says that such a robot is provably beneficial to the human.

182

563999

3553

nói rằng robot này quả là có ích cho con người.

09:27

You are provably better off with a machine that's designed in this way

183

567576

3803

Bạn có thể cải thiện tốt hơn với chiếc máy được thiết kế như thế này

09:31

than without it.

184

571403

1246

so với không có nó.

09:33

So this is a very simple example, but this is the first step

185

573057

2906

Vậy đây là một ví dụ rất đơn giản, nhưng đó là bước đầu tiên

09:35

in what we're trying to do with human-compatible AI.

186

575987

3903

trong việc chúng tôi cố gắng làm ra AI hòa hợp với con người.

09:42

Now, this third principle,

187

582477

3257

Bây giờ, luật thứ ba này,

09:45

I think is the one that you're probably scratching your head over.

188

585758

3112

tôi nghĩ nó là điều khiến bạn phải vò đầu bứt tai suốt.

09:48

You're probably thinking, "Well, you know, I behave badly.

189

588894

3239

Có thể bạn đang nghĩ:

"Chà, bạn biết đấy, tôi cư xử khá tệ.

09:52

I don't want my robot to behave like me.

190

592157

2929

Tôi không muốn robot của mình cư xử giống tôi.

09:55

I sneak down in the middle of the night and take stuff from the fridge.

191

595110

3434

Tôi mò mẫm vào giữa đêm và lén lút lấy đồ trong tủ lạnh.

09:58

I do this and that."

192

598568

1168

Tôi làm điều này, điều nọ."

09:59

There's all kinds of things you don't want the robot doing.

193

599760

2797

Có cả tá thứ mà bạn không muốn robot làm theo.

10:02

But in fact, it doesn't quite work that way.

194

602581

2071

Nhưng thực tế, nó không hoạt động như thế.

10:04

Just because you behave badly

195

604676

2155

Chỉ vì bạn cư xử tồi tệ

10:06

doesn't mean the robot is going to copy your behavior.

196

606855

2623

không có nghĩa là robot sẽ bắt chước hành vi của bạn.

10:09

It's going to understand your motivations and maybe help you resist them,

197

609502

3910

Nó sẽ hiểu động lực của bạn và có thể giúp bạn chống lại chúng,

10:13

if appropriate.

198

613436

1320

nếu điều đó phù hợp.

10:16

But it's still difficult.

199

616026

1464

Nhưng thực ra vẫn khó.

10:18

What we're trying to do, in fact,

200

618122

2545

Điều chúng tôi đang cố gắng làm, thật ra,

10:20

is to allow machines to predict for any person and for any possible life

201

620691

5796

là giúp máy tính dự đoán cho mỗi người và cho mỗi cuộc sống

10:26

that they could live,

202

626511

1161

mà họ có thể đã được sống,

10:27

and the lives of everybody else:

203

627696

1597

và cuộc sống của tất cả mọi người khác:

10:29

Which would they prefer?

204

629317

2517

Họ thích cuộc sống nào nhất?

10:33

And there are many, many difficulties involved in doing this;

205

633881

2954

Và có rất rất nhiều khó khăn trong việc này.

10:36

I don't expect that this is going to get solved very quickly.

206

636859

2932

Tôi không hy vọng là chúng sẽ được giải quyết nhanh chóng.

10:39

The real difficulties, in fact, are us.

207

639815

2643

Khó khăn lớn nhất, thật ra, là chính chúng ta.

10:43

As I have already mentioned, we behave badly.

208

643969

3117

Như tôi đã đề cập, chúng ta cư xử khá tệ.

Thực tế, một số chúng ta thực sự đã mục nát.

10:47

In fact, some of us are downright nasty.

209

647110

2321

10:50

Now the robot, as I said, doesn't have to copy the behavior.

210

650251

3052

Bây giờ robot, như tôi đã nói, không cần phải bắt chước các hành vi.

10:53

The robot does not have any objective of its own.

211

653327

2791

Robot không có bất cứ mục tiêu nào cho riêng chúng.

10:56

It's purely altruistic.

212

656142

1737

Chúng hoàn toàn rất vị tha.

10:59

And it's not designed just to satisfy the desires of one person, the user,

213

659113

5221

Và nó không được thiết kế

để thỏa mãn ước muốn của chỉ một cá nhân, một người dùng,

11:04

but in fact it has to respect the preferences of everybody.

214

664358

3138

mà thực tế nó phải tôn trọng quan điểm của tất cả mọi người.

11:09

So it can deal with a certain amount of nastiness,

215

669083

2570

Do đó nó có thể xử lý với một số hành vi xấu xa,

11:11

and it can even understand that your nastiness, for example,

216

671677

3701

và thậm chí có thể thông cảm với sự sai trái của bạn, ví dụ,

11:15

you may take bribes as a passport official

217

675402

2671

có thể bạn nhận hối lộ khi làm công việc hộ chiếu

11:18

because you need to feed your family and send your kids to school.

218

678097

3812

vì bạn cần nuôi sống gia đình và cho con của bạn đi học.

11:21

It can understand that; it doesn't mean it's going to steal.

219

681933

2906

Chúng có thể hiểu điều này; nó không có nghĩa là chúng sẽ ăn cắp.

11:24

In fact, it'll just help you send your kids to school.

220

684863

2679

Thực tế, nó chỉ giúp bạn giúp con bạn được đi học.

11:28

We are also computationally limited.

221

688796

3012

Chúng ta cũng bị hạn chế về mặt tính toán.

11:31

Lee Sedol is a brilliant Go player,

222

691832

2505

Lee Sedol là một thiên tài cờ vây,

11:34

but he still lost.

223

694361

1325

nhưng anh ấy vẫn thua.

11:35

So if we look at his actions, he took an action that lost the game.

224

695710

4239

Nếu ta nhìn vào hành động của anh ấy, anh ấy chấp nhận đã thua ván cờ.

11:39

That doesn't mean he wanted to lose.

225

699973

2161

Nó không có nghĩa là anh ấy muốn thua.

11:43

So to understand his behavior,

226

703160

2040

Vậy để hiểu được hành vi của anh ấy,

11:45

we actually have to invert through a model of human cognition

227

705224

3644

chúng ta phải quay ngược trở lại với mô hình nhận thức của con người

11:48

that includes our computational limitations -- a very complicated model.

228

708892

4977

mà bao gồm những hạn chế về tính toán của chúng ta.

Và nó là một hệ thống rất phức tạp.

11:53

But it's still something that we can work on understanding.

229

713893

2993

Nhưng nó vẫn là thứ mà chúng ta có thể khám phá và hiểu nó.

11:57

Probably the most difficult part, from my point of view as an AI researcher,

230

717696

4320

Có lẽ phần khó khăn nhất, dưới góc nhìn là một nhà nghiên cứu AI,

12:02

is the fact that there are lots of us,

231

722040

2575

đó là số lượng của chúng ta quá nhiều,

12:06

and so the machine has to somehow trade off, weigh up the preferences

232

726114

3581

thế nên máy tính phải bằng một cách nào đó cân đong đo đếm các quan điểm

12:09

of many different people,

233

729719

2225

của nhiều người khác nhau,

12:11

and there are different ways to do that.

234

731968

1906

và có rất nhiều cách để làm việc này.

12:13

Economists, sociologists, moral philosophers have understood that,

235

733898

3689

Các nhà kinh tế học, xã hội học, triết học đạo đức đã hiểu điều đó,

12:17

and we are actively looking for collaboration.

236

737611

2455

và chúng tôi đang chủ động tìm kiếm các sự hợp tác.

12:20

Let's have a look and see what happens when you get that wrong.

237

740090

3251

Hãy quan sát và xem điều gì sẽ xảy ra khi bạn hiểu sai nó.

12:23

So you can have a conversation, for example,

238

743365

2133

Ví dụ, bạn có thể có một cuộc đối thoại

12:25

with your intelligent personal assistant

239

745522

1944

với trợ lý thông minh riêng của bạn

12:27

that might be available in a few years' time.

240

747490

2285

điều có thể sẽ thành hiện thực trong vài năm tới.

12:29

Think of a Siri on steroids.

241

749799

2524

Bạn có thể nghĩ về Siri nhưng ngoài đời thực.

12:33

So Siri says, "Your wife called to remind you about dinner tonight."

242

753447

4322

Siri nói: "Vợ anh đã gọi để nhắc anh về buổi ăn tối ngày mai."

12:38

And of course, you've forgotten. "What? What dinner?

243

758436

2508

Và đương nhiên, bạn đã quên. "Hả? Bữa tối nào?

12:40

What are you talking about?"

244

760968

1425

Cô đang nói về gì vậy?"

12:42

"Uh, your 20th anniversary at 7pm."

245

762417

3746

"..., kỉ niệm 20 năm ngày cưới, lúc 7 giờ tối."

12:48

"I can't do that. I'm meeting with the secretary-general at 7:30.

246

768735

3719

"Tôi không thể. Tôi có cuộc gặp với tổng thư ký lúc 7h30.

12:52

How could this have happened?"

247

772478

1692

Sao..., sao chuyện này có thể xảy ra chứ?"

12:54

"Well, I did warn you, but you overrode my recommendation."

248

774194

4660

"Chà, tôi đã cảnh báo anh nhưng anh đã lờ đi lời khuyên của tôi."

12:59

"Well, what am I going to do? I can't just tell him I'm too busy."

249

779966

3328

"Tôi phải làm gì bây giờ? Tôi không thể nói cô ấy là tôi quá bận."

13:04

"Don't worry. I arranged for his plane to be delayed."

250

784310

3281

"Đừng lo lắng. Tôi sẽ sắp xếp để chuyến bay của anh ấy bị hoãn lại."

13:07

(Laughter)

251

787615

1682

(Cười)

13:10

"Some kind of computer malfunction."

252

790069

2101

"Bằng một lỗi trục trặc kĩ thuật nào đó."

13:12

(Laughter)

253

792194

1212

(Cười)

13:13

"Really? You can do that?"

254

793430

1617

"Thật ư? Cô có thể làm thế à?"

13:16

"He sends his profound apologies

255

796220

2179

"Anh ấy đã gửi thư xin lỗi

13:18

and looks forward to meeting you for lunch tomorrow."

256

798423

2555

và mong sẽ được gặp anh ở bữa trưa ngày mai."

13:21

(Laughter)

257

801002

1299

(Cười)

13:22

So the values here -- there's a slight mistake going on.

258

802325

4403

Vậy giá trị ở đây -- có một chút sai lầm đã xảy ra.

13:26

This is clearly following my wife's values

259

806752

3009

Nó hoàn toàn theo đuổi giá trị của vợ tôi

13:29

which is "Happy wife, happy life."

260

809785

2069

đó là "Vợ vui thì đời cũng vui."

13:31

(Laughter)

261

811878

1583

(Cười)

13:33

It could go the other way.

262

813485

1444

Nó có thể diễn ra theo một hướng khác.

13:35

You could come home after a hard day's work,

263

815641

2201

Bạn vừa trở về nhà sau một ngày làm việc vất vả,

13:37

and the computer says, "Long day?"

264

817866

2195

và máy tính hỏi: "Một ngày dài à?"

"Ừ, tôi còn chẳng có thời gian để ăn trưa."

13:40

"Yes, I didn't even have time for lunch."

265

820085

2288

13:42

"You must be very hungry."

266

822397

1282

"Chắc anh phải đói lắm rồi."

13:43

"Starving, yeah. Could you make some dinner?"

267

823703

2646

"Ừ, đói muốn chết. Bạn có thể làm bữa tối cho tôi không?"

13:47

"There's something I need to tell you."

268

827890

2090

"Có điều này tôi phải nói với anh."

13:50

(Laughter)

269

830004

1155

(Cười)

13:52

"There are humans in South Sudan who are in more urgent need than you."

270

832013

4905

"Những người ở Nam Sudan đang cần sự trợ giúp khẩn cấp hơn anh nhiều."

13:56

(Laughter)

271

836942

1104

(Cười)

13:58

"So I'm leaving. Make your own dinner."

272

838070

2075

"Nên tôi đi đây. Tự làm bữa tối của anh đi."

14:00

(Laughter)

273

840169

2000

(Cười)

14:02

So we have to solve these problems,

274

842643

1739

Vậy chúng ta phải xử lý những vấn đề như thế này,

14:04

and I'm looking forward to working on them.

275

844406

2515

và tôi rất nóng lòng được làm việc với chúng.

14:06

There are reasons for optimism.

276

846945

1843

Có những lý do để mà lạc quan.

14:08

One reason is,

277

848812

1159

Một lý do là,

14:09

there is a massive amount of data.

278

849995

1868

có một lượng khổng lồ dữ liệu ngoài kia.

14:11

Because remember -- I said they're going to read everything

279

851887

2794

Bởi vì như tôi đã nói, chúng sẽ đọc hết tất cả mọi thứ trên đời.

14:14

the human race has ever written.

280

854705

1546

Hầu hết những gì chúng ta viết là về những việc làm của nhân loại

14:16

Most of what we write about is human beings doing things

281

856275

2724

và sau đó những người khác cảm thấy phiền lòng về nó.

14:19

and other people getting upset about it.

282

859023

1914

14:20

So there's a massive amount of data to learn from.

283

860961

2398

Do đó có một lượng khổng lồ dữ liệu để học tập.

14:23

There's also a very strong economic incentive

284

863383

2236

Đồng thời có một động lực kinh tế rất lớn

14:27

to get this right.

285

867151

1186

để làm đúng việc này.

14:28

So imagine your domestic robot's at home.

286

868361

2001

Hãy tưởng tượng robot gia đình ở nhà bạn.

14:30

You're late from work again and the robot has to feed the kids,

287

870386

3067

Bạn lại đi làm về trễ và robot phải nấu ăn cho bọn trẻ,

14:33

and the kids are hungry and there's nothing in the fridge.

288

873477

2823

bọn trẻ thì đang đói và không còn thứ gì trong tủ lạnh.

14:36

And the robot sees the cat.

289

876324

2605

Và robot nhìn thấy con mèo.

14:38

(Laughter)

290

878953

1692

(Cười)

14:40

And the robot hasn't quite learned the human value function properly,

291

880669

4190

Và robot này chưa được học hoàn toàn về các giá trị của con người,

14:44

so it doesn't understand

292

884883

1251

nên nó không thể hiểu được rằng

14:46

the sentimental value of the cat outweighs the nutritional value of the cat.

293

886158

4844

các giá trị tình cảm của con mèo lớn hơn hẳn giá trị dinh dưỡng của nó.

(Cười)

14:51

(Laughter)

294

891026

1095

Vậy sau đó chuyện gì xảy ra?

14:52

So then what happens?

295

892145

1748

14:53

Well, it happens like this:

296

893917

3297

Chà, nó xảy ra như thế này:

14:57

"Deranged robot cooks kitty for family dinner."

297

897238

2964

"Một robot điên loạn nấu mèo con cho bữa tối của gia đình."

15:00

That one incident would be the end of the domestic robot industry.

298

900226

4523

Một sự cố như thế có thể sẽ chấm dứt ngành robot gia đình.

15:04

So there's a huge incentive to get this right

299

904773

3372

Do đó có một động lực rất lớn để làm việc này đúng trong thời gian dài

15:08

long before we reach superintelligent machines.

300

908169

2715

trước khi chúng ta đạt tới máy móc siêu thông minh.

15:11

So to summarize:

301

911948

1535

Vậy để tổng kết lại:

15:13

I'm actually trying to change the definition of AI

302

913507

2881

Tôi thực ra đang cố thay đổi định nghĩa về AI

15:16

so that we have provably beneficial machines.

303

916412

2993

để chúng ta có những máy móc được chứng minh là có hiệu quả.

15:19

And the principles are:

304

919429

1222

Và những nguyên tắc là:

15:20

machines that are altruistic,

305

920675

1398

những chiếc máy hoàn toàn vị tha,

15:22

that want to achieve only our objectives,

306

922097

2804

chỉ muốn đạt được mục đích của chúng ta,

15:24

but that are uncertain about what those objectives are,

307

924925

3116

nhưng chúng không chắc chắn những mục tiêu này là gì,

15:28

and will watch all of us

308

928065

1998

và sẽ theo dõi tất cả chúng ta

15:30

to learn more about what it is that we really want.

309

930087

3203

để hiểu thêm về những gì chúng ta thực sự muốn.

15:34

And hopefully in the process, we will learn to be better people.

310

934193

3559

Và mong rằng trong quá trình đó, ta cũng học hỏi để trở nên tốt đẹp hơn.

15:37

Thank you very much.

311

937776

1191

Cảm ơn rất nhiều.

15:38

(Applause)

312

938991

3709

(Vỗ tay)

15:42

Chris Anderson: So interesting, Stuart.

313

942724

1868

Chris Anderson: Rất thú vị, Stuart.

15:44

We're going to stand here a bit because I think they're setting up

314

944616

3170

Chúng ta sẽ đứng đây thêm chút nữa

vì tôi nghĩ họ đang chuẩn bị cho diễn giả tiếp theo.

15:47

for our next speaker.

315

947810

1151

15:48

A couple of questions.

316

948985

1538

Đây là một số câu hỏi.

15:50

So the idea of programming in ignorance seems intuitively really powerful.

317

950547

5453

Vậy ý tưởng lập trình với sự thiếu hụt thông tin có vẻ như rất mạnh mẽ.

15:56

As you get to superintelligence,

318

956024

1594

Nhưng khi ta có siêu trí tuệ,

15:57

what's going to stop a robot

319

957642

2258

điều gì sẽ ngăn cản robot

15:59

reading literature and discovering this idea that knowledge

320

959924

2852

đọc những quyển sách và phát hiện ra ý tưởng là

16:02

is actually better than ignorance

321

962800

1572

có kiến thức thực ra tốt hơn là bị thiếu hụt

16:04

and still just shifting its own goals and rewriting that programming?

322

964396

4218

và có thể chuyển hướng mục tiêu của chúng sau đó viết lại các chương trình?

16:09

Stuart Russell: Yes, so we want it to learn more, as I said,

323

969512

6356

Stuart Rusell: Vâng, chúng ta muốn nó học hỏi nhiều hơn, như tôi đã nói,

16:15

about our objectives.

324

975892

1287

về mục tiêu của chúng ta.

16:17

It'll only become more certain as it becomes more correct,

325

977203

5521

Nó sẽ chỉ trở nên chắc chắn hơn khi nó làm đúng nhiều hơn,

16:22

so the evidence is there

326

982748

1945

vậy đó sẽ là những bằng chứng

16:24

and it's going to be designed to interpret it correctly.

327

984717

2724

và chúng sẽ được thiết kế để diễn dịch đúng đắn điều này.

16:27

It will understand, for example, that books are very biased

328

987465

3956

Nó sẽ hiểu được, ví dụ như những quyển sách rất thiên vị

16:31

in the evidence they contain.

329

991445

1483

về những đề tài mà chúng chứa.

16:32

They only talk about kings and princes

330

992952

2397

Chúng chỉ nói về các vị vua và hoàng tử

16:35

and elite white male people doing stuff.

331

995373

2800

và các đàn ông quý tộc da trắng làm gì đó.

16:38

So it's a complicated problem,

332

998197

2096

Nên đó là một vấn đề phức tạp,

16:40

but as it learns more about our objectives

333

1000317

3872

nhưng khi nó học hỏi nhiều hơn về mục tiêu của chúng ta,

16:44

it will become more and more useful to us.

334

1004213

2063

nó sẽ chở nên càng ngày càng có ích cho chúng ta.

16:46

CA: And you couldn't just boil it down to one law,

335

1006300

2526

CA: Và anh đã không thể rút gọn lại trong một luật,

16:48

you know, hardwired in:

336

1008850

1650

như là bó buộc nó lại:

16:50

"if any human ever tries to switch me off,

337

1010524

3293

"Nếu loài người đã cố để tắt nguồn tôi,

16:53

I comply. I comply."

338

1013841

1935

tôi sẽ tuân lệnh thôi."

16:55

SR: Absolutely not.

339

1015800

1182

SR: Thực sự thì không.

16:57

That would be a terrible idea.

340

1017006

1499

Đó sẽ là một ý tưởng tồi tệ.

16:58

So imagine that you have a self-driving car

341

1018529

2689

Hãy tưởng tượng anh có một chiếc xe tự lái

17:01

and you want to send your five-year-old

342

1021242

2433

và anh muốn gửi đứa con 5 tuổi tới trường mẫu giáo.

17:03

off to preschool.

343

1023699

1174

17:04

Do you want your five-year-old to be able to switch off the car

344

1024897

3101

Anh có muốn đứa con 5 tuổi có thể tắt chiếc xe khi nó đang chạy không?

17:08

while it's driving along?

345

1028022

1213

Chắc là không đâu.

17:09

Probably not.

346

1029259

1159

Do đó nó cần hiểu được mức độ nhận thức của người đó.

17:10

So it needs to understand how rational and sensible the person is.

347

1030442

4703

17:15

The more rational the person,

348

1035169

1676

Nhận thức người đó càng cao,

17:16

the more willing you are to be switched off.

349

1036869

2103

khả năng máy tính tự nguyện bị tắt càng cao.

17:18

If the person is completely random or even malicious,

350

1038996

2543

Nếu người đó hoàn toàn lạ mặt hay thậm chí là kẻ xấu,

17:21

then you're less willing to be switched off.

351

1041563

2512

thì máy tính sẽ khó để bị tắt hơn.

17:24

CA: All right. Stuart, can I just say,

352

1044099

1866

CA: Được thôi, Stuart,

17:25

I really, really hope you figure this out for us.

353

1045989

2314

tôi rất mong anh sẽ giải quyết vấn đề này cho chúng ta.

Cảm ơn rất nhiều vì cuộc nói chuyện. Nó rất tuyệt vời.

17:28

Thank you so much for that talk. That was amazing.

354

1048327

2375

17:30

SR: Thank you.

355

1050726

1167

SR: Cảm ơn.

17:31

(Applause)

356

1051917

1837

(Vỗ tay)

New videos

06:27

How do drugs make you hallucinate? - Anees Bahji

06:16

How important is politeness? ⏲️ 6 Minute English

07:44

North Korea’s secrets revealed by phone: Study:...

17:30

Advanced English Learning: Speaking Practice

03:48

What can you do? Easy English Conversations 💬 ...

12:13

Speak English Confidently: Daily Tricks & Tips 🧠

13:00

Practice English Conversation (Family life) Imp...

10:22

VOCABULARY English Speaking Practice

Original video on YouTube.com

3 principles for creating safer AI | Stuart Russell - YouTube

Về trang web này

Trang web này sẽ giới thiệu cho bạn những video YouTube hữu ích cho việc học tiếng Anh. Bạn sẽ thấy các bài học tiếng Anh được giảng dạy bởi các giáo viên hàng đầu từ khắp nơi trên thế giới. Nhấp đúp vào phụ đề tiếng Anh hiển thị trên mỗi trang video để phát video từ đó. Phụ đề cuộn đồng bộ với phát lại video. Nếu bạn có bất kỳ nhận xét hoặc yêu cầu nào, vui lòng liên hệ với chúng tôi bằng biểu mẫu liên hệ này.

https://forms.gle/WvT1wiN1qDtmnspy7

Playback speed

Subtitle font size

3 principles for creating safer AI | Stuart Russell

New videos

3 principles for creating safer AI | Stuart Russell

New videos

Original video on YouTube.com