How to get better at video games, according to babies - Brian Christian

559,494 views ・ 2021-11-02

TED-Ed

Silakan klik dua kali pada teks bahasa Inggris di bawah ini untuk memutar video.

Translator: neysa nasywa Reviewer: Reno Kanti Riananda

00:08

In 2013, a group of researchers at DeepMind in London

8871

4292

Pada tahun 2013, sekelompok peneliti di DeepMind, London,

00:13

had set their sights on a grand challenge.

13163

2666

berambisi menjawab sebuah tantangan besar.

00:15

They wanted to create an AI system that could beat,

15996

3292

Mereka ingin menciptakan sistem AI yang dapat mengalahkan,

00:19

not just a single Atari game, but every Atari game.

19288

4833

bukan hanya satu gim Atari, tetapi semua gim Atari.

00:24

They developed a system they called Deep Q Networks, or DQN,

24663

5166

Mereka mengembangkan sistem yang disebut Deep Q Networks, atau DQN,

00:29

and less than two years later, it was superhuman.

29829

3667

dan kurang dari dua tahun kemudian, kecerdasannya melampaui manusia.

00:33

DQN was getting scores 13 times better

33954

4167

DQN mencetak skor 13 kali lebih baik

00:38

than professional human games testers at “Breakout,”

38121

3541

daripada para penguji gim profesional di “Breakout,”

00:41

17 times better at “Boxing,” and 25 times better at “Video Pinball.”

41662

6334

17 kali lebih baik di “Boxing,” dan 25 kali lebih baik di “Video Pinball.”

00:48

But there was one notable, and glaring, exception.

48162

3834

Namun, terdapat sebuah pengecualian utama dan mencolok.

00:52

When playing “Montezuma’s Revenge” DQN couldn’t score a single point,

52496

5791

Saat memainkan “Montezuma’s Revenge” DQN tidak bisa mencetak satu poin pun,

00:58

even after playing for weeks.

58537

2625

bahkan setelah bermain berminggu-minggu.

01:01

What was it that made this particular game so vexingly difficult for AI?

61412

5459

Apa yang membuat gim ini sukar sekali diselesaikan oleh AI?

01:07

And what would it take to solve it?

67204

2459

Dan apa yang diperlukan untuk menyelesaikannya?

01:10

Spoiler alert: babies.

70538

2833

Bocorannya: para bayi.

01:13

We’ll come back to that in a minute.

73746

2000

Kita akan membahasnya setelah ini.

01:16

Playing Atari games with AI involves what’s called reinforcement learning,

76163

5541

Bermain gim Atari dengan AI melibatkan apa yang disebut reinforcement learning,

01:21

where the system is designed to maximize some kind of numerical rewards.

81871

4917

di mana sistem didesain untuk memaksimalkan hadiah yang berwujud angka.

01:26

In this case, those rewards were simply the game's points.

86788

3833

Dalam kasus ini, hadiah itu adalah poin dari gim tersebut.

01:30

This underlying goal drives the system to learn which buttons to press

90746

4333

Tujuan ini mendorong sistem untuk mempelajari tombol mana yang ditekan

01:35

and when to press them to get the most points.

95079

3000

dan kapan melakukannya demi mendapatkan poin terbanyak.

01:38

Some systems use model-based approaches, where they have a model of the environment

98079

5542

Beberapa sistem menggunakan pendekatan berbasis model,

di mana terdapat model suatu lingkungan

01:43

that they can use to predict what will happen next

103621

3125

yang dapat dipakai untuk memprediksi apa yang akan terjadi

01:46

once they take a certain action.

106746

2000

setelah sistem melakukan suatu aksi.

01:49

DQN, however, is model free.

109288

3041

Namun, DQN adalah sistem bebas model.

01:52

Instead of explicitly modeling its environment,

112704

2584

Alih-alih menciptakan model lingkungannya,

01:55

it just learns to predict, based on the images on screen,

115288

3458

sistem ini belajar untuk memprediksi, berdasarkan gambar di layar,

01:58

how many future points it can expect to earn by pressing different buttons.

118746

4958

berapa banyak poin yang akan didapat dari menekan tombol yang berbeda.

02:03

For instance, “if the ball is here and I move left, more points,

123871

4792

Contohnya, “ketika bolanya di sini dan aku bergeser ke kiri, poin bertambah,

02:08

but if I move right, no more points.”

128663

2833

tetapi jika aku bergeser ke kanan, tidak akan ada poin.”

02:12

But learning these connections requires a lot of trial and error.

132038

4500

Namun, untuk mempelajari ini semua dibutuhkan banyak sekali percobaan.

02:16

The DQN system would start by mashing buttons randomly,

136704

3834

Sistem DQN akan memulai dengan menekan tombol secara acak,

02:20

and then slowly piece together which buttons to mash when

140538

3541

lalu perlahan mencocokkan tombol mana yang harus ditekan

02:24

in order to maximize its score.

144079

2125

untuk memaksimalkan skor.

02:26

But in playing “Montezuma’s Revenge,”

146704

2375

Namun, saat bermain “Montezuma’s Revenge,”

02:29

this approach of random button-mashing fell flat on its face.

149079

4334

metode tekan tombol acak ini gagal total.

02:34

A player would have to perform this entire sequence

154121

3000

Seorang pemain harus memainkan seluruh rangkaian ini

02:37

just to score their first points at the very end.

157121

3375

hanya untuk mencetak poin pertama di akhir rangkaian.

02:40

A mistake? Game over.

160871

2208

Satu kesalahan? Permainan berakhir.

02:43

So how could DQN even know it was on the right track?

163538

3708

Jadi, bagaimana DQN bisa tahu ia berada di jalan yang benar?

02:47

This is where babies come in.

167746

2458

Di sinilah peran para bayi.

02:50

In studies, infants consistently look longer at pictures

170746

3875

Pada beberapa studi, bayi secara konsisten melihat lebih lama ke sebuah foto

02:54

they haven’t seen before than ones they have.

174621

2667

yang belum pernah mereka lihat dibandingkan yang pernah.

02:57

There just seems to be something intrinsically rewarding about novelty.

177579

4000

Tampaknya ada kepuasan tersendiri yang muncul dari hal-hal baru.

03:02

This behavior has been essential in understanding the infant mind.

182121

4125

Pemahaman akan perilaku ini esensial dalam memahami pikiran bayi.

03:06

It also turned out to be the secret to beating “Montezuma’s Revenge.”

186496

4792

Hal ini ternyata juga merupakan rahasia untuk menyelesaikan ”Montezuma’s Revenge.”

03:12

The DeepMind researchers worked out an ingenious way

192121

3708

Para peneliti DeepMind menemukan cara yang cerdik

03:15

to plug this preference for novelty into reinforcement learning.

195829

4500

untuk memasukkan pilihan akan hal baru ini ke dalam reinforcement learning.

03:20

They made it so that unusual or new images appearing on the screen

200704

4542

Mereka membuatnya sedemikian rupa sehingga gambar baru yang muncul di layar

03:25

were every bit as rewarding as real in-game points.

205246

4208

terlihat sama berharganya dengan poin asli dalam gim.

03:29

Suddenly, DQN was behaving totally differently from before.

209704

4709

Tiba-tiba, DQN berperilaku jauh berbeda dari sebelumnya.

03:34

It wanted to explore the room it was in,

214579

2334

Ia ingin menjelajahi ruangan tempatnya berada,

03:36

to grab the key and escape through the locked door—

216913

2708

mengambil kunci dan meloloskan diri dari pintu yang terkunci —

03:39

not because it was worth 100 points,

219621

2708

bukan untuk mendapatkan 100 poin,

03:42

but for the same reason we would: to see what was on the other side.

222329

4667

tetapi untuk alasan yang sama dengan kita: mencari tahu apa yang ada di sisi lain.

03:48

With this new drive, DQN not only managed to grab that first key—

228163

5250

Dengan rangsangan baru ini, DQN tak hanya berhasil menemukan kunci pertama—

03:53

it explored all the way through 15 of the temple’s 24 chambers.

233413

4833

tetapi juga menjelajahi hingga 15 dari 24 ruangan di kuil tersebut.

03:58

But emphasizing novelty-based rewards can sometimes create more problems

238454

4209

Namun, sistem hadiah berbasis hal baru ini

terkadang menciptakan lebih banyak masalah daripada memecahkannya.

04:02

than it solves.

242663

1166

04:03

A novelty-seeking system that’s played a game too long

243913

3208

Sebuah sistem pencari hal baru yang sudah dimainkan terlalu lama

04:07

will eventually lose motivation.

247121

2500

lama-kelamaan akan kehilangan motivasi.

04:09

If it’s seen it all before, why go anywhere?

249996

3042

Jika sudah pernah melihat semuanya, kenapa harus pergi lagi?

04:13

Alternately, if it encounters, say, a television, it will freeze.

253621

5167

Terkadang, saat bertemu sebuah televisi, misalnya, ia akan berhenti.

04:18

The constant novel images are essentially paralyzing.

258954

3750

Gambar baru yang terus-terusan muncul membuatnya tidak berdaya.

04:23

The ideas and inspiration here go in both directions.

263204

3625

Ide dan inspirasi di sini berjalan dua arah.

04:27

AI researchers stuck on a practical problem,

267079

3125

Peneliti AI yang terjebak pada masalah sederhana,

04:30

like how to get DQN to beat a difficult game,

270204

3334

seperti cara agar DQN menyelesaikan gim yang sulit,

04:33

are turning increasingly to experts in human intelligence for ideas.

273538

5000

berpaling ke ahli kecerdasan manusia untuk mencari ide.

04:38

At the same time,

278788

1125

Pada waktu bersamaan,

04:39

AI is giving us new insights into the ways we get stuck and unstuck:

279913

5416

AI memberi kita wawasan baru tentang bagaimana kita sendiri terjebak dan lolos:

04:45

into boredom, depression, and addiction,

285329

2792

dalam kebosanan, depresi, dan kecanduan,

04:48

along with curiosity, creativity, and play.

288121

3667

bersama dengan rasa ingin tahu, kreativitas, dan permainan.

New videos

05:20

Would you eat a ghost pepper for a prize? - Dan...

05:08

What does 'typical' mean? LEARN ENGLISH with MR...

$LEARN ENGLISH phrases using HEART \ English Addict with Mr Duncan -16 #englishaddictwithmrduncan$

10:15

LEARN ENGLISH phrases using HEART \ English Add...

05:52

ARE YOU RUSHED OFF YOUR FEET? - Learn English W...

09:49

What is the best way to learn English? - Mr Dun...

08:03

EXPRESSING - THIS / THAT/ and the OTHER - Learn...

08:33

Agree to disagree - What is a squabble? Mr Dunc...

01:04:41

English Addict Ep 363 -?LIVE stream / Sunday 4t...

Original video on YouTube.com

How to get better at video games, according to babies - Brian Christian - YouTube

Tentang situs web ini

Situs ini akan memperkenalkan Anda pada video YouTube yang berguna untuk belajar bahasa Inggris. Anda akan melihat pelajaran bahasa Inggris yang diajarkan oleh guru-guru terbaik dari seluruh dunia. Klik dua kali pada subtitle bahasa Inggris yang ditampilkan di setiap halaman video untuk memutar video dari sana. Subtitle bergulir selaras dengan pemutaran video. Jika Anda memiliki komentar atau permintaan, silakan hubungi kami menggunakan formulir kontak ini.

https://forms.gle/WvT1wiN1qDtmnspy7

Playback speed

Subtitle font size

How to get better at video games, according to babies - Brian Christian

New videos

How to get better at video games, according to babies - Brian Christian

New videos

Original video on YouTube.com