How to get better at video games, according to babies - Brian Christian

559,494 views ・ 2021-11-02

TED-Ed

Proszę kliknąć dwukrotnie na poniższe angielskie napisy, aby odtworzyć film.

Tłumaczenie: Katarzyna Bohowicz Korekta: Ola Królikowska

00:08

In 2013, a group of researchers at DeepMind in London

8871

4292

W 2013 roku grupa programistów z DeepMind w Londynie

00:13

had set their sights on a grand challenge.

13163

2666

wzięła na siebie potężne wyzwanie.

00:15

They wanted to create an AI system that could beat,

15996

3292

Chcieli stworzyć sztuczną inteligencję,

która przeszłaby nie jedną, a wszystkie gry Atari.

00:19

not just a single Atari game, but every Atari game.

19288

4833

00:24

They developed a system they called Deep Q Networks, or DQN,

24663

5166

Stworzyli system Deep Q Networks, czyli DQN,

00:29

and less than two years later, it was superhuman.

29829

3667

który w mniej niż dwa lata stałby się nadczłowiekiem.

00:33

DQN was getting scores 13 times better

33954

4167

DQN zdobywał wyniki 13 razy lepsze

00:38

than professional human games testers at “Breakout,”

38121

3541

niż profesjonali ludzcy testerzy gier w “Breakout”,

00:41

17 times better at “Boxing,” and 25 times better at “Video Pinball.”

41662

6334

17 razy lepsze w “Boxing” i 25 razy lepsze “Video Pinball”.

00:48

But there was one notable, and glaring, exception.

48162

3834

Ale był jeden rażący wyjątek.

00:52

When playing “Montezuma’s Revenge” DQN couldn’t score a single point,

52496

5791

Grając w “Zemstę Montezumy”, DQN nie zdobył ani jednego punktu,

00:58

even after playing for weeks.

58537

2625

nawet po całych tygodniach gry.

01:01

What was it that made this particular game so vexingly difficult for AI?

61412

5459

Co sprawiło, że ta konkretna gra stała się dla programu tak trudna?

01:07

And what would it take to solve it?

67204

2459

Jak to naprawić?

01:10

Spoiler alert: babies.

70538

2833

Uwaga, spoiler: dzieci.

01:13

We’ll come back to that in a minute.

73746

2000

Za moment do tego wrócimy.

01:16

Playing Atari games with AI involves what’s called reinforcement learning,

76163

5541

Grając w gry Atari, AI wymaga tak zwanego “uczenia przez wzmacnianie”,

01:21

where the system is designed to maximize some kind of numerical rewards.

81871

4917

gdzie system zaprojektowany jest do maksymalizowania liczby nagród.

01:26

In this case, those rewards were simply the game's points.

86788

3833

W tym przypadku te nagrody to punkty w grze.

01:30

This underlying goal drives the system to learn which buttons to press

90746

4333

Cel zmusza program do nauczenia, jakie przyciski wciskać

01:35

and when to press them to get the most points.

95079

3000

i kiedy je wciskać, żeby zdobyć jak najwięcej punktów.

01:38

Some systems use model-based approaches, where they have a model of the environment

98079

5542

Niektóre systemy używają modeli, gdzie mając model środowiska

01:43

that they can use to predict what will happen next

103621

3125

są w stanie przewidzieć, co się stanie,

01:46

once they take a certain action.

106746

2000

kiedy podejmą dane działanie.

01:49

DQN, however, is model free.

109288

3041

DQN jednak nie opiera się na modelach.

01:52

Instead of explicitly modeling its environment,

112704

2584

Bez dokładnego modelowania środowiska

01:55

it just learns to predict, based on the images on screen,

115288

3458

po prostu uczy się przewidywania na podstawie tego, co widzi na ekranie.

01:58

how many future points it can expect to earn by pressing different buttons.

118746

4958

Ilu punktów może się spodziewać, wciskając różne przyciski.

02:03

For instance, “if the ball is here and I move left, more points,

123871

4792

Na przykład “jeśli piłeczka jest tutaj, a ja ruszę w lewo - więcej punktów,

02:08

but if I move right, no more points.”

128663

2833

jeśli ruszę w prawo - zero punktów”.

02:12

But learning these connections requires a lot of trial and error.

132038

4500

Ale uczenie się tych zależności wymaga sporej ilości powtórzeń.

02:16

The DQN system would start by mashing buttons randomly,

136704

3834

DQN najpierw wciska przyciski przypadkowo,

02:20

and then slowly piece together which buttons to mash when

140538

3541

a potem powoli uczy się, kiedy wcisnąć jakie przyciski,

02:24

in order to maximize its score.

144079

2125

żeby zmaksymalizować wynik.

02:26

But in playing “Montezuma’s Revenge,”

146704

2375

Ale grając w “Zemstę Montezumy”,

02:29

this approach of random button-mashing fell flat on its face.

149079

4334

metoda wciskania przypadkowych przycisków na nic się nie zda.

02:34

A player would have to perform this entire sequence

154121

3000

Gracz musi wykonać całą sekwencję,

02:37

just to score their first points at the very end.

157121

3375

żeby na samym końcu zdobyć pierwszy punkt.

02:40

A mistake? Game over.

160871

2208

Jeden błąd? Koniec gry.

02:43

So how could DQN even know it was on the right track?

163538

3708

Skąd DQN miał wiedzieć, że jest na dobrej drodze?

02:47

This is where babies come in.

167746

2458

I tutaj wchodzą dzieci.

02:50

In studies, infants consistently look longer at pictures

170746

3875

Według badań noworodki patrzą dłużej na obrazy,

02:54

they haven’t seen before than ones they have.

174621

2667

których nie znają, niż na te, które już widziały.

02:57

There just seems to be something intrinsically rewarding about novelty.

177579

4000

Najwyraźniej jest coś urzekającego w patrzeniu na nowości.

03:02

This behavior has been essential in understanding the infant mind.

182121

4125

To zachowanie było kluczowe w rozumieniu umysłu noworodka.

03:06

It also turned out to be the secret to beating “Montezuma’s Revenge.”

186496

4792

Okazało się również kluczem do pokonania “Zemsty Montezumy”.

03:12

The DeepMind researchers worked out an ingenious way

192121

3708

Programiści DeepMind wypracowali sprytny sposób

03:15

to plug this preference for novelty into reinforcement learning.

195829

4500

na wprowadzenie chęci szukania nowości do metody “uczenia przez wzmacnianie”.

03:20

They made it so that unusual or new images appearing on the screen

200704

4542

Zrobili to tak, żeby nowe i nietypowe obrazy pojawiające się na ekranie

03:25

were every bit as rewarding as real in-game points.

205246

4208

były równie satysfakcjonujące, jak prawdziwe punkty w grze.

03:29

Suddenly, DQN was behaving totally differently from before.

209704

4709

Nagle DQN zaczął się zachowywać zupełnie inaczej niż wcześniej.

03:34

It wanted to explore the room it was in,

214579

2334

Chciał przeszukać pokój, w którym był,

03:36

to grab the key and escape through the locked door—

216913

2708

zgarnąć klucz i uciec przez zamknięte drzwi,

03:39

not because it was worth 100 points,

219621

2708

nie dlatego, że było to warte 100 punktów,

03:42

but for the same reason we would: to see what was on the other side.

222329

4667

ale z tego samego powodu co my, żeby zobaczyć, co jest po drugiej stronie.

03:48

With this new drive, DQN not only managed to grab that first key—

228163

5250

Z tym nowym celem DQN nie tylko zebrał pierwszy klucz,

03:53

it explored all the way through 15 of the temple’s 24 chambers.

233413

4833

ale przeszedł przez 15 z 24 komnat świątyni.

03:58

But emphasizing novelty-based rewards can sometimes create more problems

238454

4209

Jednak szukanie jedynie nowości może spowodować więcej problemów

04:02

than it solves.

242663

1166

niż rozwiązać.

04:03

A novelty-seeking system that’s played a game too long

243913

3208

Program szukający nowości, który gra w grę za długo,

04:07

will eventually lose motivation.

247121

2500

w końcu straci motywację.

04:09

If it’s seen it all before, why go anywhere?

249996

3042

Jeśli już wszystko widział wcześniej, po co gdziekolwiek iść?

04:13

Alternately, if it encounters, say, a television, it will freeze.

253621

5167

A jeśli napotka na przykład telewizor, to stanie w miejscu.

04:18

The constant novel images are essentially paralyzing.

258954

3750

Ciągłe nowe obrazy są właściwie paraliżujące.

04:23

The ideas and inspiration here go in both directions.

263204

3625

Pomysły i inspiracje działają tu w obie strony.

04:27

AI researchers stuck on a practical problem,

267079

3125

Programiści zajmujący się praktycznym problemem

04:30

like how to get DQN to beat a difficult game,

270204

3334

jak sprawienie, żeby DQN wygrał trudną grę,

04:33

are turning increasingly to experts in human intelligence for ideas.

273538

5000

coraz częściej zwracają się do ekspertów z dziedziny ludzkiej inteligencji.

04:38

At the same time,

278788

1125

W tym samym czasie

04:39

AI is giving us new insights into the ways we get stuck and unstuck:

279913

5416

AI daje nam nowy wgląd w to, jak wpadamy i wychodzimy

04:45

into boredom, depression, and addiction,

285329

2792

z nudy, depresji i uzależnienia,

04:48

along with curiosity, creativity, and play.

288121

3667

a także ciekawości, kreatywności i zabawy.

New videos

06:16

How important is politeness? ⏲️ 6 Minute English

07:44

North Korea’s secrets revealed by phone: Study:...

17:30

Advanced English Learning: Speaking Practice

03:48

What can you do? Easy English Conversations 💬 ...

12:13

Speak English Confidently: Daily Tricks & Tips 🧠

13:00

Practice English Conversation (Family life) Imp...

10:22

VOCABULARY English Speaking Practice

11:45

3 Simple Steps to Become Fluent in English

Original video on YouTube.com

How to get better at video games, according to babies - Brian Christian - YouTube

O tej stronie

Na tej stronie poznasz filmy z YouTube, które są przydatne do nauki języka angielskiego. Zobaczysz lekcje angielskiego prowadzone przez najlepszych nauczycieli z całego świata. Kliknij dwukrotnie na angielskie napisy wyświetlane na stronie każdego filmu, aby odtworzyć film od tego miejsca. Napisy przewijają się synchronicznie z odtwarzaniem filmu. Jeśli masz jakieś uwagi lub prośby, skontaktuj się z nami za pomocą formularza kontaktowego.

https://forms.gle/WvT1wiN1qDtmnspy7

Playback speed

Subtitle font size

How to get better at video games, according to babies - Brian Christian

New videos

How to get better at video games, according to babies - Brian Christian

New videos

Original video on YouTube.com