How we teach computers to understand pictures | Fei Fei Li

1,154,719 views ・ 2015-03-23

TED


Κάντε διπλό κλικ στους αγγλικούς υπότιτλους παρακάτω για να αναπαραγάγετε το βίντεο.

Μετάφραση: Christos Christodoulopoulos Επιμέλεια: Mary Keramida
00:14
Let me show you something.
0
14366
3738
Θέλω να σας δείξω κάτι.
00:18
(Video) Girl: Okay, that's a cat sitting in a bed.
1
18104
4156
(Βίντεο) Κορίτσι: ΟΚ, μια γάτα που κάθεται στο κρεβάτι.
00:22
The boy is petting the elephant.
2
22260
4040
Το αγόρι χαϊδεύει τον ελέφαντα.
00:26
Those are people that are going on an airplane.
3
26300
4354
Οι άνθρωποι ανεβαίνουν στο αεροπλάνο.
00:30
That's a big airplane.
4
30654
2810
Είναι ένα μεγάλο αεροπλάνο.
00:33
Fei-Fei Li: This is a three-year-old child
5
33464
2206
Φέι Φέι Λι: Αυτό είναι ένα τρίχρονο κορίτσι
00:35
describing what she sees in a series of photos.
6
35670
3679
που περιγράφει τι βλέπει σε μια σειρά από φωτογραφίες.
00:39
She might still have a lot to learn about this world,
7
39349
2845
Μπορεί να έχει να μάθει πολλά ακόμα για τον κόσμο,
00:42
but she's already an expert at one very important task:
8
42194
4549
αλλά είναι ήδη ειδική σε μια πολύ σημαντική εργασία:
00:46
to make sense of what she sees.
9
46743
2846
να καταλαβαίνει τι βλέπει.
00:50
Our society is more technologically advanced than ever.
10
50229
4226
Η κοινωνία μας τεχνολογικά είναι πιο προηγμένη από ποτέ.
00:54
We send people to the moon, we make phones that talk to us
11
54455
3629
Στέλνουμε ανθρώπους στο φεγγάρι, έχουμε τηλέφωνα που μας μιλάνε
00:58
or customize radio stations that can play only music we like.
12
58084
4946
ή ρυθμίζουμε ραδιοφωνικούς σταθμούς να παίζουν μόνο τη μουσική που μας αρέσει.
01:03
Yet, our most advanced machines and computers
13
63030
4055
Κι όμως, οι πιο προηγμένες μηχανές και υπολογιστές μας
01:07
still struggle at this task.
14
67085
2903
δυσκολεύονται ακόμα σε αυτή την εργασία.
01:09
So I'm here today to give you a progress report
15
69988
3459
Έτσι λοιπόν, είμαι εδώ σήμερα για να σας δώσω μια αναφορά προόδου
01:13
on the latest advances in our research in computer vision,
16
73447
4047
σχετικά με τις πρόσφατες εξελίξεις στον τομέα της μηχανικής όρασης,
01:17
one of the most frontier and potentially revolutionary
17
77494
4161
μια από τις πιο σημαντικές και πιθανότατα επαναστατικές
01:21
technologies in computer science.
18
81655
3206
τεχνολογίες της πληροφορικής.
01:24
Yes, we have prototyped cars that can drive by themselves,
19
84861
4551
Ναι, έχουμε πρωτότυπα αυτοκίνητα που οδηγούν αυτόνομα,
01:29
but without smart vision, they cannot really tell the difference
20
89412
3853
αλλά χωρίς «έξυπνη» όραση δεν μπορούν να καταλάβουν τη διαφορά
01:33
between a crumpled paper bag on the road, which can be run over,
21
93265
3970
μεταξύ μιας τσαλακωμένης σακούλας στο δρόμο, που μπορούν να «πατήσουν»,
01:37
and a rock that size, which should be avoided.
22
97235
3340
και μιας πέτρας με το ίδιο μέγεθος, που πρέπει να αποφύγουν.
01:41
We have made fabulous megapixel cameras,
23
101415
3390
Έχουμε εκπληκτικές κάμερες με ανάλυση μεγαπίξελ,
01:44
but we have not delivered sight to the blind.
24
104805
3135
αλλά δεν έχουμε δώσει όραση στους τυφλούς.
01:48
Drones can fly over massive land,
25
108420
3305
Τηλεκατευθυνόμενα αεροσκάφη μπορούν να πετάξουν πάνω από τεράστια εδάφη
01:51
but don't have enough vision technology
26
111725
2134
αλλά δεν έχουν αρκετή τεχνολογία όρασης
01:53
to help us to track the changes of the rainforests.
27
113859
3461
για να μας βοηθήσουν να παρακολουθήσουμε τις αλλαγές στα τροπικά δάση.
01:57
Security cameras are everywhere,
28
117320
2950
Κάμερες ασφαλείας είναι παντού,
02:00
but they do not alert us when a child is drowning in a swimming pool.
29
120270
5067
αλλά δεν μας προειδοποιούν όταν ένα παιδί πνίγεται στην πισίνα.
02:06
Photos and videos are becoming an integral part of global life.
30
126167
5595
Φωτογραφίες και βίντεο γίνονται ολοένα πιο σημαντικό κομμάτι της παγκόσμιας ζωής.
02:11
They're being generated at a pace that's far beyond what any human,
31
131762
4087
Δημιουργούνται με τέτοιο ρυθμό που είναι πέρα απ' ότι ένας άνθρωπος
02:15
or teams of humans, could hope to view,
32
135849
2783
ή μια ομάδα ανθρώπων μπορούν να δουν,
02:18
and you and I are contributing to that at this TED.
33
138632
3921
και εσείς και εγώ συνεισφέρουμε σε αυτό, εδώ στο TED.
02:22
Yet our most advanced software is still struggling at understanding
34
142553
5232
Κι όμως, το πιο προηγμένο λογισμικό μας δυσκολεύεται ακόμα να καταλάβει
02:27
and managing this enormous content.
35
147785
3876
και να διαχειριστεί αυτές τις τεράστιες ποσότητες περιεχομένου.
02:31
So in other words, collectively as a society,
36
151661
5272
Με άλλα λόγια, συλλογικά σαν κοινωνία,
02:36
we're very much blind,
37
156933
1746
είμαστε βασικά τυφλοί,
02:38
because our smartest machines are still blind.
38
158679
3387
γιατί οι πιο «έξυπνες» μηχανές μας είναι ακόμα τυφλές.
02:43
"Why is this so hard?" you may ask.
39
163526
2926
«Γιατί είναι τόσο δύσκολο;» μπορεί να ρωτήσετε.
02:46
Cameras can take pictures like this one
40
166452
2693
Οι κάμερες μπορούν να τραβήξουν φωτογραφίες όπως αυτή
02:49
by converting lights into a two-dimensional array of numbers
41
169145
3994
μετατρέποντας το φως σε δισδιάστατους πίνακες αριθμών
02:53
known as pixels,
42
173139
1650
που λέγονται πίξελ,
02:54
but these are just lifeless numbers.
43
174789
2251
αλλά αυτοί είναι άψυχοι αριθμοί.
02:57
They do not carry meaning in themselves.
44
177040
3111
Δεν έχουν νόημα από μόνοι τους.
03:00
Just like to hear is not the same as to listen,
45
180151
4343
Όπως το να αντιλαμβάνεσαι έναν ήχο δεν είναι σαν να τον καταλαβαίνεις,
03:04
to take pictures is not the same as to see,
46
184494
4040
το να βγάζεις φωτογραφίες δεν είναι το ίδιο με το να βλέπεις,
03:08
and by seeing, we really mean understanding.
47
188534
3829
και λέγοντας «βλέπω» εννοούμε «καταλαβαίνω».
03:13
In fact, it took Mother Nature 540 million years of hard work
48
193293
6177
Πράγματι, η Φύση χρειάστηκε 540 εκατομμύρια χρόνια σκληρής δουλειάς
03:19
to do this task,
49
199470
1973
για να καταφέρει αυτό το έργο,
03:21
and much of that effort
50
201443
1881
και η περισσότερη προσπάθεια
03:23
went into developing the visual processing apparatus of our brains,
51
203324
5271
αφιερώθηκε στην ανάπτυξη του οπτικού μηχανισμού του εγκεφάλου μας
03:28
not the eyes themselves.
52
208595
2647
και όχι στα ίδια τα μάτια.
03:31
So vision begins with the eyes,
53
211242
2747
Η όραση λοιπόν ξεκινάει με τα μάτια,
03:33
but it truly takes place in the brain.
54
213989
3518
αλλά πραγματικά λαμβάνει χώρα στον εγκέφαλο.
03:38
So for 15 years now, starting from my Ph.D. at Caltech
55
218287
5060
Εδώ και 15 χρόνια, από το διδακτορικό μου στο Πανεπιστήμιο της Καλιφόρνια
03:43
and then leading Stanford's Vision Lab,
56
223347
2926
και ύστερα ως επικεφαλής του κέντρου όρασης του Στάνφορντ,
03:46
I've been working with my mentors, collaborators and students
57
226273
4396
δουλεύω με τους μέντορες, συνεργάτες και φοιτητές μου
03:50
to teach computers to see.
58
230669
2889
προσπαθώντας να μάθω τους υπολογιστές να βλέπουν.
03:54
Our research field is called computer vision and machine learning.
59
234658
3294
Το ερευνητικό μας πεδίο λέγεται υπολογιστική όραση και μηχανική μάθηση.
03:57
It's part of the general field of artificial intelligence.
60
237952
3878
Είναι κομμάτι του γενικότερου πεδίου της τεχνητής νοημοσύνης.
04:03
So ultimately, we want to teach the machines to see just like we do:
61
243000
5493
Τελικά, θέλουμε να διδάξουμε τις μηχανές να δουν ακριβώς όπως εμείς:
04:08
naming objects, identifying people, inferring 3D geometry of things,
62
248493
5387
να ονομάζουν αντικείμενα, να αναγνωρίζουν ανθρώπους και αντικείμενα στον χώρο,
04:13
understanding relations, emotions, actions and intentions.
63
253880
5688
να καταλαβαίνουν σχέσεις, συναισθήματα, δράσεις και προθέσεις.
04:19
You and I weave together entire stories of people, places and things
64
259568
6153
Εσείς και εγώ συνυφαίνουμε ολόκληρες ιστορίες ανθρώπων, τόπων και πραγμάτων
04:25
the moment we lay our gaze on them.
65
265721
2164
τη στιγμή που τα πρωτοβλέπουμε.
04:28
The first step towards this goal is to teach a computer to see objects,
66
268955
5583
Το πρώτο βήμα προς αυτό το στόχο είναι να μάθουμε τον υπολογιστή να δει πράγματα,
04:34
the building block of the visual world.
67
274538
3368
τα δομικά στοιχεία του οπτικού μας κόσμου.
04:37
In its simplest terms, imagine this teaching process
68
277906
4434
Στην πιο απλή της εκδοχή, φανταστείτε την εκπαιδευτική διαδικασία ως εξής:
04:42
as showing the computers some training images
69
282340
2995
δείχνουμε στον υπολογιστή μερικές εικόνες εκμάθησης
04:45
of a particular object, let's say cats,
70
285335
3321
ενός συγκεκριμένου αντικειμένου, ας πούμε γάτες,
04:48
and designing a model that learns from these training images.
71
288656
4737
και σχεδιάζουμε ένα μοντέλο που μαθαίνει από αυτές τις εικόνες.
04:53
How hard can this be?
72
293393
2044
Πόσο δύσκολο μπορεί να είναι;
04:55
After all, a cat is just a collection of shapes and colors,
73
295437
4052
Στο κάτω κάτω, μια γάτα είναι απλά μια συλλογή από σχήματα και χρώματα,
04:59
and this is what we did in the early days of object modeling.
74
299489
4086
και αυτό ακριβώς κάναμε τα πρώτα χρόνια της μοντελοποίησης αντικειμένων.
05:03
We'd tell the computer algorithm in a mathematical language
75
303575
3622
Λέγαμε στον αλγόριθμο του υπολογιστή, σε μαθηματική γλώσσα,
05:07
that a cat has a round face, a chubby body,
76
307197
3343
ότι η γάτα έχει ένα στρογγυλό πρόσωπο, ένα παχουλό σώμα,
05:10
two pointy ears, and a long tail,
77
310540
2299
δύο μυτερά αυτιά και μια μακριά ουρά,
05:12
and that looked all fine.
78
312839
1410
και αυτό έμοιαζε μια χαρά.
05:14
But what about this cat?
79
314859
2113
Αλλά αυτή η γάτα;
05:16
(Laughter)
80
316972
1091
(Γέλια)
05:18
It's all curled up.
81
318063
1626
Είναι κουλουριασμένη.
05:19
Now you have to add another shape and viewpoint to the object model.
82
319689
4719
Τώρα πρέπει να προσθέσουμε άλλο ένα σχήμα και άλλη μια άποψη στο μοντέλο μας.
05:24
But what if cats are hidden?
83
324408
1715
Κι αν η γάτα κρύβεται;
05:27
What about these silly cats?
84
327143
2219
Και αυτές οι χαζούλες γάτες;
05:31
Now you get my point.
85
331112
2417
Βλέπετε το πρόβλημα.
05:33
Even something as simple as a household pet
86
333529
3367
Ακόμα και κάτι τόσο απλό όσο ένα κατοικίδιο
05:36
can present an infinite number of variations to the object model,
87
336896
4504
μπορεί να παρουσιάσει έναν άπειρο αριθμό παραλλαγών στο μοντέλο,
05:41
and that's just one object.
88
341400
2233
και αυτό είναι μόνο ένα αντικείμενο.
05:44
So about eight years ago,
89
344573
2492
Πριν από οκτώ χρόνια,
05:47
a very simple and profound observation changed my thinking.
90
347065
5030
μια πολύ απλή και βαθιά παρατήρηση άλλαξε τον τρόπο σκέψης μου.
05:53
No one tells a child how to see,
91
353425
2685
Κανένας δεν λέει σε ένα παιδί πώς να δει,
05:56
especially in the early years.
92
356110
2261
κυριώς τα πρώτα χρόνια.
05:58
They learn this through real-world experiences and examples.
93
358371
5000
Μαθαίνουν μέσα από εμπειρίες και παραδείγματα του πραγματικού κόσμου.
06:03
If you consider a child's eyes
94
363371
2740
Αν σκεφτούμε τα μάτια του παιδιού
06:06
as a pair of biological cameras,
95
366111
2554
σαν ένα ζευγάρι από βιολογικές κάμερες,
06:08
they take one picture about every 200 milliseconds,
96
368665
4180
βγάζουν περίπου μία φωτογραφία κάθε 200 χιλιοστά του δευτερολέπτου,
06:12
the average time an eye movement is made.
97
372845
3134
που είναι ο μέσος χρόνος που χρειάζεται για μια κίνηση του ματιού.
06:15
So by age three, a child would have seen hundreds of millions of pictures
98
375979
5550
Έτσι, ένα παιδί τριών ετών θα έχει δει εκατοντάδες εκατομμύρια φωτογραφίες
06:21
of the real world.
99
381529
1834
του πραγματικού κόσμου.
06:23
That's a lot of training examples.
100
383363
2280
Αυτά είναι πολλά παραδείγματα εκμάθησης.
06:26
So instead of focusing solely on better and better algorithms,
101
386383
5989
Αντί λοιπόν να εστιάζουμε μόνο σε ολοένα και καλύτερους αλγόριθμους,
06:32
my insight was to give the algorithms the kind of training data
102
392372
5272
η ιδέα μου ήταν να δώσω στους αλγόριθμους το είδος των εκπαιδευτικών δεδομένων
06:37
that a child was given through experiences
103
397644
3319
που ένα παιδί αποκτά μέσω εμπειρίας
06:40
in both quantity and quality.
104
400963
3878
τόσο σε ποσότητα όσο και σε ποιότητα.
06:44
Once we know this,
105
404841
1858
Όταν το καταλάβαμε
06:46
we knew we needed to collect a data set
106
406699
2971
ξέραμε ότι έπρεπε να συλλέξουμε ένα σετ δεδομένων
06:49
that has far more images than we have ever had before,
107
409670
4459
που περιείχε πολύ περισσότερες φωτογραφίες από όσες είχαμε προηγουμένως,
06:54
perhaps thousands of times more,
108
414129
2577
ίσως χιλιάδες φορές περισσότερες,
06:56
and together with Professor Kai Li at Princeton University,
109
416706
4111
και μαζί με τον καθηγητή Κάι Λι στο Πανεπιστήμιο του Πρίνστον
07:00
we launched the ImageNet project in 2007.
110
420817
4752
ξεκινήσαμε το πρόγραμμα ImageNet το 2007.
07:05
Luckily, we didn't have to mount a camera on our head
111
425569
3838
Ευτυχώς, δε χρειάστηκε να φορέσουμε κάμερες στο κεφάλι μας
07:09
and wait for many years.
112
429407
1764
και να περιμένουμε πολλά χρόνια.
07:11
We went to the Internet,
113
431171
1463
Πήγαμε στο Διαδίκτυο,
07:12
the biggest treasure trove of pictures that humans have ever created.
114
432634
4436
το μεγαλύτερο θησαυροφυλάκιο εικόνων που έχουν ποτέ κατασκευάσει οι άνθρωποι.
07:17
We downloaded nearly a billion images
115
437070
3041
«Κατεβάσαμε» σχεδόν ένα δισεκατομμύριο εικόνες
07:20
and used crowdsourcing technology like the Amazon Mechanical Turk platform
116
440111
5880
και χρησιμοποιήσαμε τεχνολογίες «υπηρεσιών πλήθους» όπως η πλατφόρμα της Άμαζον
07:25
to help us to label these images.
117
445991
2339
για να μας βοηθήσουν να ονομάσουμε αυτές τις εικόνες.
07:28
At its peak, ImageNet was one of the biggest employers
118
448330
4900
Στην αιχμή του, το ImageNet ήταν ένας από τους μεγαλύτερους εργοδότες
07:33
of the Amazon Mechanical Turk workers:
119
453230
2996
της πλατφόρμας της Άμαζον:
07:36
together, almost 50,000 workers
120
456226
3854
όλοι μαζί, σχεδόν 50.000 εργαζόμενοι
07:40
from 167 countries around the world
121
460080
4040
από 167 χώρες από όλο τον κόσμο
07:44
helped us to clean, sort and label
122
464120
3947
μας βοήθησαν να καθαρίσουμε, να κατατάξουμε και να ονομάσουμε
07:48
nearly a billion candidate images.
123
468067
3575
σχεδόν ένα δισεκατομμύριο υποψήφιες φωτογραφίες.
07:52
That was how much effort it took
124
472612
2653
Τόση προσπάθεια χρειάστηκε
07:55
to capture even a fraction of the imagery
125
475265
3900
για να καταγράψουμε ένα ψήγμα των παραστάσεων
07:59
a child's mind takes in in the early developmental years.
126
479165
4171
που προσλαμβάνει το μυαλό ενός παιδιού στα πρώτα χρόνια της ανάπτυξης.
08:04
In hindsight, this idea of using big data
127
484148
3902
Εκ των υστέρων, η ιδέα της χρήσης μαζικών δεδομένων
08:08
to train computer algorithms may seem obvious now,
128
488050
4550
για την εκπαίδευση υπολογιστών μπορεί να μοιάζει προφανής,
08:12
but back in 2007, it was not so obvious.
129
492600
4110
αλλά το 2007 δεν ήταν τόσο προφανής.
08:16
We were fairly alone on this journey for quite a while.
130
496710
3878
Ήμασταν μόνοι μας σε αυτό το ταξίδι για αρκετό καιρό.
08:20
Some very friendly colleagues advised me to do something more useful for my tenure,
131
500588
5003
Μερικοί συνάδελφοι με συμβούλευσαν να κάνω κάτι πιο χρήσιμο για να πάρω μονιμότητα,
08:25
and we were constantly struggling for research funding.
132
505591
4342
και είχαμε διαρκώς προβλήματα χρηματοδότησης.
08:29
Once, I even joked to my graduate students
133
509933
2485
Μια φορά, είπα για πλάκα στους μεταπτυχιακούς φοιτητές μου
08:32
that I would just reopen my dry cleaner's shop to fund ImageNet.
134
512418
4063
ότι θα άνοιγα ξανά το καθαριστήριό μου για να χρηματοδοτήσω το ImageNet.
08:36
After all, that's how I funded my college years.
135
516481
4761
Στο κάτω κάτω, έτσι χρηματοδότησα τις σπουδές μου.
08:41
So we carried on.
136
521242
1856
Έτσι λοιπόν συνεχίσαμε.
08:43
In 2009, the ImageNet project delivered
137
523098
3715
Το 2009, το ΙmageNet παρέδωσε
08:46
a database of 15 million images
138
526813
4042
μια βάση δεδομένων με 15 εκατομμύρια φωτογραφίες
08:50
across 22,000 classes of objects and things
139
530855
4805
που ανήκαν σε 22.000 κατηγορίες αντικειμένων και πραγμάτων
08:55
organized by everyday English words.
140
535660
3320
οργανωμένες με καθημερινές αγγλικές λέξεις.
08:58
In both quantity and quality,
141
538980
2926
Τόσο σε ποσότητα όσο και σε ποιότητα,
09:01
this was an unprecedented scale.
142
541906
2972
ήταν μια ανεπανάληπτη κλίμακα.
09:04
As an example, in the case of cats,
143
544878
3461
Για παράδειγμα, όσον αφορά τις γάτες,
09:08
we have more than 62,000 cats
144
548339
2809
έχουμε περισσότερες από 62.000 γάτες
09:11
of all kinds of looks and poses
145
551148
4110
με διαφορετικές εμφανίσεις και πόζες
09:15
and across all species of domestic and wild cats.
146
555258
5223
και όλα τα είδη, κατοικίδιες και άγριες.
09:20
We were thrilled to have put together ImageNet,
147
560481
3344
Ήμασταν πανευτυχείς που ολοκληρώσαμε το ImageNet,
09:23
and we wanted the whole research world to benefit from it,
148
563825
3738
και θέλαμε να επωφεληθεί όλος ο ερευνητικός κόσμος,
09:27
so in the TED fashion, we opened up the entire data set
149
567563
4041
κι έτσι, σύμφωνα με το πνεύμα του TED, διαθέσαμε ολόκληρη τη βάση δεδομένων
09:31
to the worldwide research community for free.
150
571604
3592
στην παγκόσμια ερευνητική κοινότητα, δωρεάν.
09:36
(Applause)
151
576636
4000
(Χειροκρότημα)
09:41
Now that we have the data to nourish our computer brain,
152
581416
4538
Τώρα που έχουμε τα δεδομένα για να καλλιεργήσουμε το υπολογιστικό μας μυαλό,
09:45
we're ready to come back to the algorithms themselves.
153
585954
3737
είμαστε έτοιμοι να ξαναγυρίσουμε στους αλγόριθμους.
09:49
As it turned out, the wealth of information provided by ImageNet
154
589691
5178
Όπως αποδείχθηκε, ο πλούτος πληροφορίας που παρέχεται από το ImageNet
09:54
was a perfect match to a particular class of machine learning algorithms
155
594869
4806
ήταν το τέλειο ταίρι για μια συγκεκριμένη κλάση αλγόριθμων μηχανικής μάθησης
09:59
called convolutional neural network,
156
599675
2415
που ονομάζονται συνελικτικά νευρωνικά δίκτυα,
10:02
pioneered by Kunihiko Fukushima, Geoff Hinton, and Yann LeCun
157
602090
5248
που αναπτύχθηκε απ' τους Τζεφ Χίντον, Κουνιχίκο Φουκοσίμα και Γιάν ΛεΚούν
10:07
back in the 1970s and '80s.
158
607338
3645
στις δεκαετίες του '70 και το '80.
10:10
Just like the brain consists of billions of highly connected neurons,
159
610983
5619
Όπως ο εγκέφαλος αποτελείται από δισεκατομμύρια διασυνδεδεμένους νευρώνες,
10:16
a basic operating unit in a neural network
160
616602
3854
η βασική λειτουργική ενότητα σε ένα νευρωνικό δίκτυο
10:20
is a neuron-like node.
161
620456
2415
είναι ένας κόμβος-νευρώνας.
10:22
It takes input from other nodes
162
622871
2554
Δέχεται σήματα εισόδου από άλλους κόμβους
10:25
and sends output to others.
163
625425
2718
και στέλνει σήματα εξόδου σε άλλους.
10:28
Moreover, these hundreds of thousands or even millions of nodes
164
628143
4713
Επιπλέον, αυτοί οι εκατοντάδες χιλιάδες ή εκατομμύρια κόμβοι
10:32
are organized in hierarchical layers,
165
632856
3227
είναι οργανωμένοι σε ιεραρχικά στρώμματα,
10:36
also similar to the brain.
166
636083
2554
επίσης παρόμοια με αυτά του εγκεφάλου.
10:38
In a typical neural network we use to train our object recognition model,
167
638637
4783
Ένα τυπικό νευρωνικό δίκτυο που χρησιμοποιούμε για να εκπαιδεύσουμε
το μοντέλο αναγνώρισης αντικειμένων, έχει 24 εκατομμύρια κόμβους,
10:43
it has 24 million nodes,
168
643420
3181
10:46
140 million parameters,
169
646601
3297
140 εκατομμύρια παραμέτρους
10:49
and 15 billion connections.
170
649898
2763
και 15 δισεκατομμύρια συνδέσεις.
10:52
That's an enormous model.
171
652661
2415
Είναι ένα τεράστιο μοντέλο.
10:55
Powered by the massive data from ImageNet
172
655076
3901
Ωθούμενο από τα μαζικά δεδομένα του ImageNet
10:58
and the modern CPUs and GPUs to train such a humongous model,
173
658977
5433
και από σύγχρονους μικροεπεξεργαστές για την εκμάθηση αυτού του μοντέλου,
11:04
the convolutional neural network
174
664410
2369
το συνελικτικό νευρωνικό δίκτυο
11:06
blossomed in a way that no one expected.
175
666779
3436
«άνθισε» με τρόπο που κανείς δεν περίμενε.
11:10
It became the winning architecture
176
670215
2508
Έγινε η νικήτρια αρχιτεκτονική
11:12
to generate exciting new results in object recognition.
177
672723
5340
που γέννησε συναρπαστικά αποτελέσματα στην αναγνώριση αντικειμένων.
11:18
This is a computer telling us
178
678063
2810
Αυτός είναι ένας υπολογιστής που μας λέει
11:20
this picture contains a cat
179
680873
2300
ότι αυτή η εικόνα περιέχει μια γάτα
11:23
and where the cat is.
180
683173
1903
και πού βρίσκεται αυτή η γάτα.
Υπάρχουν κι άλλα πράγματα εκτός από γάτες,
11:25
Of course there are more things than cats,
181
685076
2112
11:27
so here's a computer algorithm telling us
182
687188
2438
εδώ ο αλγόριθμος μας λέει
11:29
the picture contains a boy and a teddy bear;
183
689626
3274
ότι η εικόνα περιέχει ένα αγόρι και ένα αρκουδάκι,
11:32
a dog, a person, and a small kite in the background;
184
692900
4366
έναν σκύλο, έναν άνθρωπο και έναν μικρό χαρταετό στο βάθος,
11:37
or a picture of very busy things
185
697266
3135
ή μια εικόνα με πολλά πράγματα
11:40
like a man, a skateboard, railings, a lampost, and so on.
186
700401
4644
όπως ένας άντρας, ένα σκέιτμπορντ, κάγκελα, μια κολώνα και λοιπά.
11:45
Sometimes, when the computer is not so confident about what it sees,
187
705045
5293
Μερικές φορές, όταν ο υπολογιστής δεν είναι και τόσο σίγουρος για το τι βλέπει,
11:51
we have taught it to be smart enough
188
711498
2276
του μάθαμε να είναι αρκετά έξυπνος
11:53
to give us a safe answer instead of committing too much,
189
713774
3878
ώστε να μας δίνει μια ασφαλή απάντηση αντί να δεσμευτεί σε κάτι συγκεκριμένο,
11:57
just like we would do,
190
717652
2811
όπως ακριβώς θα κάναμε και εμείς,
12:00
but other times our computer algorithm is remarkable at telling us
191
720463
4666
και άλλες φορές ο αλγόριθμος είναι τόσο ικανός στο να μας λέει
12:05
what exactly the objects are,
192
725129
2253
ακριβώς τι είναι το κάθε αντικείμενο,
12:07
like the make, model, year of the cars.
193
727382
3436
όπως τη μάρκα, το μοντέλο και τη χρονιά των αυτοκινήτων.
12:10
We applied this algorithm to millions of Google Street View images
194
730818
5386
Εφαρμόσαμε αυτόν τον αλγόριθμο σε εκατομμύρια εικόνες του Google Street View
12:16
across hundreds of American cities,
195
736204
3135
σε εκατοντάδες πόλεις της Αμερικής,
12:19
and we have learned something really interesting:
196
739339
2926
και μάθαμε κάτι πολύ ενδιαφέρον:
12:22
first, it confirmed our common wisdom
197
742265
3320
πρώτον, επιβεβαιώσαμε κάτι που ήταν κοινώς γνωστό
12:25
that car prices correlate very well
198
745585
3290
ότι οι τιμές αυτοκινήτων συσχετίζονται πολύ καλά
12:28
with household incomes.
199
748875
2345
με το εισόδημα των νοικοκυριών.
12:31
But surprisingly, car prices also correlate well
200
751220
4527
Αλλά αναπάντεχα, οι τιμές των αυτοκινήτων επίσης συσχετίζονται καλά
12:35
with crime rates in cities,
201
755747
2300
με την εγκληματικότητα στις πόλεις,
ή με την κατανομή ψήφων ανά ταχυδρομικό κώδικα.
12:39
or voting patterns by zip codes.
202
759007
3963
Μισό λεπτό. Αυτό είναι;
12:44
So wait a minute. Is that it?
203
764060
2206
12:46
Has the computer already matched or even surpassed human capabilities?
204
766266
5153
Ο υπολογιστής έφτασε ή ξεπέρασε τις ανθρώπινες δυνατότητες;
12:51
Not so fast.
205
771419
2138
Όχι τόσο γρήγορα.
12:53
So far, we have just taught the computer to see objects.
206
773557
4923
Μέχρι τώρα, έχουμε μάθει στον υπολογιστή μόνο να βλέπει αντικείμενα.
12:58
This is like a small child learning to utter a few nouns.
207
778480
4644
Είναι σαν ένα μικρό παιδί που μαθαίνει να προφέρει μερικά ουσιαστικά.
13:03
It's an incredible accomplishment,
208
783124
2670
Είναι ένα απίστευτο επίτευγμα,
13:05
but it's only the first step.
209
785794
2460
αλλά είναι μόνο το πρώτο βήμα.
13:08
Soon, another developmental milestone will be hit,
210
788254
3762
Σύντομα, θα έρθουμε σε ένα άλλο ορόσημο της ανάπτυξης,
13:12
and children begin to communicate in sentences.
211
792016
3461
και τα παιδιά αρχίζουν να επικοινωνούν με προτάσεις.
13:15
So instead of saying this is a cat in the picture,
212
795477
4224
Αντί να πει ότι στην εικόνα είναι μια γάτα
13:19
you already heard the little girl telling us this is a cat lying on a bed.
213
799701
5202
ακούσατε ήδη το κοριτσάκι να μας λέει ότι η γάτα είναι ξαπλωμένη στο κρεβάτι.
13:24
So to teach a computer to see a picture and generate sentences,
214
804903
5595
Για να μάθουμε τον υπολογιστή να βλέπει μια εικόνα και να παράγει προτάσεις,
13:30
the marriage between big data and machine learning algorithm
215
810498
3948
ο «γάμος» των μαζικών δεδομένων και των αλγόριθμων μηχανικής μάθησης
13:34
has to take another step.
216
814446
2275
πρέπει να κάνει ένα ακόμα βήμα.
13:36
Now, the computer has to learn from both pictures
217
816721
4156
Τώρα, ο υπολογιστής πρέπει να μάθει από εικόνες
13:40
as well as natural language sentences
218
820877
2856
αλλά και από προτάσεις φυσικού λόγου
13:43
generated by humans.
219
823733
3322
που έχουν παράγει άνθρωποι.
13:47
Just like the brain integrates vision and language,
220
827055
3853
Ακριβώς όπως ο εγκέφαλος ενσωματώνει όραση και γλώσσα,
13:50
we developed a model that connects parts of visual things
221
830908
5201
αναπτύξαμε ένα μοντέλο που συνδέει μέρη οπτικών αντικειμένων,
13:56
like visual snippets
222
836109
1904
σαν οπτικά αποσπάσματα,
13:58
with words and phrases in sentences.
223
838013
4203
με λέξεις και φράσεις προτάσεων.
14:02
About four months ago,
224
842216
2763
Πριν από περίπου τέσσερις μήνες,
14:04
we finally tied all this together
225
844979
2647
συνθέσαμε όλα αυτά τα κομμάτια
14:07
and produced one of the first computer vision models
226
847626
3784
και δημιουργήσαμε ένα από τα πρώτα μοντέλα υπολογιστικής όρασης
14:11
that is capable of generating a human-like sentence
227
851410
3994
ικανό να παράγει φυσικές προτάσεις
14:15
when it sees a picture for the first time.
228
855404
3506
την πρώτη φορά που βλέπει μια εικόνα.
14:18
Now, I'm ready to show you what the computer says
229
858910
4644
Τώρα, είμαι έτοιμη να σας δείξω τι λέει ο υπολογιστής
14:23
when it sees the picture
230
863554
1975
όταν βλέπει την εικόνα
14:25
that the little girl saw at the beginning of this talk.
231
865529
3830
που είδε το κορίτσι στην αρχή της ομιλίας.
14:31
(Video) Computer: A man is standing next to an elephant.
232
871519
3344
(Βίντεο) Υπολογιστής: Ένας άντρας στέκεται δίπλα σε έναν ελέφαντα.
14:36
A large airplane sitting on top of an airport runway.
233
876393
3634
Ένα μεγάλο αεροπλάνο βρίσκεται πάνω σε έναν αεροδιάδρομο.
14:41
FFL: Of course, we're still working hard to improve our algorithms,
234
881057
4212
Φέι-Φέι Λι: Φυσικά, δουλεύουμε σκληρά για να βελτιώσουμε τον αλγόριθμό μας,
14:45
and it still has a lot to learn.
235
885269
2596
και έχει να μάθει ακόμα πολλά.
14:47
(Applause)
236
887865
2291
(Χειροκρότημα)
14:51
And the computer still makes mistakes.
237
891556
3321
Και ο υπολογιστής ακόμα κάνει λάθη.
14:54
(Video) Computer: A cat lying on a bed in a blanket.
238
894877
3391
(Βίντεο) Υπολογιστής: Μια γάτα είναι ξαπλωμένη στο κρεβάτι με μια κουβέρτα.
14:58
FFL: So of course, when it sees too many cats,
239
898268
2553
Φέι-Φέι Λι: Φυσικά, αφού έχει δει τόσες πολλές γάτες,
15:00
it thinks everything might look like a cat.
240
900821
2926
νομίζει ότι τα πάντα μοιάζουν με γάτες.
15:05
(Video) Computer: A young boy is holding a baseball bat.
241
905317
2864
(Βίντεο) Υπολογιστής: Ένα αγόρι κρατάει ένα ρόπαλο του μπέιζμπολ.
15:08
(Laughter)
242
908181
1765
(Γέλια)
15:09
FFL: Or, if it hasn't seen a toothbrush, it confuses it with a baseball bat.
243
909946
4583
ΦΦΛ: Ή αν δεν έχει δει οδοντόβουρτσες τις μπερδεύει με ρόπαλα του μπέιζμπολ.
(Βίντεο) Υπολογιστής: Ένας άντρας ιππεύει ένα άλογο στο δρόμο δίπλα σε ένα κτίριο.
15:15
(Video) Computer: A man riding a horse down a street next to a building.
244
915309
3434
15:18
(Laughter)
245
918743
2023
(Γέλια)
15:20
FFL: We haven't taught Art 101 to the computers.
246
920766
3552
Φέι-Φέι Λι: Δεν έχουμε μάθει στους υπολογιστές τα βασικά για τις τέχνες.
15:25
(Video) Computer: A zebra standing in a field of grass.
247
925768
2884
(Βίντεο) Υπολογιστής: Μια ζέβρα στέκεται σε ένα λιβάδι.
15:28
FFL: And it hasn't learned to appreciate the stunning beauty of nature
248
928652
3367
Φέι-Φέι Λι: Δεν έχει μάθει να εκτιμά την εκπληκτική ομορφιά της φύσης
15:32
like you and I do.
249
932019
2438
όπως εσείς και εγώ.
15:34
So it has been a long journey.
250
934457
2832
Ήταν ένα μεγάλο ταξίδι.
15:37
To get from age zero to three was hard.
251
937289
4226
Το να πάμε από τις ηλικίες 0 μέχρι 3 ήταν δύσκολο.
15:41
The real challenge is to go from three to 13 and far beyond.
252
941515
5596
Η πραγματική πρόκληση είναι να πάμε από τα 3 στα 13 και παραπέρα.
15:47
Let me remind you with this picture of the boy and the cake again.
253
947111
4365
Θέλω να σας υπενθυμήσω με αυτή την εικόνα του παιδιού και της τούρτας.
15:51
So far, we have taught the computer to see objects
254
951476
4064
Μέχρι τώρα, έχουμε διδάξει τον υπολογιστή να βλέπει αντικείμενα
15:55
or even tell us a simple story when seeing a picture.
255
955540
4458
και ακόμα να μπορεί να μας πει μια ιστορία όταν βλέπει μια εικόνα.
15:59
(Video) Computer: A person sitting at a table with a cake.
256
959998
3576
(Βίντεο) Υπολογιστής: Κάποιος κάθεται σε ένα τραπέζι με ένα κέικ.
16:03
FFL: But there's so much more to this picture
257
963574
2630
ΦΦΛ: Άλλα υπάρχουν κι άλλα πράγματα σε αυτή την εικόνα
16:06
than just a person and a cake.
258
966204
2270
εκτός από τον άνθρωπο και το κέικ.
16:08
What the computer doesn't see is that this is a special Italian cake
259
968474
4467
Αυτό που δεν βλέπει ο υπολογιστής είναι ότι αυτό είναι ένα ειδικό ιταλικό κέικ
16:12
that's only served during Easter time.
260
972941
3217
που σερβίρεται μόνο κατά την περίοδο του Πάσχα.
16:16
The boy is wearing his favorite t-shirt
261
976158
3205
Το αγόρι φοράει την αγαπημένη του μπλούζα
16:19
given to him as a gift by his father after a trip to Sydney,
262
979363
3970
που του την έφερε ο πατέρας του από ένα ταξίδι στο Σίδνεϊ,
16:23
and you and I can all tell how happy he is
263
983333
3808
και εμείς μπορούμε να δούμε πόσο χαρούμενο είναι
16:27
and what's exactly on his mind at that moment.
264
987141
3203
και τι ακριβώς σκέφτεται αυτή τη στιγμή.
16:31
This is my son Leo.
265
991214
3125
Αυτός είναι ο γιος μου, ο Λέο.
16:34
On my quest for visual intelligence,
266
994339
2624
Στην αναζήτησή μου για οπτική νοημοσύνη
16:36
I think of Leo constantly
267
996963
2391
σκέφτομαι τον Λέο συνέχεια
16:39
and the future world he will live in.
268
999354
2903
και τον μελλοντικό κόσμο στον οποίο θα ζήσει.
16:42
When machines can see,
269
1002257
2021
Όταν οι μηχανές θα μπορούν να δουν,
16:44
doctors and nurses will have extra pairs of tireless eyes
270
1004278
4712
οι γιατροί και νοσοκόμοι θα έχουν ένα ζευγάρι ακούραστα μάτια
16:48
to help them to diagnose and take care of patients.
271
1008990
4092
να τους βοηθάνε να διαγνώσουν και να φροντίσουν τους ασθενείς τους.
16:53
Cars will run smarter and safer on the road.
272
1013082
4383
Τα αυτοκίνητα θα οδηγούν πιο έξυπνα και πιο ασφαλή στο δρόμο.
16:57
Robots, not just humans,
273
1017465
2694
Ρομπότ, όχι μόνο άνθρωποι,
17:00
will help us to brave the disaster zones to save the trapped and wounded.
274
1020159
4849
θα μας βοηθάνε σε ζώνες καταστροφής να σώσουμε εγκλωβισμένους και τραυματίες.
17:05
We will discover new species, better materials,
275
1025798
3796
Θα ανακαλύψουμε καινούργια είδη, καλύτερα υλικά,
17:09
and explore unseen frontiers with the help of the machines.
276
1029594
4509
και θα εξερευνήσουμε αόρατα σύνορα με τη βοήθεια των μηχανών.
17:15
Little by little, we're giving sight to the machines.
277
1035113
4167
Σιγά-σιγά δίνουμε όραση στις μηχανές.
17:19
First, we teach them to see.
278
1039280
2798
Πρώτα, θα τους μάθουμε να βλέπουν.
17:22
Then, they help us to see better.
279
1042078
2763
Μετά, θα μας βοηθήσουν να δούμε καλύτερα.
17:24
For the first time, human eyes won't be the only ones
280
1044841
4165
Για πρώτη φορά, τα ανθρώπινα μάτια δεν θα είναι τα μόνα
17:29
pondering and exploring our world.
281
1049006
2934
που μελετούν και εξερευνούν τον κόσμο.
17:31
We will not only use the machines for their intelligence,
282
1051940
3460
Δεν θα χρησιμοποιούμε τις μηχανές μόνο για τη νοημοσύνη τους,
17:35
we will also collaborate with them in ways that we cannot even imagine.
283
1055400
6179
θα συνεργαζόμαστε με τρόπους που δεν μπορούμε να φανταστούμε.
17:41
This is my quest:
284
1061579
2161
Αυτός είναι ο στόχος μου:
17:43
to give computers visual intelligence
285
1063740
2712
να δώσω στους υπολογιστές οπτική νοημοσύνη
17:46
and to create a better future for Leo and for the world.
286
1066452
5131
και να φτιάξω ένα καλύτερο μέλλον για τον Λέο και για τον κόσμο.
17:51
Thank you.
287
1071583
1811
Σας ευχαριστώ.
17:53
(Applause)
288
1073394
3785
(Χειροκρότημα)
Σχετικά με αυτόν τον ιστότοπο

Αυτός ο ιστότοπος θα σας παρουσιάσει βίντεο στο YouTube που είναι χρήσιμα για την εκμάθηση της αγγλικής γλώσσας. Θα δείτε μαθήματα αγγλικών που διδάσκουν κορυφαίοι καθηγητές από όλο τον κόσμο. Κάντε διπλό κλικ στους αγγλικούς υπότιτλους που εμφανίζονται σε κάθε σελίδα βίντεο για να αναπαράγετε το βίντεο από εκεί. Οι υπότιτλοι μετακινούνται συγχρονισμένα με την αναπαραγωγή του βίντεο. Εάν έχετε οποιαδήποτε σχόλια ή αιτήματα, παρακαλούμε επικοινωνήστε μαζί μας χρησιμοποιώντας αυτή τη φόρμα επικοινωνίας.

https://forms.gle/WvT1wiN1qDtmnspy7