How computers translate human language - Ioannis Papachimonas

418,908 views ・ 2015-10-26

TED-Ed


Κάντε διπλό κλικ στους αγγλικούς υπότιτλους παρακάτω για να αναπαραγάγετε το βίντεο.

Μετάφραση: Panagiota Prokopi Επιμέλεια: Ioannis Papacheimonas
00:06
How is it that so many intergalactic species in movies and TV
0
6677
4629
Πώς γίνεται όλα τα διαγαλαξιακά είδη στις ταινίες και στην τηλεόραση
00:11
just happen to speak perfect English?
1
11306
3177
να μιλούν τέλεια αγγλικά;
Μια γρήγορη απάντηση είναι πως δεν θα είχε ενδιαφέρον μια ταινία
00:14
The short answer is that no one wants to watch a starship crew
2
14483
3403
00:17
spend years compiling an alien dictionary.
3
17886
3888
όπου το διαστημικό πλήρωμα θα περνούσε αιώνες συντάσσοντας εξωγήινο λεξικό.
00:21
But to keep things consistent,
4
21774
1618
Αλλά για να είμαστε ακριβείς,
00:23
the creators of Star Trek and other science-fiction worlds
5
23392
3397
οι δημιουργοί του Σταρ Τρεκ και άλλων κόσμων επιστημονικής φαντασίας
00:26
have introduced the concept of a universal translator,
6
26789
3725
εισήγαγαν την ιδέα ενός καθολικού μεταφραστή,
00:30
a portable device that can instantly translate between any languages.
7
30514
4498
μιας φορητής συσκευής που μπορεί στη στιγμή να μεταφράσει όλες τις γλώσσες.
Επομένως, γίνεται να υπάρξει αληθινά ένας καθολικός μεταφραστής;
00:35
So is a universal translator possible in real life?
8
35012
3527
00:38
We already have many programs that claim to do just that,
9
38539
3598
Ήδη έχουμε πολλά προγράμματα που ισχυρίζονται ότι αυτό ακριβώς κάνουν,
00:42
taking a word, sentence, or entire book in one language
10
42137
3817
μεταφράζουν μια λέξη, μια πρόταση, ένα ολόκληρο βιβλίο από μια γλώσσα
00:45
and translating it into almost any other,
11
45954
3050
σχεδόν σε όλες τις υπόλοιπες,
00:49
whether it's modern English or Ancient Sanskrit.
12
49004
3333
είτε πρόκειται για σύγχρονα αγγλικά είτε για αρχαία σανσκριτικά.
00:52
And if translation were just a matter of looking up words in a dictionary,
13
52337
3576
Αν η μετάφραση αφορούσε μόνο την αναζήτηση λέξεων στο λεξικό,
00:55
these programs would run circles around humans.
14
55913
3912
θα ήταν παιχνιδάκι για αυτά τα προγράμματα.
00:59
The reality, however, is a bit more complicated.
15
59825
3474
Η πραγματικότητα ωστόσο, είναι λίγο πιο περίπλοκη.
Ένα μεταφραστικό πρόγραμμα χρησιμοποιεί μια λεξικολογική βάση δεδομένων,
01:03
A rule-based translation program uses a lexical database,
16
63299
4050
01:07
which includes all the words you'd find in a dictionary
17
67349
2953
που περιλαμβάνει όλες τις λέξεις που υπάρχουν σε ένα λεξικό,
01:10
and all grammatical forms they can take,
18
70302
2981
όλους τους γραμματικούς τύπους των λέξεων της γλώσσας εισαγωγής,
01:13
and set of rules to recognize the basic linguistic elements in the input language.
19
73283
5642
και ένα σύνολο κανόνων που αναγνωρίζουν τα στοιχειώδη γλωσσικά στοιχεία της.
01:18
For a seemingly simple sentence like, "The children eat the muffins,"
20
78925
3471
Σε μια φαινομενικά απλή πρόταση όπως: «Τα παιδιά τρώνε τα μάφιν»,
01:22
the program first parses its syntax, or grammatical structure,
21
82396
4654
το πρόγραμμα πρώτα θα εντοπίσει τη σύνταξη ή τη γραμματική δομή,
01:27
by identifying the children as the subject,
22
87050
2537
αναγνωρίζοντας τα παιδιά ως το υποκείμενο,
01:29
and the rest of the sentence as the predicate
23
89587
2730
και την υπόλοιπη πρόταση ως κατηγόρημα
01:32
consisting of a verb "eat,"
24
92317
2051
που αποτελείται από το ρήμα «τρώω»,
01:34
and a direct object "the muffins."
25
94368
3054
και το άμεσο αντικείμενο «τα μάφιν».
01:37
It then needs to recognize English morphology,
26
97422
2827
Έπειτα πρέπει να αναγνωρίσει την αγγλική μορφολογία,
01:40
or how the language can be broken down into its smallest meaningful units,
27
100249
4432
ή το πως η γλώσσα αναλύεται στις ελάχιστες νοηματικές ενότητές της,
01:44
such as the word muffin
28
104681
1443
όπως τη λέξη «μάφιν»
01:46
and the suffix "s," used to indicate plural.
29
106124
3631
και την κατάληξη «-s» που δηλώνει τον πληθυντικό.
01:49
Finally, it needs to understand the semantics,
30
109755
2694
Τέλος, επεξεργάζεται τη σημασιολογία,
01:52
what the different parts of the sentence actually mean.
31
112449
3729
το τι πράγματι σημαίνουν τα μέρη της πρότασης.
01:56
To translate this sentence properly,
32
116178
1896
Για να μεταφραστεί η πρόταση σωστά,
01:58
the program would refer to a different set of vocabulary and rules
33
118074
3908
το πρόγραμμα θα αναζητήσει σε άλλο σύνολο λεξιλογικών όρων και κανόνων
02:01
for each element of the target language.
34
121982
3184
το κάθε στοιχείο της γλώσσας προς μετάφραση.
02:05
But this is where it gets tricky.
35
125166
1854
Αλλά εδώ γίνεται περίπλοκο.
02:07
The syntax of some languages allows words to be arranged in any order,
36
127020
4800
Το συντακτικό ορισμένων γλωσσών επιτρέπει κάθε γλωσσικό συνδυασμό
02:11
while in others, doing so could make the muffin eat the child.
37
131820
5134
ενώ σε άλλες, κάποιοι συνδυασμοί θα έκαναν τα μάφιν να τρώνε τα παιδιά.
02:16
Morphology can also pose a problem.
38
136954
2693
Η μορφολογία επίσης αποτελεί πρόβλημα.
02:19
Slovene distinguishes between two children and three or more
39
139647
3596
Τα σλοβένικα διακρίνουν τα δύο από τα τρία παιδιά ή περισσότερα παιδιά
02:23
using a dual suffix absent in many other languages,
40
143243
3854
προσθέτοντας ένα δυϊκό επίθημα που απουσιάζει από πολλές άλλες γλώσσες,
02:27
while Russian's lack of definite articles might leave you wondering
41
147097
3435
ενώ η απουσία οριστικών άρθρων στα ρώσικα θα σας κάνει να αναρωτιέστε
02:30
whether the children are eating some particular muffins,
42
150532
3043
αν τα παιδιά τρώνε κάποια συγκεκριμένα μάφιν
02:33
or just eat muffins in general.
43
153575
3144
ή αν γενικά τρώνε μάφιν.
02:36
Finally, even when the semantics are technically correct,
44
156719
2989
Εν κατακλείδι, ακόμα και αν η σημασιολογία είναι τεχνικά ορθή,
02:39
the program might miss their finer points,
45
159708
3049
το πρόγραμμα ίσως σφάλει σε λεπτότερες έννοιες,
02:42
such as whether the children "mangiano" the muffins,
46
162757
3052
όπως αν τα παιδιά «τρώνε» τα μάφιν
02:45
or "divorano" them.
47
165809
1985
ή αν τα «καταβροχθίζουν».
02:47
Another method is statistical machine translation,
48
167794
3764
Ένας άλλος τρόπος είναι η στατική μηχανική μετάφραση,
02:51
which analyzes a database of books, articles, and documents
49
171558
4204
η οποία αναλύει μια βάση δεδομένων από βιβλία, άρθρα και έγγραφα
02:55
that have already been translated by humans.
50
175762
3726
που έχουν ήδη μεταφραστεί από ανθρώπους.
02:59
By finding matches between source and translated text
51
179488
3471
Εντοπίζοντας ζεύγη μεταξύ αρχικού και μεταφρασμένου κειμένου
03:02
that are unlikely to occur by chance,
52
182959
2434
που είναι απίθανο να εμφανίστηκαν τυχαία,
03:05
the program can identify corresponding phrases and patterns,
53
185393
3952
το πρόγραμμα μπορεί να αναγνωρίσει αντιστοιχίες φράσεων και δομών,
03:09
and use them for future translations.
54
189345
3084
και τα χρησιμοποιεί σε μελλοντικές μεταφράσεις.
03:12
However, the quality of this type of translation
55
192429
2540
Όπως και να έχει, η ποιότητα αυτών των μεταφράσεων
03:14
depends on the size of the initial database
56
194969
2721
εξαρτάται από το μέγεθος της αρχικής βάσης δεδομένων
03:17
and the availability of samples for certain languages
57
197690
3667
και τη διαθεσιμότητα δειγμάτων μετάφρασης των διαφόρων γλωσσών
03:21
or styles of writing.
58
201357
2026
ή του ύφους γραφής.
03:23
The difficulty that computers have with the exceptions, irregularities
59
203383
3757
Η δυσκολία που έχουν οι μηχανές να αποδώσουν εξαιρέσεις, ανωμαλίες,
03:27
and shades of meaning that seem to come instinctively to humans
60
207140
3854
και τα αποχρώντα νοήματα που ενστικτωδώς κατανοούν οι άνθρωποι,
03:30
has led some researchers to believe that our understanding of language
61
210994
4051
έχει πείσει μερικούς ερευνητές πως η γλωσσική μας κατανόηση
03:35
is a unique product of our biological brain structure.
62
215045
4206
είναι μοναδικό προϊόν της βιολογικής εγκεφαλικής μας δομής.
03:39
In fact, one of the most famous fictional universal translators,
63
219251
3850
Ένας από τους διασημότερους φανταστικούς καθολικούς μεταφραστές,
03:43
the Babel fish from "The Hitchhiker's Guide to the Galaxy",
64
223101
3338
το «Babel Fish» της σειράς: «Γυρίστε τον γαλαξία με ωτοστόπ»,
03:46
is not a machine at all but a small creature
65
226439
3287
δεν είναι καν μηχάνημα αλλά ένα πλασματάκι
03:49
that translates the brain waves and nerve signals of sentient species
66
229726
4484
που μεταφράζει τα εγκεφαλικά κύματα και νευρικά σήματα νοήμονων ειδών
03:54
through a form of telepathy.
67
234210
2795
μέσω ενός είδους τηλεπάθειας.
03:57
For now, learning a language the old fashioned way
68
237005
2721
Προς στιγμήν, η εκμάθηση μιας γλώσσας με τον παραδοσιακό τρόπο
03:59
will still give you better results than any currently available computer program.
69
239726
5380
εξακολουθεί να αποδίδει καλύτερα από κάθε διαθέσιμο λογισμικό.
Αλλά αυτό δεν είναι εύκολο,
04:05
But this is no easy task,
70
245106
1643
04:06
and the sheer number of languages in the world,
71
246749
2265
καθώς μόνο ο τεράστιος αριθμός των γλωσσών στον κόσμο,
04:09
as well as the increasing interaction between the people who speak them,
72
249014
3975
καθώς και η διαρκής αλληλεπίδραση των ομιλητών τους,
04:12
will only continue to spur greater advances in automatic translation.
73
252989
5015
θα επιφέρουν μεγάλες εξελίξεις στην αυτόματη μετάφραση.
04:18
Perhaps by the time we encounter intergalactic life forms,
74
258004
3405
Μπορεί μέχρι να συναντήσουμε διαγαλαξιακά όντα,
04:21
we'll be able to communicate with them through a tiny gizmo,
75
261409
3251
να μπορούμε να επικοινωνήσουμε μαζί τους με μια μικρή συσκευή,
04:24
or we might have to start compiling that dictionary, after all.
76
264660
4366
ή μπορούμε, εναλλακτικά, να αρχίσουμε να συντάσσουμε το λεξικό της γλώσσας τους.
Σχετικά με αυτόν τον ιστότοπο

Αυτός ο ιστότοπος θα σας παρουσιάσει βίντεο στο YouTube που είναι χρήσιμα για την εκμάθηση της αγγλικής γλώσσας. Θα δείτε μαθήματα αγγλικών που διδάσκουν κορυφαίοι καθηγητές από όλο τον κόσμο. Κάντε διπλό κλικ στους αγγλικούς υπότιτλους που εμφανίζονται σε κάθε σελίδα βίντεο για να αναπαράγετε το βίντεο από εκεί. Οι υπότιτλοι μετακινούνται συγχρονισμένα με την αναπαραγωγή του βίντεο. Εάν έχετε οποιαδήποτε σχόλια ή αιτήματα, παρακαλούμε επικοινωνήστε μαζί μας χρησιμοποιώντας αυτή τη φόρμα επικοινωνίας.

https://forms.gle/WvT1wiN1qDtmnspy7