How computers translate human language - Ioannis Papachimonas

423,721 views ・ 2015-10-26

TED-Ed


Please double-click on the English subtitles below to play the video.

Prevodilac: Tijana Mihajlović Lektor: Ivana Krivokuća
00:06
How is it that so many intergalactic species in movies and TV
0
6677
4629
Како то да толико интергалактичких врста у филмовима и на телевизији
00:11
just happen to speak perfect English?
1
11306
3177
савршено говори енглески језик?
00:14
The short answer is that no one wants to watch a starship crew
2
14483
3403
Одговор укратко је да нико не жели да гледа посаду свемирског брода
00:17
spend years compiling an alien dictionary.
3
17886
3888
како проводи године у састављању ванземаљског речника.
00:21
But to keep things consistent,
4
21774
1618
Ипак, да би ствари остале складне,
00:23
the creators of Star Trek and other science-fiction worlds
5
23392
3397
творци „Звезданих стаза“ и других научнофантастичних светова
00:26
have introduced the concept of a universal translator,
6
26789
3725
представили су концепт универзалног преводиоца,
00:30
a portable device that can instantly translate between any languages.
7
30514
4498
преносног уређаја који истог тренутка може да преводи било који језик.
00:35
So is a universal translator possible in real life?
8
35012
3527
Па, да ли је универзални преводилац могућ у стварном животу?
00:38
We already have many programs that claim to do just that,
9
38539
3598
Већ имамо многе програме који тврде да раде управо то -
да узимају реч, реченицу или целу књигу на једном језику
00:42
taking a word, sentence, or entire book in one language
10
42137
3817
00:45
and translating it into almost any other,
11
45954
3050
и преводе је на скоро сваки други језик,
било да је у питању модерни енглески или древни санскрит.
00:49
whether it's modern English or Ancient Sanskrit.
12
49004
3333
00:52
And if translation were just a matter of looking up words in a dictionary,
13
52337
3576
Када би се преводи сводили на пуко тражење речи у речнику,
00:55
these programs would run circles around humans.
14
55913
3912
ови програми би далеко надмашили људе.
00:59
The reality, however, is a bit more complicated.
15
59825
3474
Стварност је, међутим, малчице компликованија.
Преводилачки програм заснован на правилима користи лексичку базу података
01:03
A rule-based translation program uses a lexical database,
16
63299
4050
01:07
which includes all the words you'd find in a dictionary
17
67349
2953
која укључује све речи које се могу наћи у речнику
01:10
and all grammatical forms they can take,
18
70302
2981
и све граматичке облике које могу попримити,
01:13
and set of rules to recognize the basic linguistic elements in the input language.
19
73283
5642
као и скуп правила за препознавање
основних лингвистичких елемената из улазног језика.
01:18
For a seemingly simple sentence like, "The children eat the muffins,"
20
78925
3471
За наизглед једноставну реченицу као што је „Деца једу мафине“,
01:22
the program first parses its syntax, or grammatical structure,
21
82396
4654
програм прво рашчлањује њену синтаксу или граматичку структуру
тако што препознаје реч „деца“ као субјекат,
01:27
by identifying the children as the subject,
22
87050
2537
01:29
and the rest of the sentence as the predicate
23
89587
2730
а остатак реченице као предикат,
01:32
consisting of a verb "eat,"
24
92317
2051
који се састоји од глагола „јести“
01:34
and a direct object "the muffins."
25
94368
3054
и директног објекта, „мафине“.
01:37
It then needs to recognize English morphology,
26
97422
2827
Затим треба да препозна енглеску морфологију
01:40
or how the language can be broken down into its smallest meaningful units,
27
100249
4432
или како се језик може разложити на мање значењске јединице,
01:44
such as the word muffin
28
104681
1443
као што је реч „мафин“
01:46
and the suffix "s," used to indicate plural.
29
106124
3631
и енглески суфикс „с“, који се користи за означавање множине.
01:49
Finally, it needs to understand the semantics,
30
109755
2694
На крају, потребно је да разуме семантику,
01:52
what the different parts of the sentence actually mean.
31
112449
3729
то јест, шта различити делови реченице заиста значе.
Да би превео ову реченицу ваљано,
01:56
To translate this sentence properly,
32
116178
1896
програм ће се ослонити на различите скупове речника и правила
01:58
the program would refer to a different set of vocabulary and rules
33
118074
3908
02:01
for each element of the target language.
34
121982
3184
за сваки елемент циљног језика.
Међутим, овде ствари постају компликоване.
02:05
But this is where it gets tricky.
35
125166
1854
Синтакса неких језика дозвољава
02:07
The syntax of some languages allows words to be arranged in any order,
36
127020
4800
да речи буду распоређене на било који начин,
02:11
while in others, doing so could make the muffin eat the child.
37
131820
5134
док би код других, на тај начин, мафин јео дете.
02:16
Morphology can also pose a problem.
38
136954
2693
Морфологија, такође, може представљати проблем.
02:19
Slovene distinguishes between two children and three or more
39
139647
3596
Словеначки језик прави разлику између двоје и троје деце,
користећи двојни суфикс који не постоји у многим другим језицима,
02:23
using a dual suffix absent in many other languages,
40
143243
3854
док вас непостојање одређених чланова у руском може оставити са питањем
02:27
while Russian's lack of definite articles might leave you wondering
41
147097
3435
02:30
whether the children are eating some particular muffins,
42
150532
3043
да ли деца једу неке посебне мафине
02:33
or just eat muffins in general.
43
153575
3144
или једу мафине уопште.
02:36
Finally, even when the semantics are technically correct,
44
156719
2989
Коначно, чак и када је семантика технички тачна,
02:39
the program might miss their finer points,
45
159708
3049
програм може испустити финесе,
02:42
such as whether the children "mangiano" the muffins,
46
162757
3052
као што су да ли деца једу мафине
02:45
or "divorano" them.
47
165809
1985
или их прождиру (на италијанском).
02:47
Another method is statistical machine translation,
48
167794
3764
Још један метод је статистички машински превод,
02:51
which analyzes a database of books, articles, and documents
49
171558
4204
који анализира базу података књига, чланака и докумената
02:55
that have already been translated by humans.
50
175762
3726
које су људи већ превели.
02:59
By finding matches between source and translated text
51
179488
3471
Проналажењем подударности између извора и преведеног текста
03:02
that are unlikely to occur by chance,
52
182959
2434
које се ретко случајно јављају,
03:05
the program can identify corresponding phrases and patterns,
53
185393
3952
програм може да препозна одговарајуће фразе и обрасце
03:09
and use them for future translations.
54
189345
3084
и да их користи за будуће преводе.
03:12
However, the quality of this type of translation
55
192429
2540
Међутим, квалитет оваквог превођења
03:14
depends on the size of the initial database
56
194969
2721
зависи од опширности почетне базе података,
03:17
and the availability of samples for certain languages
57
197690
3667
као и доступности узорака за одређене језике
03:21
or styles of writing.
58
201357
2026
или стилова писања.
03:23
The difficulty that computers have with the exceptions, irregularities
59
203383
3757
Потешкоће које компјутери имају везане за изузетке, неправилности
03:27
and shades of meaning that seem to come instinctively to humans
60
207140
3854
и нијансе у значењу за које се чини да су људима урођене
03:30
has led some researchers to believe that our understanding of language
61
210994
4051
навеле су неке истраживаче да поверују да је наше разумевање језика
03:35
is a unique product of our biological brain structure.
62
215045
4206
јединствени производ наше биолошке мождане структуре.
Заправо, један од најпознатијих фиктивних универзалних преводилаца,
03:39
In fact, one of the most famous fictional universal translators,
63
219251
3850
03:43
the Babel fish from "The Hitchhiker's Guide to the Galaxy",
64
223101
3338
вавилонска рибица из „Аутостоперског водича кроз галаксију“
03:46
is not a machine at all but a small creature
65
226439
3287
није уопште машина, већ мало створење које преводи
03:49
that translates the brain waves and nerve signals of sentient species
66
229726
4484
мождане таласе и нервне сигнале врста које осећају надржаје
03:54
through a form of telepathy.
67
234210
2795
кроз облик телепатије.
За сада, учење језика на старомодан начин
03:57
For now, learning a language the old fashioned way
68
237005
2721
03:59
will still give you better results than any currently available computer program.
69
239726
5380
даће вам боље резултате него било који тренутно доступан програм.
Међутим, ово није лак задатак,
04:05
But this is no easy task,
70
245106
1643
04:06
and the sheer number of languages in the world,
71
246749
2265
а бројност светских језика,
04:09
as well as the increasing interaction between the people who speak them,
72
249014
3975
као и повећана интеракција између људи који их користе
04:12
will only continue to spur greater advances in automatic translation.
73
252989
5015
само ће наставити да подстичу развој аутоматског превођења.
04:18
Perhaps by the time we encounter intergalactic life forms,
74
258004
3405
Можда ћемо, када се будемо срели са интергалактичким животним облицима,
04:21
we'll be able to communicate with them through a tiny gizmo,
75
261409
3251
моћи да комуницирамо са њима кроз малену направу,
04:24
or we might have to start compiling that dictionary, after all.
76
264660
4366
или ћемо можда ипак морати да започнемо састављање оног речника.
About this website

This site will introduce you to YouTube videos that are useful for learning English. You will see English lessons taught by top-notch teachers from around the world. Double-click on the English subtitles displayed on each video page to play the video from there. The subtitles scroll in sync with the video playback. If you have any comments or requests, please contact us using this contact form.

https://forms.gle/WvT1wiN1qDtmnspy7