How computers translate human language - Ioannis Papachimonas

Как компютрите превеждат човешкия език? - Йоанис Папахимонас

423,128 views

2015-10-26 ・ TED-Ed


New videos

How computers translate human language - Ioannis Papachimonas

Как компютрите превеждат човешкия език? - Йоанис Папахимонас

423,128 views ・ 2015-10-26

TED-Ed


Моля, кликнете два пъти върху английските субтитри по-долу, за да пуснете видеото.

Translator: Tereza Stoyanova Reviewer: Anton Hikov
00:06
How is it that so many intergalactic species in movies and TV
0
6677
4629
Как така всички междугалактични видове във филмите и по телевизията
00:11
just happen to speak perfect English?
1
11306
3177
говорят перфектен английски език?
00:14
The short answer is that no one wants to watch a starship crew
2
14483
3403
Накратко, никой не иска да гледа как екипаж на космически кораб
00:17
spend years compiling an alien dictionary.
3
17886
3888
прекарва години да съставя речник за извънземни.
00:21
But to keep things consistent,
4
21774
1618
За да е достоверно,
00:23
the creators of Star Trek and other science-fiction worlds
5
23392
3397
създателите на "Стар Трек", и на други научнофантастични светове,
00:26
have introduced the concept of a universal translator,
6
26789
3725
въвеждат концепцията за универсален преводач,
00:30
a portable device that can instantly translate between any languages.
7
30514
4498
преносимо устройство, което превежда от всеки език на момента.
00:35
So is a universal translator possible in real life?
8
35012
3527
Може ли реално да съществува такъв универсален преводач?
00:38
We already have many programs that claim to do just that,
9
38539
3598
Вече имаме много програми, които претендират, че правят това -
00:42
taking a word, sentence, or entire book in one language
10
42137
3817
вземат дума, изречение или цяла книга на един език
00:45
and translating it into almost any other,
11
45954
3050
и я превеждат на почти всеки друг език,
00:49
whether it's modern English or Ancient Sanskrit.
12
49004
3333
независимо дали е на съвременен английски, или на древен санскрит.
00:52
And if translation were just a matter of looking up words in a dictionary,
13
52337
3576
Ако преводът беше просто проверка на думи в речника,
00:55
these programs would run circles around humans.
14
55913
3912
тези програми със сигурност ще надминат хората.
00:59
The reality, however, is a bit more complicated.
15
59825
3474
Реалността обаче е малко по-сложна.
01:03
A rule-based translation program uses a lexical database,
16
63299
4050
Програмата за машинен превод, базиран на правила, ползва база с лексика,
01:07
which includes all the words you'd find in a dictionary
17
67349
2953
която включва всички думи, които бихте намерили в речник,
01:10
and all grammatical forms they can take,
18
70302
2981
и всичките им възможни граматични форми,
01:13
and set of rules to recognize the basic linguistic elements in the input language.
19
73283
5642
плюс редица от правила за разпознаване на базови езикови елементи в изходния език.
01:18
For a seemingly simple sentence like, "The children eat the muffins,"
20
78925
3471
За на пръв поглед просто изречение като: "Децата ядат кексчетата",
01:22
the program first parses its syntax, or grammatical structure,
21
82396
4654
програмата първо анализира синтаксиса, или граматическата структура,
01:27
by identifying the children as the subject,
22
87050
2537
като разпознава "децата" като подлога,
01:29
and the rest of the sentence as the predicate
23
89587
2730
а останалата част от изречението като сказуемото,
01:32
consisting of a verb "eat,"
24
92317
2051
състоящо се от глагола "ядат"
01:34
and a direct object "the muffins."
25
94368
3054
и прякото допълнение "кексчетата".
01:37
It then needs to recognize English morphology,
26
97422
2827
След това разпознава морфологията на английския език -
01:40
or how the language can be broken down into its smallest meaningful units,
27
100249
4432
тоест как езикът се разбива на най-малките си смислови частици.
01:44
such as the word muffin
28
104681
1443
Например, при думата "кекс",
01:46
and the suffix "s," used to indicate plural.
29
106124
3631
където наставката "и" показва множественото число.
01:49
Finally, it needs to understand the semantics,
30
109755
2694
Най-накрая, трябва да разбере семантиката,
01:52
what the different parts of the sentence actually mean.
31
112449
3729
тоест какво означават различните части на изречението.
01:56
To translate this sentence properly,
32
116178
1896
За да преведе правилно това изречение,
01:58
the program would refer to a different set of vocabulary and rules
33
118074
3908
програмата ще използва набор от думи и правила
02:01
for each element of the target language.
34
121982
3184
за всеки един елемент от целевия език.
02:05
But this is where it gets tricky.
35
125166
1854
Точно тук става сложно.
02:07
The syntax of some languages allows words to be arranged in any order,
36
127020
4800
Синтаксисът на някои езици позволява думите да местят мястото си в изречението.
02:11
while in others, doing so could make the muffin eat the child.
37
131820
5134
При други езици, разместването ще доведе до това, че кексчето ще изяде детето.
02:16
Morphology can also pose a problem.
38
136954
2693
Морфологията също може да е проблем.
02:19
Slovene distinguishes between two children and three or more
39
139647
3596
Словенският език разграничава думи за две, три или повече деца,
02:23
using a dual suffix absent in many other languages,
40
143243
3854
използвайки наставка за двойствено число, която липсва в много други езици.
02:27
while Russian's lack of definite articles might leave you wondering
41
147097
3435
Руският език няма определителен член, което ще ви накара да се чудите
02:30
whether the children are eating some particular muffins,
42
150532
3043
дали децата ядат точно определени кексчета,
02:33
or just eat muffins in general.
43
153575
3144
или по принцип обичат да ядат кексчета.
02:36
Finally, even when the semantics are technically correct,
44
156719
2989
Накрая, дори семантиката да е технически правилна,
02:39
the program might miss their finer points,
45
159708
3049
програмата може да пропусне по-фините моменти,
02:42
such as whether the children "mangiano" the muffins,
46
162757
3052
като например дали децата "ядат" кексчетата,
02:45
or "divorano" them.
47
165809
1985
или ги "поглъщат" лакомо.
02:47
Another method is statistical machine translation,
48
167794
3764
Друг метод е статистическият машинен превод,
02:51
which analyzes a database of books, articles, and documents
49
171558
4204
при който се анализира база от книги, статии и документи,
02:55
that have already been translated by humans.
50
175762
3726
които вече са били преведени от хора.
02:59
By finding matches between source and translated text
51
179488
3471
Като намира съвпадения между изходния и преведения текст,
03:02
that are unlikely to occur by chance,
52
182959
2434
които трудно биха се комбинирали случайно,
03:05
the program can identify corresponding phrases and patterns,
53
185393
3952
програмата идентифицира съответните фрази и модели
03:09
and use them for future translations.
54
189345
3084
и ги използва при бъдещи преводи.
03:12
However, the quality of this type of translation
55
192429
2540
Качеството на този вид преводи
03:14
depends on the size of the initial database
56
194969
2721
зависи от големината на първоначалната база данни,
03:17
and the availability of samples for certain languages
57
197690
3667
от количеството модели за всеки език,
03:21
or styles of writing.
58
201357
2026
както и от стиловете на писане.
03:23
The difficulty that computers have with the exceptions, irregularities
59
203383
3757
Трудностите, които компютрите изпитват с изключенията, неправилните форми
03:27
and shades of meaning that seem to come instinctively to humans
60
207140
3854
и нюансите в значението, хората долавят несъзнателно.
03:30
has led some researchers to believe that our understanding of language
61
210994
4051
Това кара учените да вярват, че начинът, по който разбираме езика,
03:35
is a unique product of our biological brain structure.
62
215045
4206
е уникален продукт на биологичната структура на мозъка.
03:39
In fact, one of the most famous fictional universal translators,
63
219251
3850
Всъщност, един от най-известните универсални преводачи -
03:43
the Babel fish from "The Hitchhiker's Guide to the Galaxy",
64
223101
3338
Вавилонската рибка от "Пътеводител на галактическия стопаджия"
03:46
is not a machine at all but a small creature
65
226439
3287
изобщо не е машина, а малко същество,
03:49
that translates the brain waves and nerve signals of sentient species
66
229726
4484
което "превежда" мисловните вълни и сигналите от нервите на мислещите видове
03:54
through a form of telepathy.
67
234210
2795
чрез форма на телепатия.
03:57
For now, learning a language the old fashioned way
68
237005
2721
Засега ученето на език по старомодния начин
03:59
will still give you better results than any currently available computer program.
69
239726
5380
ще ви даде по-добри резултати от наличните компютърни програми.
04:05
But this is no easy task,
70
245106
1643
Но това не е лесна работа,
04:06
and the sheer number of languages in the world,
71
246749
2265
а неясното количество езици по света,
04:09
as well as the increasing interaction between the people who speak them,
72
249014
3975
както и нарастващото взаимодействие между хората, които ги говорят,
04:12
will only continue to spur greater advances in automatic translation.
73
252989
5015
продължава да стимулира напредването на автоматичния превод.
04:18
Perhaps by the time we encounter intergalactic life forms,
74
258004
3405
Може би, докато открием междугалактически форми на живот,
04:21
we'll be able to communicate with them through a tiny gizmo,
75
261409
3251
вече ще можем да общуваме с тях чрез малки уреди
04:24
or we might have to start compiling that dictionary, after all.
76
264660
4366
или все пак може да се наложи да съставяме извънземен речник.
Относно този уебсайт

Този сайт ще ви запознае с видеоклипове в YouTube, които са полезни за изучаване на английски език. Ще видите уроци по английски език, преподавани от първокласни учители от цял свят. Кликнете два пъти върху английските субтитри, показани на всяка страница с видеоклипове, за да възпроизведете видеото оттам. Субтитрите се превъртат в синхрон с възпроизвеждането на видеото. Ако имате някакви коментари или искания, моля, свържете се с нас, като използвате тази форма за контакт.

https://forms.gle/WvT1wiN1qDtmnspy7