How computers translate human language - Ioannis Papachimonas

Як комп'ютери перекладають людську мову - Іоанніс Папахімонас

423,721 views

2015-10-26 ・ TED-Ed


New videos

How computers translate human language - Ioannis Papachimonas

Як комп'ютери перекладають людську мову - Іоанніс Папахімонас

423,721 views ・ 2015-10-26

TED-Ed


Будь ласка, двічі клацніть на англійські субтитри нижче, щоб відтворити відео.

Перекладач: Irina Kozhanova Утверджено: Khrystyna Romashko
00:06
How is it that so many intergalactic species in movies and TV
0
6677
4629
Як так сталося, що більшість прибульців у кіно та на телебаченні
00:11
just happen to speak perfect English?
1
11306
3177
чудово розмовляють англійською?
00:14
The short answer is that no one wants to watch a starship crew
2
14483
3403
Кажучи відверто, ніхто не захоче дивитися,
як екіпаж космічного корабля роками складає словник інопланетної мови.
00:17
spend years compiling an alien dictionary.
3
17886
3888
00:21
But to keep things consistent,
4
21774
1618
Але, щоб усе було логічно,
00:23
the creators of Star Trek and other science-fiction worlds
5
23392
3397
творці серіалу "Зоряний шлях" та багатьох інших вигаданих світів
00:26
have introduced the concept of a universal translator,
6
26789
3725
запропонували концепцію універсального перекладача:
00:30
a portable device that can instantly translate between any languages.
7
30514
4498
портативного пристрою, котрий може миттєво здійснювати переклад.
Та чи насправді можливе існування універсального перекладача?
00:35
So is a universal translator possible in real life?
8
35012
3527
00:38
We already have many programs that claim to do just that,
9
38539
3598
У нас вже є багато програм, котрі ніби можуть це робити:
00:42
taking a word, sentence, or entire book in one language
10
42137
3817
перекладати слово, речення чи цілу книгу з однієї мови
00:45
and translating it into almost any other,
11
45954
3050
майже на будь яку іншу, незважаючи на те,
00:49
whether it's modern English or Ancient Sanskrit.
12
49004
3333
чи це сучасна англійська мова, чи давній санскрит.
00:52
And if translation were just a matter of looking up words in a dictionary,
13
52337
3576
Якби переклад полягав лише у пошуку відповідного слова у словнику,
00:55
these programs would run circles around humans.
14
55913
3912
то ці програми вже давно перевершили б перекладачів - людей.
00:59
The reality, however, is a bit more complicated.
15
59825
3474
Насправді ж, все дещо складніше.
01:03
A rule-based translation program uses a lexical database,
16
63299
4050
Перекладацька програма, базована на правилах, використовує лексичну базу даних,
01:07
which includes all the words you'd find in a dictionary
17
67349
2953
до якої включено усі слова, котрі можна знайти у словнику
01:10
and all grammatical forms they can take,
18
70302
2981
і усі варіанти граматичних форм, котрих вони можуть набувати,
01:13
and set of rules to recognize the basic linguistic elements in the input language.
19
73283
5642
а також ряд правил, аби розпізнати основні лінгвістичні елементи вихідної мови.
01:18
For a seemingly simple sentence like, "The children eat the muffins,"
20
78925
3471
Для, здавалося б, простого речення як "Діти їдять кекси"
01:22
the program first parses its syntax, or grammatical structure,
21
82396
4654
программа спершу аналізує його синтаксичну або граматичну структуру,
01:27
by identifying the children as the subject,
22
87050
2537
визначаючи, що "діти" - це підмет,
01:29
and the rest of the sentence as the predicate
23
89587
2730
а решта речення - предикат,
01:32
consisting of a verb "eat,"
24
92317
2051
що складається з дієслова "їдять",
01:34
and a direct object "the muffins."
25
94368
3054
та прямого додатка "кекси".
01:37
It then needs to recognize English morphology,
26
97422
2827
Далі необхідно врахувати морфологію англійської мови,
01:40
or how the language can be broken down into its smallest meaningful units,
27
100249
4432
тобто те, як мова поділяється на найменші значимі одиниці,
01:44
such as the word muffin
28
104681
1443
такі як корінь "кекс"
01:46
and the suffix "s," used to indicate plural.
29
106124
3631
та закінчення "-и", котре вказує на множину.
01:49
Finally, it needs to understand the semantics,
30
109755
2694
І нарешті, програмі потрібно зрозуміти семантику:
01:52
what the different parts of the sentence actually mean.
31
112449
3729
що саме означають різні частини речення.
01:56
To translate this sentence properly,
32
116178
1896
Аби правильно перекласти це речення,
01:58
the program would refer to a different set of vocabulary and rules
33
118074
3908
програма має проаналізувати ряд лексики та правил
02:01
for each element of the target language.
34
121982
3184
для кожного елемента мови перекладу.
02:05
But this is where it gets tricky.
35
125166
1854
Але ось де собаку зарито.
02:07
The syntax of some languages allows words to be arranged in any order,
36
127020
4800
Синтаксична структура деяких мов не вимагає чіткого порядку слів у реченні,
02:11
while in others, doing so could make the muffin eat the child.
37
131820
5134
у той час як у інших, його порушення може призвести до того, що кекс з'їсть дитину.
02:16
Morphology can also pose a problem.
38
136954
2693
Морфологія також може становити проблему.
02:19
Slovene distinguishes between two children and three or more
39
139647
3596
Зокрема у словенській мові різниця між 2, 3 чи більше дітьми
виражається додаванням подвійного суфіксу, що відсутнє у більшості інших мов,
02:23
using a dual suffix absent in many other languages,
40
143243
3854
а в російській відсутність артиклів змусить замислитися,
02:27
while Russian's lack of definite articles might leave you wondering
41
147097
3435
02:30
whether the children are eating some particular muffins,
42
150532
3043
чи діти їдять якісь конкретні кекси,
02:33
or just eat muffins in general.
43
153575
3144
чи взагалі їх їдять.
02:36
Finally, even when the semantics are technically correct,
44
156719
2989
Насамкінець, навіть якщо семантика вірна,
02:39
the program might miss their finer points,
45
159708
3049
програма може не зрозуміти декотрих особливостей
02:42
such as whether the children "mangiano" the muffins,
46
162757
3052
як, наприклад, використати слово "mangiano" чи "divorano",
02:45
or "divorano" them.
47
165809
1985
аби позначити дію дітей.
02:47
Another method is statistical machine translation,
48
167794
3764
Інший метод - це статистичний машинний переклад,
02:51
which analyzes a database of books, articles, and documents
49
171558
4204
при якому аналізується база даних з книжок, статей та документів
02:55
that have already been translated by humans.
50
175762
3726
вже перекладених людиною.
Знаходячи співвідношення між текстом оригіналу та перекладу,
02:59
By finding matches between source and translated text
51
179488
3471
03:02
that are unlikely to occur by chance,
52
182959
2434
котрі рідко виникають випадково,
03:05
the program can identify corresponding phrases and patterns,
53
185393
3952
програма може виокремити відповідні фрази та моделі,
03:09
and use them for future translations.
54
189345
3084
котрі будуть використані для подальшого перекладу.
Тим не менш, якість такого перекладу
03:12
However, the quality of this type of translation
55
192429
2540
03:14
depends on the size of the initial database
56
194969
2721
залежить від вихідної бази даних
03:17
and the availability of samples for certain languages
57
197690
3667
та наявності зразків для конкретної мови
чи стилю мовлення.
03:21
or styles of writing.
58
201357
2026
Складнощі для комп'ютера складають виключення, порушення норм
03:23
The difficulty that computers have with the exceptions, irregularities
59
203383
3757
та відтінки значень, котрі для людини зрозумілі на інстинктивному рівні.
03:27
and shades of meaning that seem to come instinctively to humans
60
207140
3854
03:30
has led some researchers to believe that our understanding of language
61
210994
4051
Саме це змусило деяких вчених припустити, що розуміння мови -
це унікальне явище, зумовлене біологічною будовою нашого мозку.
03:35
is a unique product of our biological brain structure.
62
215045
4206
Насправді, один із найвідоміших вигаданих універсальних перекладачів,
03:39
In fact, one of the most famous fictional universal translators,
63
219251
3850
03:43
the Babel fish from "The Hitchhiker's Guide to the Galaxy",
64
223101
3338
Вавілонська риба із роману "Путівник Галактикою",
03:46
is not a machine at all but a small creature
65
226439
3287
зовсім не машина, а невеличка істота,
03:49
that translates the brain waves and nerve signals of sentient species
66
229726
4484
котра перекладає мозкові хвилі та нервові сигнали розумних істот
03:54
through a form of telepathy.
67
234210
2795
за допомогою телепатії.
На сьогодні, звичне нам просте вивчення мови
03:57
For now, learning a language the old fashioned way
68
237005
2721
03:59
will still give you better results than any currently available computer program.
69
239726
5380
буде більш ефективним, аніж будь-яка доступна зараз програма.
Але це не просте завдання.
04:05
But this is no easy task,
70
245106
1643
04:06
and the sheer number of languages in the world,
71
246749
2265
А безліч мов у світі
04:09
as well as the increasing interaction between the people who speak them,
72
249014
3975
та зростання кількості контактів між людьми, що ними спілкуються,
04:12
will only continue to spur greater advances in automatic translation.
73
252989
5015
лише сприятимуть розвитку машинного перекладу.
Можливо, до того часу, коли ми нарешті встановимо контакт із прибульцями
04:18
Perhaps by the time we encounter intergalactic life forms,
74
258004
3405
04:21
we'll be able to communicate with them through a tiny gizmo,
75
261409
3251
ми матимемо змогу спілкуватися із ними за допомогою маленьких приладів,
04:24
or we might have to start compiling that dictionary, after all.
76
264660
4366
або нам все ж доведеться складати словник.
Про цей сайт

Цей сайт познайомить вас з відеороликами YouTube, корисними для вивчення англійської мови. Ви побачите уроки англійської мови, які проводять першокласні викладачі з усього світу. Двічі клацніть на англійських субтитрах, що відображаються на кожній сторінці відео, щоб відтворити відео з цієї сторінки. Субтитри прокручуються синхронно з відтворенням відео. Якщо у вас є коментарі або побажання, будь ласка, зв'яжіться з нами за допомогою цієї контактної форми.

https://forms.gle/WvT1wiN1qDtmnspy7