How computers translate human language - Ioannis Papachimonas

423,721 views ・ 2015-10-26

TED-Ed


Please double-click on the English subtitles below to play the video.

Translator: Deren Dlsoz Reviewer: Daban Q. Jaff
00:06
How is it that so many intergalactic species in movies and TV
0
6677
4629
ئەوە چۆنە کە جۆرە گەردوونیەکانی فیلم و تەلەفزیۆن
00:11
just happen to speak perfect English?
1
11306
3177
ئینگلیزییەکی تەواو قسە دەکەن؟
00:14
The short answer is that no one wants to watch a starship crew
2
14483
3403
کورتە وەڵامەکە ئەوەیە هیچ کەسێک نایەوێت سەیری دەستەی ئەستێرە بکات
00:17
spend years compiling an alien dictionary.
3
17886
3888
ساڵانێک لە کۆکردنەوەی فەرهەنگێکی نامۆ بەسەر ئەبەیت.
00:21
But to keep things consistent,
4
21774
1618
بەڵام بۆ ئەوەی بە ڕێکی بیانهێڵنەوە،
00:23
the creators of Star Trek and other science-fiction worlds
5
23392
3397
دروستکەرانی ستار ترێک و جیهانەکانی تری زانستی خەیاڵی
00:26
have introduced the concept of a universal translator,
6
26789
3725
ئەو چەمکەیان ناساند لە وەرگێڕێکی جیهانی
00:30
a portable device that can instantly translate between any languages.
7
30514
4498
ئامێری هەڵگر دەتوانێت دەستبەجێ وەرگێڕان لە نێوان هەر زمانێک بکات.
00:35
So is a universal translator possible in real life?
8
35012
3527
کەواتە وەرگێڕێکی جیهانی شیاوە لە ژیانی ڕاستەقینەدا؟
00:38
We already have many programs that claim to do just that,
9
38539
3598
ئێمە پێشتر چەندین بەرنامەمان هەیە کە بانگەشەی ئەوە دەکات،
00:42
taking a word, sentence, or entire book in one language
10
42137
3817
ووشەیەک، ڕستەیەک یان هەموو کتێب بە یەک زمان
00:45
and translating it into almost any other,
11
45954
3050
و وەرگێڕانی بۆ هەر شتێکی تر،
00:49
whether it's modern English or Ancient Sanskrit.
12
49004
3333
ئەگەر ئینگلیزی هاوچەرخ بێت یان سانسکریتی کۆن.
00:52
And if translation were just a matter of looking up words in a dictionary,
13
52337
3576
ئەگەر وەرگێڕان تەنها مەسەلەیەک بووایە لە وشەی فەرهەنگ.
00:55
these programs would run circles around humans.
14
55913
3912
ئەم بەرنامانە بازنەکان بەڕێوە دەبەن لە دەوری مرۆڤەکان.
00:59
The reality, however, is a bit more complicated.
15
59825
3474
بەڵام، ڕاستی، کەمێک ئاڵۆزترە.
01:03
A rule-based translation program uses a lexical database,
16
63299
4050
بەرنامەیەکی وەرگێڕانی لەسەر بنەمای یاسا داتابەیسێکی وشەسازی بەکار دەهێنێت،
01:07
which includes all the words you'd find in a dictionary
17
67349
2953
هەموو وشەکانی تێدایە لە فەرهەنگێک
01:10
and all grammatical forms they can take,
18
70302
2981
و هەموو ئەو فۆڕمە ڕێزمانیانەی دەتوانن بیبەن،
01:13
and set of rules to recognize the basic linguistic elements in the input language.
19
73283
5642
و کۆمەڵە یاسایەک بۆ ناسینەوەی بنەڕەتی توخمەکانی زمانناسی لە زمانی تێکردن.
01:18
For a seemingly simple sentence like, "The children eat the muffins,"
20
78925
3471
بۆ ڕستەیەکی سادەی وەک "منداڵەکان کێکەکە دەخۆن،"
01:22
the program first parses its syntax, or grammatical structure,
21
82396
4654
یەکەم جار بەرنامەکە ڕستەسازییەکەی شی دەکات یان پێکهاتەی ڕێزمانی،
01:27
by identifying the children as the subject,
22
87050
2537
بە ناساندنی منداڵەکان وەک بابەتەکە،
01:29
and the rest of the sentence as the predicate
23
89587
2730
و تەواوی ڕستەکە وەک پێشەکی
01:32
consisting of a verb "eat,"
24
92317
2051
بریتییە لە فرمانێک "خواردن،"
01:34
and a direct object "the muffins."
25
94368
3054
و بەرکاری ڕاستەوخۆ "کێکەکان."
01:37
It then needs to recognize English morphology,
26
97422
2827
دواتر پێویستی بە ناسینەوەی مۆرفیۆلۆجی ئینگلیزییە،
01:40
or how the language can be broken down into its smallest meaningful units,
27
100249
4432
یان چۆن زمانەکە تێکبشکێنرێت بۆ ناو بچوکترین یەکەی مانادار،
01:44
such as the word muffin
28
104681
1443
وەک وشەی کێکەکان
01:46
and the suffix "s," used to indicate plural.
29
106124
3631
پاشگری "س"، ئاماژە بۆ کۆ دەکات.
01:49
Finally, it needs to understand the semantics,
30
109755
2694
لە کۆتایدا، پێویستی بە واتایی ھەیە ،
01:52
what the different parts of the sentence actually mean.
31
112449
3729
بەشە جیاوازەکانی ڕستەکە لەڕاستیدا واتایان چییە.
01:56
To translate this sentence properly,
32
116178
1896
بۆ وەرگێڕانی ئەم ڕستەیە بە دروستی،
01:58
the program would refer to a different set of vocabulary and rules
33
118074
3908
بەرنامەکە ئاماژە بە کۆمەڵێکی جیاواز دەکات لە وشەگەل و یاساکان
02:01
for each element of the target language.
34
121982
3184
بۆ هەر ڕەگەزێک لە زمانی مەبەست.
02:05
But this is where it gets tricky.
35
125166
1854
بەڵام ئەمە ئەو شوێنەیە ئاڵۆزی دەکات.
02:07
The syntax of some languages allows words to be arranged in any order,
36
127020
4800
ڕستەسازی هەندێک زمان ڕێگە بە وشەکان دەدات ڕێکیان بخات لە هەر ڕیزێک،
02:11
while in others, doing so could make the muffin eat the child.
37
131820
5134
لە کاتێکدا لە وانیتر، ئەنجامدانی ئەمە دەتوانێت ئەو منداڵە کێکەی بخوات.
02:16
Morphology can also pose a problem.
38
136954
2693
مۆرفۆلۆجیش دەتوانێت کێشە دروست بکات.
02:19
Slovene distinguishes between two children and three or more
39
139647
3596
سلۆڤێن جیاوازی دەکات لە نێوان دوو منداڵ و سێ یان زیاتر
02:23
using a dual suffix absent in many other languages,
40
143243
3854
بەکارهێنانی پاشگری دوانەی نادیار بە چەندین زمانی تر،
02:27
while Russian's lack of definite articles might leave you wondering
41
147097
3435
لە کاتێک نەبوونی ئامرازی ناسیاوی ڕوسیا تۆ بەجێ بهێڵێت لە پرسیارکردن
02:30
whether the children are eating some particular muffins,
42
150532
3043
ئایا منداڵەکان ھەندێک کێکی تایبەت دەخۆن،
02:33
or just eat muffins in general.
43
153575
3144
یان ھەر کێک دەخۆن بە گشتی.
02:36
Finally, even when the semantics are technically correct,
44
156719
2989
لە کۆتای، تەنانەت کاتێک ئەو واتاییانە لە ڕووی تەکنیکیەوە ڕاستن،
02:39
the program might miss their finer points,
45
159708
3049
لەوانەیە بەرنامەکە خاڵی باشتریان لەدەست بدات،
02:42
such as whether the children "mangiano" the muffins,
46
162757
3052
وەک ئەوەی ئایا منداڵەکان "مانگیانۆ" کێکەکان،
02:45
or "divorano" them.
47
165809
1985
یان "دیڤۆرانۆ".
02:47
Another method is statistical machine translation,
48
167794
3764
میتۆدێکی تر ئەوەیە وەرگێڕانی ئامێری ئاماری،
02:51
which analyzes a database of books, articles, and documents
49
171558
4204
داتابەیس شیدەکاتەوە لە کتێب، وتار و بەڵگەنامەکان
02:55
that have already been translated by humans.
50
175762
3726
کە پێشتر لەلایەن مرۆڤەوە وەرگێڕدراون.
02:59
By finding matches between source and translated text
51
179488
3471
بە دۆزینەوەی هاوچەشنەکان لە نێوان سەرچاوە و دەقی وەرگێڕدراو
03:02
that are unlikely to occur by chance,
52
182959
2434
بە ئەگەری زۆر ئەگەری ڕوودانیان نیە،
03:05
the program can identify corresponding phrases and patterns,
53
185393
3952
بەرنامەکە دەتوانێت هاوتایی دەستەواژەکان و نموونەکان دیاری بکات،
03:09
and use them for future translations.
54
189345
3084
و بەکاری بھێنن بۆ وەرگێڕانەکانی داهاتوو.
03:12
However, the quality of this type of translation
55
192429
2540
لەگەڵ ئەوەشدا چۆنییەتی لەم جۆرە وەرگێڕانە
03:14
depends on the size of the initial database
56
194969
2721
پشت دەبەستێت بە قەبارەکەی لە بنکەی زانیاریە سەرەتاییەکان
03:17
and the availability of samples for certain languages
57
197690
3667
و بەردەستبوونی نموونەکان بۆ چەند زمانێک
03:21
or styles of writing.
58
201357
2026
یان شێوازەکانی نووسین.
03:23
The difficulty that computers have with the exceptions, irregularities
59
203383
3757
ئەو ئاستەنگیەی کۆمپیوتەرەکان لەگەڵ جیاوازیەکان، ناڕێکییەکان ھەیانە
03:27
and shades of meaning that seem to come instinctively to humans
60
207140
3854
و سێبەرەکانی مانا کەوا دیارە بە شێوەیەکی سروشتی بۆ مرۆڤ دێت
03:30
has led some researchers to believe that our understanding of language
61
210994
4051
وای لە هەندێک توێژەر کردووە باوەڕ بکەن تێگەیشتنمان بۆ زمان
03:35
is a unique product of our biological brain structure.
62
215045
4206
بەرهەمێکی بێ وێنەیە لە پێکهاتەی مێشکی بایۆلۆجیمان.
03:39
In fact, one of the most famous fictional universal translators,
63
219251
3850
لە ڕاستیدا، یەکێک لە بەناوبانگترین وەرگێڕی جیهانی خەیاڵی،
03:43
the Babel fish from "The Hitchhiker's Guide to the Galaxy",
64
223101
3338
ماسییە بابێڵەکە لە "ڕێنیشاندەرەکەی گەشتکەر بۆ گالاکسی"،
03:46
is not a machine at all but a small creature
65
226439
3287
ئامێرێک نیە بەڵام بوونەوەرێکی بچووک
03:49
that translates the brain waves and nerve signals of sentient species
66
229726
4484
شەپۆلەکانی مێشک وەردەگێڕێت و نیشانەی دەماری جۆری دڵگیر
03:54
through a form of telepathy.
67
234210
2795
لە ڕێگەی شێوەی تێلێپاتی.
03:57
For now, learning a language the old fashioned way
68
237005
2721
ئێستا، فێربوونی زمانێک ڕێگەیەکی کۆنە
03:59
will still give you better results than any currently available computer program.
69
239726
5380
هێشتا ئەنجامی باشترت پێدەدات لە هەر بەرنامەیەکی کۆمپیوتەری بەردەست.
04:05
But this is no easy task,
70
245106
1643
بەڵام ئەمە کارێکی ئاسان نیە،
04:06
and the sheer number of languages in the world,
71
246749
2265
و ژمارە تەواوەکە لە زمانەکانی جیهاندا،
04:09
as well as the increasing interaction between the people who speak them,
72
249014
3975
هەروەها زیادبوونی کارلێک لە نێوان ئەو کەسانەی قسەیان لەگەڵ دەکەن،
04:12
will only continue to spur greater advances in automatic translation.
73
252989
5015
تەنها بەردەوام دەبێت لە هەڵگەڕانی گەورەتری پێشکەوتوو لە وەرگێڕانێکی ئۆتۆماتیکی.
04:18
Perhaps by the time we encounter intergalactic life forms,
74
258004
3405
لەوانەیە تا ئەو کاتەی ڕووبەڕووی شێوەی ژیانی نێوان گەردوونی بین،
04:21
we'll be able to communicate with them through a tiny gizmo,
75
261409
3251
دەتوانین پەیوەندیان لەگەڵ بکەین لە ڕێگەی گیزمۆیەکی بچوکەوە،
04:24
or we might have to start compiling that dictionary, after all.
76
264660
4366
یان لەوانەیە دەست بکەین بە کۆکردنەوەی فەرھەنگەکە، لەگەڵ ھەموو ئەمانەوە.
About this website

This site will introduce you to YouTube videos that are useful for learning English. You will see English lessons taught by top-notch teachers from around the world. Double-click on the English subtitles displayed on each video page to play the video from there. The subtitles scroll in sync with the video playback. If you have any comments or requests, please contact us using this contact form.

https://forms.gle/WvT1wiN1qDtmnspy7