How computers translate human language - Ioannis Papachimonas

423,128 views ・ 2015-10-26

TED-Ed


لطفا برای پخش فیلم روی زیرنویس انگلیسی زیر دوبار کلیک کنید.

Translator: sadegh zabihi Reviewer: soheila Jafari
00:06
How is it that so many intergalactic species in movies and TV
0
6677
4629
این چطور است که بسیاری از موجودات فضایی در فیلم های سینمایی و تلویزیونی
00:11
just happen to speak perfect English?
1
11306
3177
ار قضا خیلی خوب انگلیسی صحبت می کنند؟
00:14
The short answer is that no one wants to watch a starship crew
2
14483
3403
پاسخ کوتاه این است که هیچ کس نمی خواهد خدمه یک کشتی فضایی را ببیند
00:17
spend years compiling an alien dictionary.
3
17886
3888
که سالها صرف تدوین یک فرهنگ لغاتِ فضایی کرده اند.
00:21
But to keep things consistent,
4
21774
1618
اما برای منسجم نگه داشتن مسائل،
00:23
the creators of Star Trek and other science-fiction worlds
5
23392
3397
سازندگان [سریالِ] استار ترک و سایر دنیاهای علمی-تخیلی
00:26
have introduced the concept of a universal translator,
6
26789
3725
مفهوم یک مترجمِ عمومی را معرفی کردند،
00:30
a portable device that can instantly translate between any languages.
7
30514
4498
یک ابزار قابل حمل که می تواند بلافاصله هر زبانی را ترجمه کند.
00:35
So is a universal translator possible in real life?
8
35012
3527
خُب، آیا یک مترجم عمومی در دنیای واقعی امکان پذیر است؟
00:38
We already have many programs that claim to do just that,
9
38539
3598
همین الان هم تعداد زیادی برنامه داریم که ادعا می کنند این کار را انجام می دهند،
00:42
taking a word, sentence, or entire book in one language
10
42137
3817
یک کلمه، جمله یا یک کتاب کامل را از یک زبان می گیرند
00:45
and translating it into almost any other,
11
45954
3050
و آن را به تقریبا هر زبانی ترجمه می کنند،
00:49
whether it's modern English or Ancient Sanskrit.
12
49004
3333
چه انگلیسیِ مدرن باشد یا سانسکریت باستانی.
00:52
And if translation were just a matter of looking up words in a dictionary,
13
52337
3576
و اگر ترجمه فقط مسئله پیدا کردن کلمات در فرهنگ لغات بود،
00:55
these programs would run circles around humans.
14
55913
3912
این نرم افزارها از همه آدمها جلو می زدند.
00:59
The reality, however, is a bit more complicated.
15
59825
3474
اما واقعیت کمی پیچیده تر است.
01:03
A rule-based translation program uses a lexical database,
16
63299
4050
یک برنامه مترجم قانون‌مند از بانک اطلاعات کلماتی استفاده می کند
01:07
which includes all the words you'd find in a dictionary
17
67349
2953
که حاوی تمام کلمات موجود در فرهنگِ لغات
01:10
and all grammatical forms they can take,
18
70302
2981
و تمام حالت های دستوری آنها،
01:13
and set of rules to recognize the basic linguistic elements in the input language.
19
73283
5642
و تمام قوانین لازم برای شناسایی اجزاء زبانیِ زبانِ مبداء است.
01:18
For a seemingly simple sentence like, "The children eat the muffins,"
20
78925
3471
به عنوان یک مثال ساده درباره جمله ای مثل "کودکان کلوچه می خورند،"
01:22
the program first parses its syntax, or grammatical structure,
21
82396
4654
برنامه اول بخش های آن یا ساختار دستوری آن را تجزیه می کند،
01:27
by identifying the children as the subject,
22
87050
2537
کودکان را به عنوان فاعل،
01:29
and the rest of the sentence as the predicate
23
89587
2730
و بقیه جمله را به عنوان خبر شناسایی می کند
01:32
consisting of a verb "eat,"
24
92317
2051
که شامل فعل "می خورند،"
01:34
and a direct object "the muffins."
25
94368
3054
و مفعول "کلوچه ها" است.
01:37
It then needs to recognize English morphology,
26
97422
2827
و بعد برنامه باید شکل زبان انگلیسی را شناسایی کند.
01:40
or how the language can be broken down into its smallest meaningful units,
27
100249
4432
یا اینکه زبان چگونه می تواند به کوچکترین بخش های معنی دار تقسیم شود.
01:44
such as the word muffin
28
104681
1443
مثل کلمه کلوچه
01:46
and the suffix "s," used to indicate plural.
29
106124
3631
و پسوند "s" که آن را تبدیل به جمع می کند.
01:49
Finally, it needs to understand the semantics,
30
109755
2694
در نهایت، او باید معنی لغات را تشخیص دهد،
01:52
what the different parts of the sentence actually mean.
31
112449
3729
هر بخش جمله در واقع چه معنی دارند.
01:56
To translate this sentence properly,
32
116178
1896
برای ترجمه مناسب این جمله،
01:58
the program would refer to a different set of vocabulary and rules
33
118074
3908
برنامه به مجموعه متفاوتی از لغات و دستوربرای هر جزء تشکیل دهنده
02:01
for each element of the target language.
34
121982
3184
در زبان مقصد مراجعه می کند.
02:05
But this is where it gets tricky.
35
125166
1854
اما اینجای کار کمی سخت می شود.
02:07
The syntax of some languages allows words to be arranged in any order,
36
127020
4800
قوائد برخی زبان ها به کلمات اجازه می دهند تا در جاهای مختلف جمله قرار بگیرند،
02:11
while in others, doing so could make the muffin eat the child.
37
131820
5134
که در این صورت، ممکن است جمله به کلوچه بچه ها را می خورد تبدیل شود.
02:16
Morphology can also pose a problem.
38
136954
2693
شکلِ زبان هم ممکن است مشکل ساز شود.
02:19
Slovene distinguishes between two children and three or more
39
139647
3596
زبان اسلوونی بین دو کودک و سه یا بیشتر تفاوت قائل می شود
02:23
using a dual suffix absent in many other languages,
40
143243
3854
در حالی که استفاده از مثنی در بسیاری از زبان ها وجود ندارد،
02:27
while Russian's lack of definite articles might leave you wondering
41
147097
3435
با وجود نداشتن نکره و معرفه در زبان روسی شما نمی توانید متوجه شوید
02:30
whether the children are eating some particular muffins,
42
150532
3043
که بچه ها کلوچه های خاصی را می خورند،
02:33
or just eat muffins in general.
43
153575
3144
یا به طور کلی کلوچه می خورند.
02:36
Finally, even when the semantics are technically correct,
44
156719
2989
در نهایت، زمانی که معانی از نظر فنی هم درست باشند،
02:39
the program might miss their finer points,
45
159708
3049
برنامه ممکن است نتواند بهترین لغت را تشخیص دهد،
02:42
such as whether the children "mangiano" the muffins,
46
162757
3052
مثل این که بچه ها کلوچه ها را "mangiano"،
02:45
or "divorano" them.
47
165809
1985
یا کلوچه ها را "divorano". [اشاره به استفاده از دو فعل با معانی شبیه ولی متفاوت در زبان لاتین]
02:47
Another method is statistical machine translation,
48
167794
3764
روش دیگر استفاده از دستگاه ترجمه آماری است،
02:51
which analyzes a database of books, articles, and documents
49
171558
4204
که بانک اطلاعاتی شامل کتابها، مقاله ها و مطالب را،
02:55
that have already been translated by humans.
50
175762
3726
که قبلا توسط انسان ترجمه شده اند، تحلیل می کند.
02:59
By finding matches between source and translated text
51
179488
3471
با پیدا کردن معادل در میان زبان های مبدا و مقصد،
03:02
that are unlikely to occur by chance,
52
182959
2434
که بعید است به صورت اتفاقی به وجود بیایند،
03:05
the program can identify corresponding phrases and patterns,
53
185393
3952
نرم افزار می تواند جمله ها و الگوهای متناظر را بیابد،
03:09
and use them for future translations.
54
189345
3084
و از آنها برای ترجمه های آتی استفاده کند.
03:12
However, the quality of this type of translation
55
192429
2540
با این وجود، کیفیت این نوع ترجمه
03:14
depends on the size of the initial database
56
194969
2721
به اندازه بانک اطلاعاتی مورد استفاده
03:17
and the availability of samples for certain languages
57
197690
3667
و وجود داشتن نمونه هایی از زبان خاص
03:21
or styles of writing.
58
201357
2026
یا روش نوشتار، بستگی دارد.
03:23
The difficulty that computers have with the exceptions, irregularities
59
203383
3757
دشواری که رایانه ها با آن مواجه هستند برای شناسایی موارد خاص، بی قاعده
03:27
and shades of meaning that seem to come instinctively to humans
60
207140
3854
و معانی نهفته که به صورت غریزی مربوط به انسان ها است
03:30
has led some researchers to believe that our understanding of language
61
210994
4051
بعضی از محققان را بر آن داشته تا باور کنند که درک ما از زبان
03:35
is a unique product of our biological brain structure.
62
215045
4206
محصولی خاص از ساختار بیولوژیکی مغز ما است.
03:39
In fact, one of the most famous fictional universal translators,
63
219251
3850
در واقع، یکی از مشهورترین مترجمان عمومیِ تخیلی،
03:43
the Babel fish from "The Hitchhiker's Guide to the Galaxy",
64
223101
3338
ماهیِ بابل در فیلم "راهنمای رایگان‌سواری در کهکشان"،
03:46
is not a machine at all but a small creature
65
226439
3287
اصلا ماشین نیست بلکه موجودی کوچک است
03:49
that translates the brain waves and nerve signals of sentient species
66
229726
4484
که امواج مغزی و سیگنال های عصبی گونه های حساس را
03:54
through a form of telepathy.
67
234210
2795
بوسیله گونه ای تلپاتی، ترجمه می کند.
03:57
For now, learning a language the old fashioned way
68
237005
2721
تا کنون، یاد گرفتن یک زبان به همان روش سنتی قدیمی
03:59
will still give you better results than any currently available computer program.
69
239726
5380
نتیجه بهتری نسبت به استفاده از هر برنامه کامپیتری موجود به شما می دهد.
04:05
But this is no easy task,
70
245106
1643
اما این اصلا کار راحتی نیست،
04:06
and the sheer number of languages in the world,
71
246749
2265
و با توجه به تعداد بسیار زیاد زبان های موجود در دنیا،
04:09
as well as the increasing interaction between the people who speak them,
72
249014
3975
تنها با افزایش تعامل میان افرادی که به آن زبان ها صحبت می کنند،
04:12
will only continue to spur greater advances in automatic translation.
73
252989
5015
می توان کارآیی مترجمان خودکار را بهبود بخشید.
04:18
Perhaps by the time we encounter intergalactic life forms,
74
258004
3405
شاید زمانی که با حیات غیر زمینی برخورد پیدا کردیم،
04:21
we'll be able to communicate with them through a tiny gizmo,
75
261409
3251
بتوانیم با آنها بوسیله یک ابزار کوچک ارتباط برقرار کنیم،
04:24
or we might have to start compiling that dictionary, after all.
76
264660
4366
یا شاید در نهایت مجبور شویم یک فرهنگ لغات گرد آوری کنیم.
درباره این وب سایت

این سایت ویدیوهای یوتیوب را به شما معرفی می کند که برای یادگیری زبان انگلیسی مفید هستند. دروس انگلیسی را خواهید دید که توسط معلمان درجه یک از سراسر جهان تدریس می شود. روی زیرنویس انگلیسی نمایش داده شده در هر صفحه ویدیو دوبار کلیک کنید تا ویدیو از آنجا پخش شود. زیرنویس‌ها با پخش ویدیو همگام می‌شوند. اگر نظر یا درخواستی دارید، لطفا با استفاده از این فرم تماس با ما تماس بگیرید.

https://forms.gle/WvT1wiN1qDtmnspy7