How computers translate human language - Ioannis Papachimonas

423,128 views ・ 2015-10-26

TED-Ed


โปรดดับเบิลคลิกที่คำบรรยายภาษาอังกฤษด้านล่างเพื่อเล่นวิดีโอ

Translator: Kelwalin Dhanasarnsombut Reviewer: Rawee Ma
00:06
How is it that so many intergalactic species in movies and TV
0
6677
4629
สิ่งมีชีวิตต่างกาแล็คซี่ในภาพยนต์และในโทรทัศน์
00:11
just happen to speak perfect English?
1
11306
3177
พูดภาษาอังกฤษได้อย่างสมบูรณ์แบบได้อย่างไร
00:14
The short answer is that no one wants to watch a starship crew
2
14483
3403
คำตอบสั้น ๆ ก็คือ ไม่มีใครอยากจะเห็นลูกเรือยานอวกาศ
00:17
spend years compiling an alien dictionary.
3
17886
3888
ใช้เวลาหลายปีในการรวบรวมพจนานุกรมเอเลียน
00:21
But to keep things consistent,
4
21774
1618
แต่เพื่อให้สิ่งต่าง ๆ คงเส้นคงวา
00:23
the creators of Star Trek and other science-fiction worlds
5
23392
3397
ผู้สร้าง สตาร์ เทรค และนิยายวิทยาศาสตร์อื่น ๆ
00:26
have introduced the concept of a universal translator,
6
26789
3725
ได้นำแนวคิดของผู้แปลภาษาสากล
00:30
a portable device that can instantly translate between any languages.
7
30514
4498
อุปกรณ์พกพาที่สามารถแปลระหว่างภาษาใดก็ได้ ได้ในทันที
00:35
So is a universal translator possible in real life?
8
35012
3527
แล้วผู้แปลภาษาสากลนี้มีอยู่จริง ๆ หรือเปล่า
00:38
We already have many programs that claim to do just that,
9
38539
3598
เรามีโปรแกรมมากมาย ที่อ้างว่าทำอย่างนั้นได้
00:42
taking a word, sentence, or entire book in one language
10
42137
3817
คือนำคำ ประโยค หรือหนังสือทั้งเล่ม ที่เขียนด้วยภาษาหนึ่ง
00:45
and translating it into almost any other,
11
45954
3050
และแปลมันออกมาเป็นอีกภาษาหนึ่ง
00:49
whether it's modern English or Ancient Sanskrit.
12
49004
3333
ไม่ว่ามันจะเป็นภาษาอังกฤษยุคใหม่ หรือภาษาสันสกฤตโบราณ
00:52
And if translation were just a matter of looking up words in a dictionary,
13
52337
3576
และถ้าการแปลเป็นเพียงแค่ การมองหาคำในพจนานุกรม
00:55
these programs would run circles around humans.
14
55913
3912
โปรแกรมเหล่านี้คงจะทำงานเป็นวงจร ในแบบที่มนุษย์ทำ
00:59
The reality, however, is a bit more complicated.
15
59825
3474
อย่างไรก็ดี ในความจริง มันซับซ้อนยิ่งกว่านั้น
01:03
A rule-based translation program uses a lexical database,
16
63299
4050
โปรแกรมการแปล ที่ขึ้นอยู่กับกฎการใช้ฐานข้อมูลศัพท์
01:07
which includes all the words you'd find in a dictionary
17
67349
2953
ซึ่งรวมถึงคำทั้งหมดที่คุณจะพบได้ ในพจนานุกรม
01:10
and all grammatical forms they can take,
18
70302
2981
และรูปแบบไวยกรณ์ทั้งหมดที่พวกมันจะถูกใช้
01:13
and set of rules to recognize the basic linguistic elements in the input language.
19
73283
5642
และชุดของกฎเพื่อจดจำ ส่วนพื้นฐานทางภาษาของภาษาพื้นฐานที่ป้อนให้
01:18
For a seemingly simple sentence like, "The children eat the muffins,"
20
78925
3471
สำหรับประโยคง่าย ๆ อย่างเช่น "เด็ก ๆ กินมัฟฟิน"
01:22
the program first parses its syntax, or grammatical structure,
21
82396
4654
โปรแกรมจะชำแหละคำศัพท์ หรือโครงสร้างไวยกรณ์
01:27
by identifying the children as the subject,
22
87050
2537
โดยบ่งชี้ว่า เด็ก ๆ เป็นประธาน
01:29
and the rest of the sentence as the predicate
23
89587
2730
และที่เหลือในประโยคนั้นเป็นภาคแสดง
01:32
consisting of a verb "eat,"
24
92317
2051
ที่ประกอบด้วย คำกริยา "กิน"
01:34
and a direct object "the muffins."
25
94368
3054
และกรรมตรง "มัฟฟิน"
01:37
It then needs to recognize English morphology,
26
97422
2827
จากนั้นมันต้องจดจำสัณฐานวิทยาของภาษาอังกฤษ
01:40
or how the language can be broken down into its smallest meaningful units,
27
100249
4432
หรือว่าภาษานั้นสามารถถูกแบ่งย่อยลงมา เป็นส่วนเล็กที่สุดที่มีความหมายได้อย่างไร
01:44
such as the word muffin
28
104681
1443
อย่างเช่นคำว่า มัฟฟิน
01:46
and the suffix "s," used to indicate plural.
29
106124
3631
และส่วนต่อท้ายคำ "s" ที่ใช้เพื่อบ่งบอกนามพหูพจน์
01:49
Finally, it needs to understand the semantics,
30
109755
2694
ท้ายที่สุด มันต้องเข้าใจอรรถศาสตร์
01:52
what the different parts of the sentence actually mean.
31
112449
3729
ว่าแต่ละส่วนของประโยชน์ มีความหมายจริง ๆ ว่าอย่างไร
01:56
To translate this sentence properly,
32
116178
1896
เพื่อแปลประโยคนี้อย่างเหมาะสม
01:58
the program would refer to a different set of vocabulary and rules
33
118074
3908
โปรแกรมจะอ้างอิงถึงคำศัพท์และกฎต่าง ๆ
02:01
for each element of the target language.
34
121982
3184
สำหรับแต่ละส่วนของภาษาเป้าหมาย
02:05
But this is where it gets tricky.
35
125166
1854
แต่นี่คือตอนที่มันซับซ้อน
02:07
The syntax of some languages allows words to be arranged in any order,
36
127020
4800
คำศัพท์ของบางภาษา ยอมให้คำเรียงอยู่ในลำดับใดก็ได้
02:11
while in others, doing so could make the muffin eat the child.
37
131820
5134
ในขณะที่ในบางภาษา การทำเช่นนั้นอาจทำให้ มัฟฟินกินเด็ก
02:16
Morphology can also pose a problem.
38
136954
2693
สัณฐานวิทยาของภาษายังสามารถก่อปัญหาได้
02:19
Slovene distinguishes between two children and three or more
39
139647
3596
ภาษาสโลวาเนียแยกระหว่าง เด็กสองคน และสามคน หรือมากกว่า
02:23
using a dual suffix absent in many other languages,
40
143243
3854
โดยการใช้ส่วนเติมหน้าคำสองคำ ที่ไม่มีในหลาย ๆ ภาษา
02:27
while Russian's lack of definite articles might leave you wondering
41
147097
3435
ในขณะที่ภาษารัสเซียที่ไม่มีคำนำหน้าที่แน่นอน อาจทำให้คุณงงว่า
02:30
whether the children are eating some particular muffins,
42
150532
3043
เด็กกำลังกินมัฟฟินจำเพาะเจาะจงอันไหนสักอัน
02:33
or just eat muffins in general.
43
153575
3144
หรือแค่กินมัฟฟินทั่ว ๆ ไป
02:36
Finally, even when the semantics are technically correct,
44
156719
2989
ท้ายที่สุด ถึงแม้ว่าอรรถศาสตร์ถูกต้องตามเทคนิค
02:39
the program might miss their finer points,
45
159708
3049
โปรแกรมอาจพลาดในจุดที่ละเอียด
02:42
such as whether the children "mangiano" the muffins,
46
162757
3052
เช่น เมื่อใดที่เด็ก ๆ "แมนจิโน" มัฟฟิน
02:45
or "divorano" them.
47
165809
1985
หรือ "ดิโบราโน" พวกมัน
02:47
Another method is statistical machine translation,
48
167794
3764
อีกวิธีคือการใช้เครื่องแปลแบบสถิติ
02:51
which analyzes a database of books, articles, and documents
49
171558
4204
ซึ่งวิเคราะห์ฐานข้อมูลหนังสือ บทความ และเอกสาร
02:55
that have already been translated by humans.
50
175762
3726
ที่ได้ถูกแปลเอาไว้แล้วโดยมนุษย์
02:59
By finding matches between source and translated text
51
179488
3471
โดยการหาสิ่งที่เหมือนกันระหว่างแหล่ง กับข้อความที่ถูกแปล
03:02
that are unlikely to occur by chance,
52
182959
2434
ที่ไม่น่าจะเกิดขึ้นเพราะการสุ่มเดา
03:05
the program can identify corresponding phrases and patterns,
53
185393
3952
โปรแกรมสามารถบ่งบอกได้ ถึงวลีและรูปแบบที่เกี่ยวข้อง
03:09
and use them for future translations.
54
189345
3084
และใช้พวกมันสำหรับการแปลในอนาคต
03:12
However, the quality of this type of translation
55
192429
2540
อย่าไรก็ดี คุณภาพของการแปลแบบนี้
03:14
depends on the size of the initial database
56
194969
2721
ขึ้นอยู่กับขนาดของฐานข้อมูลภายใน
03:17
and the availability of samples for certain languages
57
197690
3667
และการปรากฎอยู่ของตัวอย่าง ของภาษานั้นๆ
03:21
or styles of writing.
58
201357
2026
หรือรูปแบบของการเขียน
03:23
The difficulty that computers have with the exceptions, irregularities
59
203383
3757
อุปสรรค์ที่คอมพิวเตอร์มีต่อข้อยกเว้น ความไม่แน่นอน
03:27
and shades of meaning that seem to come instinctively to humans
60
207140
3854
และระดับของความหมาย ที่อาจทำให้มันแตกต่างสำหรับคนเรา
03:30
has led some researchers to believe that our understanding of language
61
210994
4051
นำไปสู่งานวิจัยที่เชื่อว่า ความเข้าในในภาษาของเรานั้น
03:35
is a unique product of our biological brain structure.
62
215045
4206
เป็นผลลัพธ์ที่มีเอกลักษณ์ ของโครงสร้างทางชีวภาพของสมอง
03:39
In fact, one of the most famous fictional universal translators,
63
219251
3850
อันที่จริง หนึ่งในนักแปลสากลในนิยาย ที่เป็นที่รู้จักมากที่สุด
03:43
the Babel fish from "The Hitchhiker's Guide to the Galaxy",
64
223101
3338
คือ ปลาบาเบล จาก "เดอะ ฮิทช์ไฮเกอส์ ไกด์ ทู เดอะ กาแล็คซี"
03:46
is not a machine at all but a small creature
65
226439
3287
ไม่ใช่เครื่องอะไรเลย แต่เป็นสัตว์เล็กๆ
03:49
that translates the brain waves and nerve signals of sentient species
66
229726
4484
ที่เปลี่ยนคลื่นสมอง และสัญญาณประสาทของสัตว์ที่มีชีวิตจิตใจ
03:54
through a form of telepathy.
67
234210
2795
ผ่านรูปแบบของการส่งกระแสจิต
03:57
For now, learning a language the old fashioned way
68
237005
2721
ตอนนี้ การเรียนภาษาแบบวิธีดั้งเดิม
03:59
will still give you better results than any currently available computer program.
69
239726
5380
จะยังให้ผลลัพธ์ที่มีคุณภาพดีกว่า เมื่อเทียบโปรแกรมคอมพิวเตอร์ใด ๆ ที่มีอยู่
04:05
But this is no easy task,
70
245106
1643
แต่นี่ไม่ใช่อะไรง่าย ๆ
04:06
and the sheer number of languages in the world,
71
246749
2265
และจำนวนคร่าว ๆ ของภาษาในโลกนี้
04:09
as well as the increasing interaction between the people who speak them,
72
249014
3975
เช่นเดียวกันกับ การเพิ่มขึ้นของการมีปฏิสัมพันธ์ ระหว่างผู้ที่พูดภาษาเหล่านั้น
04:12
will only continue to spur greater advances in automatic translation.
73
252989
5015
จะกระตุ้นความก้าวหน้าของการแปลอัตโนมัติ ต่อไปอย่างต่อเนื่อง
04:18
Perhaps by the time we encounter intergalactic life forms,
74
258004
3405
บางที เมื่อถึงเวลา ที่เราจะได้พบกับสิ่งมีชีวิตนอกโลก
04:21
we'll be able to communicate with them through a tiny gizmo,
75
261409
3251
เราจะสามารถสื่อสารกับพวกเขาผ่านอุปกรณ์เล็ก ๆ
04:24
or we might have to start compiling that dictionary, after all.
76
264660
4366
หรือที่สุดแล้ว เราอาจต้อง เริ่มที่จะรวบรวมพจนานุกรมดังกล่าว
เกี่ยวกับเว็บไซต์นี้

ไซต์นี้จะแนะนำคุณเกี่ยวกับวิดีโอ YouTube ที่เป็นประโยชน์สำหรับการเรียนรู้ภาษาอังกฤษ คุณจะได้เห็นบทเรียนภาษาอังกฤษที่สอนโดยอาจารย์ชั้นนำจากทั่วโลก ดับเบิลคลิกที่คำบรรยายภาษาอังกฤษที่แสดงในแต่ละหน้าของวิดีโอเพื่อเล่นวิดีโอจากที่นั่น คำบรรยายเลื่อนซิงค์กับการเล่นวิดีโอ หากคุณมีความคิดเห็นหรือคำขอใด ๆ โปรดติดต่อเราโดยใช้แบบฟอร์มการติดต่อนี้

https://forms.gle/WvT1wiN1qDtmnspy7