How computers translate human language - Ioannis Papachimonas

423,128 views ・ 2015-10-26

TED-Ed


Silakan klik dua kali pada teks bahasa Inggris di bawah ini untuk memutar video.

Translator: Faisal Gazali Reviewer: Reno Kanti Riananda
00:06
How is it that so many intergalactic species in movies and TV
0
6677
4629
Bagaimana caranya banyak makhluk luar angkasa di film-film
00:11
just happen to speak perfect English?
1
11306
3177
bisa kebetulan lancar berbahasa Inggris?
00:14
The short answer is that no one wants to watch a starship crew
2
14483
3403
Jawaban singkatnya, tidak ada yang mau melihat seorang kru kapal angkasa
00:17
spend years compiling an alien dictionary.
3
17886
3888
menyusun kamus bahasa alien selama bertahun-tahun.
00:21
But to keep things consistent,
4
21774
1618
Namun, demi menjaga konsistensi,
00:23
the creators of Star Trek and other science-fiction worlds
5
23392
3397
pencipta Star Trek dan dunia fiksi ilmiah lainnya
00:26
have introduced the concept of a universal translator,
6
26789
3725
memperkenalkan konsep penerjemah universal,
00:30
a portable device that can instantly translate between any languages.
7
30514
4498
alat portabel yang secara instan menerjemahkan bermacam bahasa.
00:35
So is a universal translator possible in real life?
8
35012
3527
Jadi, apakah penerjemah universal mungkin ada di kehidupan nyata?
00:38
We already have many programs that claim to do just that,
9
38539
3598
Kini sudah ada beberapa program yang mengklaim bisa melakukannya,
00:42
taking a word, sentence, or entire book in one language
10
42137
3817
mengambil sebuah kata, kalimat, atau seluruh isi buku dalam satu bahasa
00:45
and translating it into almost any other,
11
45954
3050
dan menerjemahkannya ke hampir semua bahasa lain,
00:49
whether it's modern English or Ancient Sanskrit.
12
49004
3333
seperti Inggris modern atau Sansekerta kuno.
00:52
And if translation were just a matter of looking up words in a dictionary,
13
52337
3576
Jika penerjemahan hanya soal mencari kata-kata di kamus,
00:55
these programs would run circles around humans.
14
55913
3912
program-program ini akan melampaui manusia.
00:59
The reality, however, is a bit more complicated.
15
59825
3474
Namun, kenyataannya sedikit lebih rumit.
01:03
A rule-based translation program uses a lexical database,
16
63299
4050
Program terjemahan berbasis aturan menggunakan pangkalan data leksikal,
01:07
which includes all the words you'd find in a dictionary
17
67349
2953
yang memasukkan semua kata dalam kamus
01:10
and all grammatical forms they can take,
18
70302
2981
dan bentuk gramatikal yang ada,
01:13
and set of rules to recognize the basic linguistic elements in the input language.
19
73283
5642
dan membuat aturan untuk mengenali dasar elemen linguistik dalam bahasa input.
01:18
For a seemingly simple sentence like, "The children eat the muffins,"
20
78925
3471
Untuk kalimat yang tampak simpel seperti, "Anak-anak makan bolu",
01:22
the program first parses its syntax, or grammatical structure,
21
82396
4654
pertama-tama program memilah sintaksnya, atau struktur tata bahasa,
01:27
by identifying the children as the subject,
22
87050
2537
dengan mengidentifikasi 'anak-anak' sebagai subjek,
01:29
and the rest of the sentence as the predicate
23
89587
2730
dan bagian lain kalimat sebagai predikat
01:32
consisting of a verb "eat,"
24
92317
2051
terdiri atas verba 'makan',
01:34
and a direct object "the muffins."
25
94368
3054
dan objek langsung 'bolu'.
01:37
It then needs to recognize English morphology,
26
97422
2827
Lalu program harus mengenali morfologi bahasa Inggris,
01:40
or how the language can be broken down into its smallest meaningful units,
27
100249
4432
atau bagaimana bahasa dapat diuraikan ke dalam unit terkecil yang bermakna,
01:44
such as the word muffin
28
104681
1443
seperti kata 'bolu'
01:46
and the suffix "s," used to indicate plural.
29
106124
3631
dan akhiran "-s", yang digunakan untuk menyatakan benda jamak.
01:49
Finally, it needs to understand the semantics,
30
109755
2694
Akhirnya, program harus mengerti semantik,
01:52
what the different parts of the sentence actually mean.
31
112449
3729
apa makna sebenarnya dari bagian kalimat yang berbeda.
01:56
To translate this sentence properly,
32
116178
1896
Untuk menerjemahkan secara tepat,
01:58
the program would refer to a different set of vocabulary and rules
33
118074
3908
program akan merujuk ke perangkat kosakata dan aturan yang berbeda
02:01
for each element of the target language.
34
121982
3184
untuk tiap elemen dalam bahasa target.
02:05
But this is where it gets tricky.
35
125166
1854
Namun, di sini letak kesulitannya.
02:07
The syntax of some languages allows words to be arranged in any order,
36
127020
4800
Sintaks beberapa bahasa memungkinkan kata-kata diatur dalam urutan apa pun,
02:11
while in others, doing so could make the muffin eat the child.
37
131820
5134
sementara di bahasa lain, bisa menjadi 'bolu makan anak-anak'.
02:16
Morphology can also pose a problem.
38
136954
2693
Morfologi bisa juga menjadi masalah.
02:19
Slovene distinguishes between two children and three or more
39
139647
3596
Bahasa Slovenia membedakan dua anak, tiga, atau lebih
02:23
using a dual suffix absent in many other languages,
40
143243
3854
menggunakan akhiran ganda yang tidak ada dalam banyak bahasa lain,
02:27
while Russian's lack of definite articles might leave you wondering
41
147097
3435
minim partikel di bahasa Rusia mungkin membingungkan
02:30
whether the children are eating some particular muffins,
42
150532
3043
apakah (anak-anak makan bolu jenis tertentu),
02:33
or just eat muffins in general.
43
153575
3144
atau hanya bolu secara umum.
02:36
Finally, even when the semantics are technically correct,
44
156719
2989
Akhirnya, meskipun semantik benar secara teknis,
02:39
the program might miss their finer points,
45
159708
3049
program ini mungkin melewatkan inti makna,
02:42
such as whether the children "mangiano" the muffins,
46
162757
3052
misalkan apakah anak-anak itu "memakan" bolu,
02:45
or "divorano" them.
47
165809
1985
atau "melahap".
02:47
Another method is statistical machine translation,
48
167794
3764
Metode lainnya yaitu penerjemahan mesin statistik,
02:51
which analyzes a database of books, articles, and documents
49
171558
4204
yang menganalisis pangkalan data beberapa buku, artikel, dan dokumen
02:55
that have already been translated by humans.
50
175762
3726
yang telah diterjemahkan manusia.
02:59
By finding matches between source and translated text
51
179488
3471
Dengan mencari kecocokan antara sumber dan teks yang sudah diterjemahkan
03:02
that are unlikely to occur by chance,
52
182959
2434
yang tidak mungkin terjadi kebetulan,
03:05
the program can identify corresponding phrases and patterns,
53
185393
3952
program ini bisa mengidentifikasi hubungan frasa dan pola,
03:09
and use them for future translations.
54
189345
3084
dan menggunakannya untuk terjemahan berikutnya .
03:12
However, the quality of this type of translation
55
192429
2540
Namun, kualitas penerjemahan jenis ini
03:14
depends on the size of the initial database
56
194969
2721
bergantung pada ukuran pangkalan data awal
03:17
and the availability of samples for certain languages
57
197690
3667
dan ketersediaan sampel untuk bahasa
03:21
or styles of writing.
58
201357
2026
atau gaya penulisan tertentu.
03:23
The difficulty that computers have with the exceptions, irregularities
59
203383
3757
Kesulitan yang dimiliki komputer dengan pengecualian, penyimpangan,
03:27
and shades of meaning that seem to come instinctively to humans
60
207140
3854
dan ragam makna yang naluriah bagi manusia
03:30
has led some researchers to believe that our understanding of language
61
210994
4051
telah membuat beberapa peneliti percaya bahwa pemahaman kita dalam berbahasa
03:35
is a unique product of our biological brain structure.
62
215045
4206
adalah produk unik dari struktur biologis otak.
03:39
In fact, one of the most famous fictional universal translators,
63
219251
3850
Bahkan, salah satu penerjemah universal fiktif yang paling terkenal,
03:43
the Babel fish from "The Hitchhiker's Guide to the Galaxy",
64
223101
3338
ikan Babel dari film "The Hitchhiker's Guide to the Galaxy",
03:46
is not a machine at all but a small creature
65
226439
3287
sama sekali bukan mesin, melainkan hewan kecil
03:49
that translates the brain waves and nerve signals of sentient species
66
229726
4484
yang menerjemahkan gelombang otak dan sinyal syaraf spesies lain
03:54
through a form of telepathy.
67
234210
2795
dengan cara telepati.
03:57
For now, learning a language the old fashioned way
68
237005
2721
Saat ini, belajar bahasa dengan cara biasa
03:59
will still give you better results than any currently available computer program.
69
239726
5380
masih memberi hasil yang lebih baik daripada program komputer yang tersedia.
04:05
But this is no easy task,
70
245106
1643
Namun ini bukan tugas mudah,
04:06
and the sheer number of languages in the world,
71
246749
2265
dan jumlah bahasa di dunia,
04:09
as well as the increasing interaction between the people who speak them,
72
249014
3975
juga pertumbuhan interaksi antar masyarakat,
04:12
will only continue to spur greater advances in automatic translation.
73
252989
5015
akan terus memacu kemajuan lebih besar dalam terjemahan otomatis.
04:18
Perhaps by the time we encounter intergalactic life forms,
74
258004
3405
Mungkin pada saat kita menjumpai kehidupan lain di luar angkasa,
04:21
we'll be able to communicate with them through a tiny gizmo,
75
261409
3251
kita akan bisa berkomunikasi dengan mereka dengan sebuah alat kecil,
04:24
or we might have to start compiling that dictionary, after all.
76
264660
4366
atau mungkin kita harus mulai menyusun kamusnya.
Tentang situs web ini

Situs ini akan memperkenalkan Anda pada video YouTube yang berguna untuk belajar bahasa Inggris. Anda akan melihat pelajaran bahasa Inggris yang diajarkan oleh guru-guru terbaik dari seluruh dunia. Klik dua kali pada subtitle bahasa Inggris yang ditampilkan di setiap halaman video untuk memutar video dari sana. Subtitle bergulir selaras dengan pemutaran video. Jika Anda memiliki komentar atau permintaan, silakan hubungi kami menggunakan formulir kontak ini.

https://forms.gle/WvT1wiN1qDtmnspy7