Teknologi Pemrosesan Bahasa Alami

ai211.jpeg

Pada prinsipnya bahasa alami adalah suatu bentuk representasi
dari suatu pesan yang ingin dikomunikasikan antar manusia.
Bentuk utama representasinya adalah berupa suara/ucapan
(spoken language), tetapi sering pula dinyatakan dalam bentuk
tulisan.
Bahasa dapat dibedakan menjadi (1) Bahasa Alami, dan (2)
Bahasa Buatan. Bahasa alami adalah bahasa yang biasa
digunakan untuk berkomunikasi antar manusia, misalnya bahasa

images31.jpeg


Indonesia, Sunda, Jawa, Inggris, Jepang, dan sebagainya.
Bahasa buatan adalah bahasa yang dibuat secara khusus untuk
memenuhi kebutuhan tertentu, misalnya bahasa pemodelan atau
bahasa pemrograman komputer.
Chomsky adalah orang yang pertama kali merepresentasikan
bahasa
sebagai rangkaian
simbol. Chomsky
berhasil
memperlihatkan bahwa bahasa apapun dapat direpresentasikan
dengan suatu cara yang universal. Pemikiran Chomsky yang
8
merepresentasikan bahasa sebagai kumpulan simbol-simbol dan
aturan yang mengatur susunan simbol-simbol tersebut telah
membuka peluang untuk melakukan pemrosesan bahasa secara
simbolik dengan teknologi komputer, sehingga melahirkan bidang
ilmu Natural Language Processing (NLP).
Dipandang dari sisi implementasi teknologinya, pemrosesan
bahasa lisan dan tulisan adalah sangat berbeda. Bahasa lisan
lebih banyak melakukan pemrosesan bunyi atau suara,
sedangkan bahasa tulisan lebih banyak melakukan pemrosesan
simbol-simbol tertulis. Sebagai akibatnya, penelitian di bidang
bahasa lisan pada awalnya lebih banyak dilakukan dalam bidang
”signal processing”, sedangkan penelitian-penelitian untuk
pemrosesan bahasa tulisan lebih banyak dilakukan dalam bidang
”artificial intelligence” atau kecerdasan buatan yang pada
prinsipnya melakukan symbolic processing. Saat ini, teknologi
yang berkaitan dengan pemrosesan bahasa alami ini sering
disebut sebagai ”speech and language technology”, “natural
language processing technology”, “human language technology”,
atau dalam beberapa pertemuan ilmiah para peneliti di bidang ini
di Indonesia, menyepakati penggunaan istilah ”teknologi bahasa”
untuk menyebut teknologi ini. Dari segi keilmuan, bidang ini
dikenal sebagai bidang ”natural language processing” atau
”computational linguistic”.
Suatu sistem pemrosesan bahasa alami secara lisan dapat
dibentuk dari tiga sub-sistem, yaitu sebagai berikut.
1) Sub-Sistem Natural Language Processing (NLP),
berfungsi untuk melakukan pemrosesan secara simbolik
terhadap bahasa tulisan. Beberapa bentuk aplikasi sub-Page 5 9
sistem ini adalah translator bahasa alami (misalnya dari
Bahasa Inggris ke Bahasa Indonesia), sistem pemeriksa
sintaks bahasa, sistem yang dapat ”menyimpulkan” suatu
narasi, dan sebagainya.
2) Sub-sistem Text to Speech (TTS), berfungsi untuk
mengubah text (bahasa tulisan) menjadi ucapan (bahasa
lisan).
3) Sub-Sistem Speech Recognition (SR), merupakan
kebalikan teknologi Text to Speech, yaitu sistem yang
berfungsi untuk mengubah atau mengenali suatu ucapan
(bahasa lisan) menjadi text (bahasa tulisan).
Berbeda dengan kebanyakan sistem lain yang bersifat generik,
teknik-teknik yang digunakan dalam pemrosesan bahasa alami
bersifat sangat ‘language dependent’. Suatu sistem atau teknik
yang berlaku untuk suatu bahasa tidak mudah diterapkan untuk
bahasa lainnya.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: