Laporkan Masalah

PENGENALAN SUARA UCAPAN SUKU KATA BAHASA LISAN BAHASA INDONESIA DENGAN MENGGUNAKAN CIRI LPC, MFCC DAN JARINGAN SYARAF TIRUAN

Abriyono, S.Kom, Drs. Agus Harjoko, M.Sc., Ph.D.

2012 | Tesis | S2 Ilmu Komputer

Suara adalah salah satu alat komunikasi antar manusia yang efektif dan digemari. Selain sebagai alat komunikasi antar manusia, suara manusia telah digunakan pada taraf yang lebih besar saat sekarang. Suara telah dijadikan sebagai salah satu alat komunikasi antara manusia dan komputer (mesin). Hal ini dapat diamati melalui aplikasi-aplikasi yang telah menerapkan suara sebagai alat komunikasi tersebut seperti pada perintah-perintah ke robot dan perabot rumah tangga, aplikasi konversi suara menjadi teks digital dalam bahasa tertentu, dan lain sebagainya. Pada penelitian ini, peneliti memfokuskan diri pada pengenalan suara ucapan kata dalam Bahasa Indonesia Pengenalan ucapan kata dalam Bahasa Indonesia masih minim dilakukan, selain itu cakupan jumlah katanya pun masih kecil. Pada penelitian ini, peneliti melakukan pengenalan ucapan kata Bahasa Indonesia dengan memecah kata Bahasa Indonesia ke dalam bentuk suku kata bahasa lisan. Pemecahan ke dalam bentuk lafal kata diharapkan mampu mengurangi jumlah kata yang sangat besar, namun tetap mengakomodasi seluruh kata yang dalam Bahasa Indonesia. Total jumlah lafal kata yang ditemukan oleh peneliti adalah 1741 suku kata bahasa lisan. Peneliti membagi sistem dalam 4 bagian besar, yakni proses perekaman, pre-processing, ekstraksi ciri, dan pengenalan. Pada proses perekaman digunakan frekuensi 11025 Hz, Mono, 8 bit. Pada pre-processing digunakan proses bantuan seperti pre-emphasis, segmentasi, framing, dan windowing. Sedangkan untuk ekstraksi ciri dan pengenalan digunakan ciri LPC/MFCC dan identifier jaringan syaraf tiruan backpropagation. Data pelatihan yang digunakan pada penelitian ini adalah rekaman suara dari 3 orang yang setiap orangnya mengucapkan setiap suku kata sebanyak 2 kali. Sedangkan untuk data pengujian digunakan rekaman suara yang berbeda dari data pelatihan namun dari 3 orang yang sama. Rekaman suara untuk data pengujian adalah 1 kali ucapan setiap suku kata oleh 3 orang tersebut. Hasil pengenalan dengan pendekatan yang dibangun menunjukkan hasil yang belum memuaskan, yakni dengan kemampuan pengenalan terbaik sebesar 0.65% dengan ciri MFCC.

Voice is one of effective and convinienced communication’s medium among human. However, the used of voice is not only for communication among human but also has another role nowadays. Voice becomes communication medium for human and computer (machine). This fact can be observed through many applications likes robot, home appliances, voice-text conversion software in specific language, and many more. In this research, researcher focus on the recognition of Indonesian word. The research for Indonesian word recognition was still at low amount. The word used for research was at small amount too. In this research, researcher divides the word into the speech syllable. The aim for the dividing system is to reduce the large amount of the word, but still cover all of the word. Researcher found and used 1741 speech syllables in this research. Researcher used several approaches in managing the recognition. The approaches are 11025 Hz, Mono, 8 bit for recording, pre-emphasized, segmentation, framing, and windowing for preprocessing, LPC and MFCC for the features, and back-propagation neural network for the identifier. Used training data in this research was recorded voice from three person which was pronounced twice every person for each of the Indonesian’s speech syllables. For the testing data, researcher used different recorded voice from training data but was pronounced by the same person. The testing data recorded one pronounciation every person for each of the speech syllables. The result using this approach was not reached good performance. The best result performed 0.65% by using MFCC feature.

Kata Kunci : pengenalan suara, pengenalan ucapan kata Bahasa Indonesia, LPC, MFCC, jaringan syaraf tiruan, backpropagation.


    Tidak tersedia file untuk ditampilkan ke publik.