Laporkan Masalah

Sistem Pengenal Tutur Bahasa Indonesia Berbasis Suku Kata Menggunakan MFCC, Wavelet dan HMM

SYAHRONI HIDAYAT, Dr. Ir. Risanuri Hidayat, M.Sc; Teguh Bharata Adji, S.T., M.T., M.Eng., Ph.D.

2015 | Tesis | S2 Teknik Elektro

Bahasa Indonesia merupakan bahasa aglutinasi yang memiliki sufiks dan prefiks yang kompleks yang melekat pada kata dasar. Sehingga hal ini memungkinkan untuk dapat membuat sistem pengenal suara bahasa Indonesia berbasis suku kata. Selain dapat menghemat database, sistem pengenalan suara berbasis suku kata juga memungkinkan untuk dapat mengenali kosa kata bahasa Indonesia baru akibat perkembangan bahasa yang selalu berubah. Tujuan penelitian ini adalah membangun sistem pengenal suara bahasa Indonesia berbasis suku kata dengan pengklasifikasi Hidden Markov Models (HMM). Data suara yang digunakan dalam pelatihan merupakan rekaman suara tutur suku kata. Dan untuk pengujian menggunakan rekaman suara suku kata dan kosa kata. Proses ekstraksi ciri menggunakan metode Mel Frequency Cepstral Coefficient (MFCC) dan Wavelet Packet Transform (WPT) Daubechies orde 3 (DB3) dan orde 7 (DB7). Pengaruh variasi panjang data, panjang sampel, jumlah state, level dekomposisi dan jenis wavelet terhadap hasil pengenalan juga turut diperhatikan. Hasil pengenalan terbaik antar kedua metode ekstraksi kemudian dibandingkan. Hasil menunjukkan bahwa metode MFCC memberikan hasil pengenalan terbaik sebesar 75% dan metode WPT memberikan hasil pengenalan terbaik sebesar 70,8% untuk pengujian dengan data latih, sehingga dengan perbedaan 4,2 % untuk kedua hasil terbaik dapat dikatakan kedua metode relatif seimbang. Sedangkan untuk pengujian dengan data uji, WPT memberikan hasil yang jauh lebih baik dibandingkan MFCC. Dengan hasil pengenalan terbaik untuk metode WPT mencapai 53,1% sedangkan untuk metode MFCC mencapai 47%. Pada metode MFCC akurasi akan meningkat jika panjang data dan panjang frame meningkat. Sedangkan pada WPT, peningkatan akurasi pengenalan dipengaruhi oleh panjang data, jenis wavelet dan level dekomposisi. Adapun variasi state akan membuat hasil pengenelan pada kedua metode menurun.

Indonesian language is an agglutinative language which has complex suffixes and affixes attached to the basic word. For this reason there is a high possibility to build an automatic speech recognition based on Indonesian syllables. Besides reducing the database, the syllable based automatic speech recognition could recognize new Indonesian vocabularies which evolve as the result of language development. The purpose of this research is to build a syllable based speech recognition system of Indonesian language using Hidden Markov Models classifier. For training data set the record of syllable utterances were used. As for testing data set use the records of syllables and lexicon utterances. MFCC method and WPT Daubechies 3rd (DB3) and 7th (DB7) orders were used in the feature extraction process. The influence of data length, sample length, number of state, level of decomposition and type of wavelet to recognition rate were taken into account. Then the best recognition rate of these two methods was compared. The results show that the best recognition rate is relatively balanced with approximation 4.2% difference between them. Where the best recognition result of MFCC method is 75% and for WTP method is 70.8%, which come from the training data test. And for external data test WPT method overcome the MFCC method's result. Where the best recognition rate is 53.1% for WPT and 47% for MFCC. For MFCC the accuracy would increase if the data length and the frame length are increased. As for WPT the increased of accuracy was influenced by the length of data, type of the wavelet and decomposition level. As for the variation of state will make the recognition for both methods decreased.

Kata Kunci : Sistem Pengenal Tutur Bahasa Indonesia, Suku Kata, Mel Frequency Cepstral Coefficient (MFCC), Wavelet Packet Transform (WPT)

  1. S2-2015-321590-abstract.pdf  
  2. S2-2015-321590-bibliography.pdf  
  3. S2-2015-321590-tableofcontent.pdf  
  4. S2-2015-321590-title.pdf