Laporkan Masalah

PENINGKATAN AKURASI PENGENALAN TUTUR VOKAL BAHASA INDONESIA MENGGUNAKAN ALGORITMA MFCC PCA/SVD

ANGGUN WINURSITO, Dr.Ir.Risanuri Hidayat,M.Sc. ; Agus Bejo,S.T.,M.Eng.,D.Eng.

2018 | Tesis | MAGISTER TEKNIK ELEKTRO

Perkembangan sistem pengenalan suara meningkat dengan pesat pada abad ini. Banyak pengembangan metode yang telah dilakukan. Mel Frequency Cepstral Coefficients (MFCC) menjadi metode ekstraksi ciri yang populer, namun dalam penerapannya masih terdapat berbagai kelemahan. Tingkat akurasi pengenalan pada metode ekstraksi ciri MFCC yang masih rendah menjadi bagian penting yang perlu untuk dikembangkan, terutama pada kasus pengenalan suara Bahasa Indonesia yang masih terbatas. Penelitian ini bertujuan untuk mengembangkan metode ekstraksi ciri MFCC dalam hal meningkatkan akurasi sistem pengenalan tutur vokal Bahasa Indonesia. Pengembangan dilakukan dengan mengkombinasikan metode ekstraksi ciri MFCC dan algoritma PCA/SVD. Dalam penelitian ini masing-masing algoritma PCA dan SVD dirancang menjadi 2 versi untuk menguji performa dari sistem pengenalan suara menggunakan kombinasi metode ekstraksi ciri dan algoritma PCA/SVD. Metode klasifikasi yang digunakan dalam penelitian ini adalah K-Nearest Neighbour (KNN). Data suara yang digunakan untuk menyusun dataset dalam penelitian ini terdiri dari 150 data suara vokal Bahasa Indonesia yang berasal dari 30 penutur. Pengujian dilakukan menggunakan teknik 10-fold Cross Validation dengan membagi dataset menjadi data uji dan data latih secara acak. Hasil penelitian menunjukkan bahwa peningkatan akurasi tertinggi dihasilkan oleh metode versi 1 baik pada kombinasi metode MFCC + PCA maupun metode MFCC + SVD. Metode MFCC + PCA maupun MFCC + SVD mampu meningkatkan akurasi sistem pengenalan dari metode konvensional sebesar 86,42% menjadi 91,42%. Hasil penelitian menunjukkan bahwa penambahan algoritma PCA dan SVD dalam ekstraksi ciri metode MFCC terbukti dapat meningkatkan akurasi sistem pengenalan suara vokal Bahasa Indonesia. Selain itu, penambahan algoritma PCA/SVD baik versi 1 maupun versi 2 dalam metode ekstraksi ciri MFCC hanya memperngaruhi waktu komputasi algoritma keseluruhan sistem paling lama sebesar 0,15 detik dari metode MFCC konvensional.

The development of the speech recognition system has grown substantially in this century. Many methods have been developed. Mel Frequency Cepstral Coefficients (MFCC) is a popular feature extraction method, but in its application there are various weaknesses. The accuracy of recognition systems on the MFCC feature extraction methods is still low to be an important part that needs to be developed, especially in case of speech recognition of Indonesian language. This study aims to develop MFCC feature extraction methods in terms of improving the accuracy of speech recognition system of Indonesian vowels. The development is done by combining MFCC feature extraction method and PCA / SVD algorithm. In this study each PCA and SVD algorithm was designed into 2 versions to test the performance of the speech recognition system using a combination of feature extraction methods and PCA / SVD algorithms. The method of classification used in this research is K-Nearest Neighbors (KNN). The speech data used to construct the dataset in this study consists of 150 Indonesian speech sound data from 30 speakers. The testing was performed using a 10-fold Cross Validation technique by dividing the dataset into data testing and data training randomly. The results showed that the highest accuracy improvement was produced by the method of version 1 both in combination of MFCC + PCA method and MFCC + SVD method. MFCC + PCA and MFCC + SVD method can improve the recognition system accuracy from conventional method by 86.42% to 91.42%. The results showed that the addition of PCA and SVD algorithm in feature extraction of MFCC method proved to improve the accuracy of Indonesian vowell speech recognition system. In addition, the addition of PCA / SVD algorithm in both version 1 and version 2 in the MFCC feature extraction method only affects the overall system algorithm computation time of 0.15 seconds from the conventional MFCC method.

Kata Kunci : Sistem Pengenalan Suara,Tutur Vokal Bahasa Indonesia,MFCC,PCA,SVD,KNN