Laporkan Masalah

PENGENALAN TUTUR KATA TERISOLASI MENGGUNAKAN MFCC DAN ANFIS

UTIS SUTISNA, Dr. Eng. Ir. Risanuri Hidayat, M.Sc.

2013 | Tesis | S2 Teknik Elektro

Pengenalan tutur otomatis telah mencapai keberhasilan besar dalam beberapa dekade terakhir namun studi lebih lanjut diperlukan karena tidak ada metode saat ini yang cukup cepat dan tepat sebanding dengan kemampuan pengenalan manusia. Dalam bidang pemrosesan isyarat suara, sistem jaringan neural telah banyak diaplikasikan untuk proses pengenalan suara. Penerapan sistem neuro-fuzzy yang menggabungkan sistem fuzzy dengan jaringan neural dimungkinkan dapat memberikan hasil yang baik. Dalam penelitian ini Adaptive Neuro Fuzzy Inference System (ANFIS) digunakan untuk pengenalan tutur dalam Bahasa Indonesia dengan ekstraksi ciri menggunakan algoritma Mel-Frequency Cepstrum Coefficient (MFCC). Sistem neuro-fuzzy ini mempunyai dua fase awal. Fase pertama adalah identifikasi sistem menggunakan algoritma Fuzzy C-Means (FCM) yang mengidentifikasi parameterparameter dan menginisialisasi aturan-aturan yang digunakan pada sistem inferensi fuzzy (fuzzy inference system, FIS). Fase kedua adalah pelatihan sistem fuzzy dengan menggunakan ANFIS untuk mengoptimasi parameter-parameter sistem fuzzy. Sistem ini menerapkan jumlah aturan fuzzy yang bervariasi. Unjuk kerja sistem dievaluasi menggunakan sampel tutur untuk pelatihan dan pengujian. Hasil pengujian dengan data pelatihan menunjukkan bahwa tingkat akurasi rata-rata tertinggi pengenalan adalah 100%. Pengujian dengan data pengujian memberikan hasil tingkat akurasi rata-rata tertinggi 89,33% dengan jumlah aturan fuzzy 100.

Automatic Speech Recognition has achieved substantial success in the past few decades but more studies are needed because none of the current methods are fast and precise enough to be comparable with human recognition abilities. In the area of voice signal processing, neural network system has been widely applied to speech recognition process. Implementation of neuro-fuzzy system that combine fuzzy system with neural network is possible to provide good results. In this study the Adaptive Neuro Fuzzy Inference System (ANFIS) is used for speech recognition in Indonesian with feature extraction using Mel-frequency cepstrum algorithm Coefficient (MFCC). Neuro-fuzzy system has two initial phases. The first phase is the system identification using Fuzzy C-Means (FCM) algorithm to identify and initialize the parameters of the rules used in fuzzy inference system (FIS). The second phase is fuzzy systems training using ANFIS to optimize the parameters of fuzzy system. The system implements variation of the number of fuzzy rule. System performance was evaluated using speech samples for training and testing. The test results using training data show that the highest average accuracy of recognition is 100%. Testing with test data yield the highest average accuracy rate of 89,33% with the number of fuzzy rules of 100.

Kata Kunci : pengenalan tutur kata-terisolasi, MFCC, FCM, ANFIS


    Tidak tersedia file untuk ditampilkan ke publik.