Laporkan Masalah

Pengaruh berbagai ekstraksi ciri terhadap tingkat pengenalan isyarat tutur pada sistem pengenal tutur model Markov tersembunyi

ALIYU, Asniar, Prof. Adhi Susanto, M.Sc., Ph.D

2009 | Tesis | S2 Teknik Elektro

Penelitian ini bertujuan untuk mengetahui pengaruh berbagai ektraksi ciri terhadap tingkat keberhasilan pengenalan sistem pengenal tutur HMM. Adapun kata-kata yang coba dikenali adalah instruksi kendali pada kaset rekaman (tape recorder), yaitu: main (play), berhenti (stop), rehat (pause), maju (forward), mundur (backward), rekam (record), buka (open), hapus (erase), dan tutup (close). Penelitian ini diawali dengan merekam isyarat tutur dari banyak orang laki-laki dan perempuan dari berbagai kelompok umur. Kemudian dilakukan ekstraksi ciri dengan analisis LPCmurni, LPCCepstral, Cepstrum, FFT, dan kombinasi ciri atas ekstraksi ciri tersebut, sehingga dihasilkan runtun vektor observasi sebagai ciri isyarat tutur. Pelatihan dengan HMM atas runtun vektor observasi menghasilkan model-model HMM untuk masing-masing kata dari 100 isyarat tutur yang telah direkam. Selanjutnya adalah melakukan pengujian modelmodel HMM hasil pelatihan terhadap runtun observasi isyarat tutur pelatihan, runtun observasi isyarat tutur lain, dan runtun observasi isyarat tutur yang ditambah derau. Pengujian juga dilakukan secara waktu nyata. Berdasarkan hasil pengujian terhadap isyarat tutur pelatihan didapatkan bahwa tingkat keberhasilan pengenalan tertinggi adalah HMM antara 93 % dan 99.8%, dan terendah adalah FFT hanya sebesar 64.6 %. Pada pengujian terhadap isyarat tutur lain menunjukkan bahwa tingkat keberhasilan pengenalan tertinggi adalah HMM antara 82.7% dan 99%, dan terendah adalah FFT sebesar 61.7%. Pengujian atas isyarat ditambah derau menunjukkan bahwa ciri untuk nilai S/N dari 55 dB hingga 35 dB tingkat keberhasilan pengenalan dengan HMM cenderung tetap antara 92% dan 99% dan semakin berkurang di bawah nilai 45 dB, kecuali pada FFT tingkat keberhasilnnya cenderung tetap dengan 55 hingga 35 dB, yaitu 54% dan cenderung turun dibawah nilai S/N tersebut. Dalam pengujian waktu nyata menunjukkan bahwa rerata tingkat keberhasilan pengenalan tertinggi adalah HMM antara 96.7 % dan 100% dan terendah adalah FFT sebesar 62.2 %. Untuk ciri kombinasi lainnya tidak diuji secara waktu nyata karena tingkat keberhasilan pengenalannya dibawah tingkat pengenalan ciri FFT.

The aim of this tesis is to find the effects of any feature extraction scheme to success of recognition in HMM speech system. The words to be recognized to control the function of recorder tape are main (play), berhenti (stop), rehat (pause), maju (forward), mundur (backward), rekam (record), buka (open), hapus (erase), dan tutup (close). This research started with the recording the speech signals from many people, included man and women of all ages. Then, continued with the feature extraction using LPC, LPCCepstral Cepstrum, FFT analysis and their combinations to acquire the best representing features of those speech signals. The one hundred training HMM sample sequences there were used as the HMM models for each word. Finally, testing these HMM models with some added noises. These tested were done in a real time. The result shows that the highest successful level of recognition to speech signals in the training for HMM are between 93% and 97,7%, and the lowest one is FFT that gives 64,6%. Based on testing result in another speech signal the highest successful level of recognition for HMM are between 82,7% and 99%, and the lowest one is FFT that gives 61.7 %. The testing with speech signals added with noises for S/N between 55 and 45 dB show that the recognition successes more or less constant between 92% and 99% and tends to decrease for S/N values bellow 45 dB except with FFT the recognition tends to be constant from 55 to 35 dB or around 54% and tend to decrese further. In the real time it shows that the highest level of succesful recognition is between 98,7% and 100% and the lowest one is with FFT that gives 62,2 %. Another feature combination do not tested because the succcesful recognition lower than a level FFT’s recognition.

Kata Kunci : Ekstraksi ciri,Pengenalan tutur,HMM, Feature Extraction, Speech Recognition, HMM.


    Tidak tersedia file untuk ditampilkan ke publik.