Ekstraksi Ciri dan Pengenalan Tutur Vokal Bahasa Indonesia Menggunakan Metode Discrete Wavelet Transform (DWT) dan Dynamic Time Warping (DTW)
A. ASNI B., Dr.Eng. Ir. Risanuri Hidayat, M.Sc.; Noor Akhmad Setiawan, S.T., M.T., Ph.D.
2014 | Tesis | S2 Teknik ElektroHasil pengenalan tutur dipengaruhi oleh beberapa faktor diantaranya sifat tidak stasioner isyarat tutur, perbedaan kecepatan tutur, dan derau. Untuk mengoptimalkan hasil pengenalan tutur metode Dynamic Time Warping (DTW) diperlukan suatu metode ekstraksi ciri Discrete Wavelet Transform (DWT) yang tepat. Tujuan dari penelitian ini adalah untuk menemukan metode ekstraksi ciri DWT yang optimal berdasarkan hasil pengenalan tutur DTW yang diterapkan pada isyarat tutur vokal Bahasa Indonesia. Tiga metode ekstraksi ciri dibandingkan yaitu; metode pertama menggunakan metode dyadic DWT level 8 yang terdiri dari 9 ciri, metode kedua menggunakan full binary DWT level 3 yang terdiri dari 8 ciri dan metode ketiga menggunakan full binary DWT level 5 yang terdiri dari 32 ciri. Pengukuran DTW dilakukan untuk menentukan metode DWT yang optimal. Jumlah pengukuran tiap metode yang akan dibandingkan adalah 25 dari 225 pasang vektor ciri. Hasil yang diperoleh sebagai berikut: metode pertama memberikan 4 dari 25 hasil pengukuran terbaik (16%), metode kedua memberikan 18 dari 25 hasil pengukuran terbaik (72%), sementara metode ketiga hanya memberikan 3 dari 25 hasil pengukuran terbaik (12%). Metode kedua diuji pada 7 penutur yang berbeda. Data referesi diuji secara bergantian, sehingga diperoleh 1050 pasang data pengukuran. Hasil persentase rata-rata pengenalan yang diperoleh mencapai 95,38%, yang menunjukkan bahwa metode DWT yang diusulkan dapat digunakan secara bersamaan dengan metode DTW untuk pengenalan isyarat tutur vokal Bahasa Indonesia.
The results of speech recognition are affected by several factors, including non stationer properties of speech signals, the difference in speed of speech, and noise. To optimize the results of speech recognition using Dynamic Time Warping (DTW) method, an appropriate method of Discrete Wavelet Transform (DWT) feature extraction is needed. The purpose of this research is to find an optimal method of DWT feature extraction based on the results of DTW speech recognition applied on speech signal of Indonesian vowel. Three methods of feature extraction are compared. First method is using Dyadic DWT Level 8 that is to consists of 9 features. Second method is using Full Binary DWT Level 3 that is to consists of 8 features. Third method is using Full Binary DWT Level 5 that is to consists of 32 features. Measurement of DTW is done to determine the optimal method of DWT. The number of measurement from each method that is used for comparison is 25 out of 225 pairs of feature vector. The results obtained are as the following: the first method yields 4 out of 25 best measurement results (16%), the second method yields 18 out of 25 best measurement results (72%), while the third method yields only 3 out of 25 best measurement results (12%). The second method is tried on 7 different speakers. The reference data is tested alternately in order to obtain 1050 pair of measurement data. The obtained results of an average percentage of recognition reach 95.38% that indicate the proposed DWT method can be applied simultaneously with DTW method for the recognition of Indonesian vowel speech signal.
Kata Kunci : Dynamic Time Warping; DTW; Discrete Wavelet Transform; DWT