Laporkan Masalah


Ari Fadli, Dr. Eng Ir. Risanuri Hidayat, M.Sc.

2012 | Tesis | S2 Teknik Elektro

Interaksi antara manusia dengan sesamanya dapat dilakukan dengan beberapa cara, seperti suara, bahasa tubuh dan lainnya. Diantara beberapa cara tersebut suara merupakan cara yang paling banyak digunakan oleh manusia dalam berinteraksi. Suara mengandung berbagai informasi diantara yaitu, jenis kelamin, kondisi emosi, usia dan kesehatan. Penelitian ini, membangun sistem identifikasi penutur bergantung kata berbasis pola akustik menggunakan Multi Kelas Support Vector Machine (SVM) dengan pendekatan satu lawan satu (SLU) berdasar berbagai macam tinjauan vektor ciri. Vektor ciri yang digunakan diperoleh dari tiga buah metode yaitu Linear Predictive Cepstral Coefficient (LPCC), Mel- Frequency Cepstral Coefficient (MFCC), dan kombinasi keduanya. Parameter sistem yang diamati terdiri atas variasi pada jumlah ciri, faktor pinalti dan, fungsi kernel. Hasil penelitian menunjukan bahwa penggunaan ciri kombinasi memberikan akurasi identifikasi penutur terbaik, yaitu mencapai 93.75 % dengan jumlah ciri 26. Selain itu, diperoleh hasil bahwa akurasi identifikasi meningkat seiring dengan peningkatan faktor pinalti. Sedangkan pada perubahan fungsi kernel, Fungsi kernel Gaussian RBF memberikan akurasi identifikasi rata-rata yaitu mencapai 85.11% lebih baik dari fungsi kernel Polynomial kernel yaitu sebesar 84.43 %.

Humans interact with one another in several ways such as speech, body language, and so on. Among them, speech communication is the most common in human-to-human interaction. Speech signal is a rich source of information and convey more than spoken words. The additional information conveyed in speech includes gender information, age, speaker’s identity and health. This research studies text-dependent speaker identification based on acoustic feature using Multiclass Support Vector Machines (SVMs) with one-versus-one (OVO) approach on a review of feature vector. Feature vectors, are adopted as a feature used, were obtained from three methods, namely Linear Predictive Cepstral Coefficient (LPCC), Mel-Frequency Cepstral Coefficient (MFCC), and a combination of both. Parameters of this system are variations of the number of features, the penalty factor, and the kernel function. The best result achieved is 93.75% identification rate for 26 number of feature combination. Futhermore, the accuracy of identification with the increase of penalty factor, and Gaussian RBF kernel function results better than Polynomial kernel. Gaussian RBF kernel function achieves 85.11% identification rate, while in Polynomial kernel achieves 84.43 %.

Kata Kunci : SVM, LPCC, MFCC.

    Tidak tersedia file untuk ditampilkan ke publik.