SISTEM PENGENALAN UCAPAN UNTUK ANGKA DALAM BAHASA INDONESIA MENGGUNAKAN ELMAN RECURRENT NEURAL NETWORK YANG DIOPTIMASI DENGAN PARTICLE SWARM OPTIMIZATION; SPEECH RECOGNITION SYSTEM FOR INDONESIAN DIGITS USING ELMAN RECURRENT NEURAL NETWORK OPTIMIZED BY PARTICLE SWARM OPTIMIZATION
MUHAMMAD FACHRIE, Agus Harjoko
2014 | Disertasi | PROGRAM STUDI S2 ILMU KOMPUTERPenelitian ini bertujuan membangun sebuah sistem pengenalan suara otomatis (Automatic Speech Recognition System) untuk mengenali ucapan berupa angka dalam Bahasa Indonesia (angka 0 s.d. 9). Database berisi 1000 data suara yang masing-masingnya disegmentasi ke dalam sejumlah frame dengan panjang 25 ms dan panjang overlap antar frame sebesar 10 ms. Proses time alignment dilakukan dengan mengambil 10 frame secara proporsional dari keseluruhan frame yang dimiliki oleh setiap suara, kemudian dari masing-masing frame tersebut diekstrak 11 koefisien ciri MFCC, sehingga menghasilkan total 110 ciri MFCC untuk setiap suara. Recognizer yang digunakan dalam penelitian ini adalah Elman Recurrent Neural Network (ERNN) yang dilatih menggunakan Particle Swarm Optimization (PSO). Arsitektur terbaik dari ERNN yang dihasilkan adalah 110-20-10 dengan akurasi < 50%, yakni sebesar 43.60% dari total 1000 sampel suara (500 data latih + 500 data uji), jauh lebih rendah daripada akurasi ERNN yang dilatih menggunakan Backpropagation yang mencapai akurasi > 90%. Hal ini disebabkan oleh dimensi bobot jaringan ERNN yang sangat besar, sehingga ruang pencarian PSO pun semakin besar.
Kata Kunci : SISTEM PENGENALAN UCAPAN, ELMAN RECURRENT NEURAL NETWORK, PARTICLE SWARM OPTIMIZATION