PENGENALAN UCAPAN PADA ORANG DENGAN DYSARTHRIA MENGGUNAKAN CONVOLUTIONAL NEURAL NETWORK
MEISYARAH DWIASTUTI, Afiahayati, S.Kom., M.Cs., Ph.D.
2017 | Skripsi | S1 ILMU KOMPUTERDysarthria merupakan gangguan berbicara motorik yang isebabkan oleh gangguan neurologis. Orang dengan dysarthria pada umumnya sulit untuk menggerakkan otot pada tubuh, termasuk otot pada bagian sekitar mulut sehingga artikulasi pada ucapan orang dengan dysarthria menjadi tidak terlalu jelas. Karena pada umumnya penderita dysarthria kesulitan menggerakkan anggota tubuh, Automatic Speech Recognition (ASR) lebih dipertimbangkan untuk diterapkan pada assistive technology dibandingkan metode input berupa tombol atau alat ketik. Akan tetapi ASR komer- sial yang berkembang luas saat ini memiliki performa yang tidak terlalu baik ketika digunakan oleh orang dengan dysarthria. Metode Convolutional Neural Network (CNN) terkenal dengan kemampuannya untuk mengenali pola, termasuk untuk mengenali ucapan. Penerapannya pada ASR untuk orang tanpa gangguan berbicara menghasilkan performa yang baik. Pada penelitian ini diimplementasikan metode CNN untuk masalah pengenalan ucapan digit terpisah bersifat speaker-dependent pada orang dengan dysarthria. Model dibangun dan dievaluasi menggunakan tiga data subjek dengan dysarthria dan satu subjek tanpa gangguan yang diperoleh dari UA Speech Database. Evaluasi performa terbaik yang diperoleh ialah rata-rata akurasi 90, 43% dan NRMSE 0, 1366. Model CNN yang dibangun menghasilkan rata-rata akurasi yang lebih tinggi dibandingkan dengan model MLP ketika dievaluasi dengan tiga subjek dysarthria.
Dysarthria is a motoric speech impairment caused by neurological impairment. People with dysarthria often find difficulty in moving their muscles, including the ones around mouth and articulators, thus the speech produced is not too intelligible. Since speakers with dysarthria are often physically incapacitated, Automatic Speech Recognition (ASR) is more preferred to be implemented in an assistive technology than conventional input method such as buttons or typing tools. However, commercial ASRs available today have not reached a good performance when being used by speakers with dysarthria. Convolutional Neural Network (CNN) is well-known for its capability at recognizing pattern, including speech. Its implementation in ASR is able to achieve good performance. In this research, CNN is implemented to build a speaker-dependent isolated-word digit speech recognizer for speakers with dysarthria. The recognizer model is built and evaluated with data of 3 speakers with dysarthria and 1 control speaker. Data speech is provided by UASpeech Database. The best performance obtains average accuracy of 90, 43% and NRMSE of 0, 1366. The CNN model results higher average accuracy than MLP model when being evaluated with 3 subjects with dysarthria.
Kata Kunci : speech recognition, convolutional neural network, dysarthria