PERANCANGAN ARSITEKTUR CNN SECARA OTOMATIS MENGGUNAKAN CARTESIAN GENETIC PROGRAMMING UNTUK PENGENALAN UCAPAN ORANG DYSARTHRIA
Julio Jeffer Maliangkay, Anny Kartika Sari, S.Si, M.Sc., Ph.D
2019 | Skripsi | S1 ILMU KOMPUTERCNN state-of-the-art biasanya dirancang oleh para ahli yang memiliki pengetahuan domain yang baik tentang data yang diselidiki maupun CNN. Karena kinerja CNN sangat bergantung pada data yang diteliti, trial-and-error atau pengetahuan ahli diperlukan dalam membangun arsitektur yang sesuai untuk dataset target. Untuk menangani ini, diperlukan algoritma yang memungkinkan peneliti untuk secara otomatis memperoleh CNN dengan kinerja terbaik untuk data yang diberikan. Penelitian ini bertujuan untuk membangun algoritma otomatis menggunakan Cartesian Genetic Programming untuk klasifikasi pengucapan digit terpisah bersifat speaker-dependent pada orang dengan dysarthria. Dysarthria sendiri merupakan gangguan berbicara motorik yang disebabkan oleh gangguan neurologis. CGP pada dasarnya adalah metode representasi genetik berbasis integer yang sangat sederhana dari suatu program dalam bentuk directed graph. Pada penelitian ini CGP digunakan untuk membangun CGP-CNN yaitu directed graph yang berisi lapisan CNN sebagai node yang saling berhubungan. Untuk mencari arsitektur yang optimal secara otomatis digunakan Evolutionary Strategy dengan akurasi klasifikasi sebagai fungsi fitness. Model dibangun dan dievaluasi menggunakan lima subjek dengan dysarthria dan dua subjek tanpa gangguan yang diperoleh dari UA Speech Database menghasilkan rata-rata akurasi pengucapan sebesar 94.9%. Untuk perbandingan, model CGP-CNN menghasilkan rata-rata akurasi model pada tiga subjek dysarthria mencapai 90.9%, yaitu lebih tinggi sebesar 2.33% dibandingkan dengan model CNN pada penelitian sebelumnya yang sebesar 88.57%. Berdasarkan hasil tersebut disimpulkan bahwa CGP-CNN berhasil membangun model yang lebih baik dibandingkan penelitian sebelumnya.
CNN state-of-the-art was specifically designed by experts who had good domain knowledge about CNN an the investigated data. Because CNN performance is very dependent on input data, trial-and-error or expert knowledge is required to build the architecture that is suitable for the target dataset. To allow this, an algorithm is needed for the researcher to obtain the best performance CNN for the data provided. This study was designed to build an automatic algorithm using Cartesian Genetic Programming for speaker-dependent digit pronunciation in people with dysarthria. Dysarthria itself is a motor speech disorder caused by a neurological disorder. CGP is basically a very simple integer-based genetic representation method of a program in the form of directed graph. In this study CGP is used to build CGPCNN, namely a directed graph which contains components of the CNN layer as node that are interconnected to make the architecture. Evolution Strategy is used to find the optimal architecture with classification accuracy as its fitness function. The model was built and evaluated using five subjects with dysarthria and two normal subjects obtained from UA Speech Database resulting in an average pronunciation accuracy of 94.9 %. For comparison, the CGP-CNN model produces an accurate average model on three subjects with dysarthria reaching 90.9%, higher by 2.33% compared to the CNN model in the previous study which was 88.57%. Based on these results, it was concluded that CGP-CNN managed to build a better model than previous research.
Kata Kunci : speech recognition, convolutional neural network, dysarthria, cartesian genetic programming