Klasifikasi Citra Tulisan Tangan Aksara Sunda dengan Metode CNN-ELM
MUHAMMAD IBRAHIM KAHFIE, Dr. Yohanes Suyanto, M. I. Kom.
2022 | Skripsi | S1 ELEKTRONIKA DAN INSTRUMENTASIPenggunaan CNN untuk mengklasifikasi Aksara Sunda Ngalagena belum mencapai tingkat akurasi di atas 90% yang dicapai dengan model lain seperti KNN, backpropagation, atau model CNN yang digunakan untuk melakukan klasifikasi terhadap Aksara Wilangan atau Aksara Swara. CNN membutuhkan waktu yang banyak untuk dikembangkan karena memerlukan pembelajaran iteratif. Extreme Learning Machine memiliki kelebihan berupa waktu pelatihan yang lebih cepat dibandingkan dengan lapisan pengklasifikasi CNN yang berbasis backpropagation. Menggunakan metode transfer learning, model CNN-ELM dapat menghubungkan lapisan pengekstraksi fitur dari CNN dengan lapisan pengklasifikasi ELM. Penelitian ini bertujuan untuk meningkatkan tingkat akurasi klasifikasi citra tulisan tangan Aksara Sunda Ngalagena dan mengurangi waktu dibutuhkan untuk melatih model. Model CNN-ELM dievaluasi dengan menggunakan dataset Aksara Sunda dengan tahap preprocessing meliputi perubahan peta warna menjadi RGB, perubahan ukuran, dan zero-centering. MobileNet dan InceptionV3 yang sudah dilatih digunakan untuk membentuk lapisan pengekstraksi fitur CNN-ELM. Evaluasi dilakukan dengan metode K-Fold Cross Validation menggunakan sejumlah model CNN-ELM dengan variasi jumlah neuron dalam ELM, jumlah epoch dalam proses finetuning, dan besar ukuran citra masukan. Finetuning hanya dilakukan dua lapisan konvolusi pertama pada kedua model. Hasil pengujian menunjukkan bahwa model lapisan pengklasifikasi ELM dapat dilatih dengan waktu yang lebih cepat dibandingkan dengan lapisan pengklasifikasi CNN yang berbasis backpropagation. Model MobileNet-ELM dengan jumlah neuron ELM sebesar 7.500, ukuran citra masukan 128x128 piksel, dan tanpa melalui finetuning meraih rata-rata akurasi tertinggi sebesar 94,391% dengan waktu pelatihan sebesar 2,226 detik.
The use of CNN to classify the Ngalagena Sundanese script has not reached the level of accuracy above 90% that is achieved by other models such as KNN, backpropagation, or the CNN model used to classify the Wilangan or the Swara scripts. CNN requires a significant amount of time to develop because of the iterative learning process. Extreme Learning Machine has a faster training time when compared to a backpropagation-based classifier. CNN-ELM can connect the feature extraction layer from CNN with an ELM classifier layer using transfer learning. The goal of this research is to increase the accuracy of handwritten Ngalagena Sundanese script image classification and to decrease the time needed to train the network model. The CNN-ELM model was trained and tested using the Sundanese script dataset with preprocessing steps including the color map conversion to RGB, resizing, and zero-centering. Pre-trained MobileNet and InceptionV3 were used as the basis for the feature extraction layer. The evaluation is done using the K-Fold Cross Validation method with multiple CNN-ELM models with a variety of numbers of ELM neurons, the numbers of finetuning epochs, and the size of the input image. Finetuning is only done in the first two convolution layers on both models. The test results show that the ELM classifier layer model can be trained in a faster time than the backpropagation-based CNN classifier layer. The MobileNet-ELM model with 7,500 ELM neurons, input image size of 128x128, and without finetuning process achieves the highest average accuracy of 94.391% and a training time of 2.226 seconds
Kata Kunci : klasifikasi citra, Aksara Sunda, tulisan tangan, CNN-ELM