Pengenalan Tulisan Tangan Aksara Lampung Menggunakan Transfer Learning CNN dan Random Forest
Muhamad Aris Margono, Prof. Drs. Agus Harjoko, M.Sc, Ph.D
2024 | Tesis | S2 Ilmu Komputer
Peraturan Daerah Provinsi Lampung Nomor 2 Tahun 2008 tentang Pemeliharaan Kebudayaan Lampung menegaskan pentingnya pelestarian nilai-nilai budaya masyarakat Lampung, termasuk bahasa dan aksara, untuk memastikan kelestarian dan kelangsungan budaya tersebut. Aksara Lampung menjadi fokus utama pelestarian karena penggunaannya yang terbatas, menyebabkan kesulitan dalam pengenalan dan pemahaman oleh masyarakat.
Penelitian ini mengusulkan penggunaan metode transfer learning dengan CNN pretrained model dan kombinasi random forest untuk mengenali aksara Lampung sebagai bagian dari upaya pelestarian budaya. Penelitian ini melibatkan tiga proses utama: preprocessing, ekstraksi fitur dan klasifikasi untuk pengenalan aksara. Terdapat empat kategori aksara Lampung yang dipelajari, yaitu aksara induk, aksara induk dengan anak huruf di atas, aksara induk dengan anak huruf di samping, dan aksara induk dengan anak huruf di bawah.
Dari delapan variasi model yang diuji, model CNN dengan arsitektur ResNet50v2 yang telah dimodifikasi (tuning) menunjukkan performa terbaik, dengan akurasi pada data pengujian mencapai 93.75% untuk induk aksara, 99.17% untuk anak huruf di atas, 99.27% untuk anak huruf di samping, dan 98.75% untuk anak huruf di bawah. Model ResNet50v2 tuning berhasil mengenali semua jenis data pada citra tulisan tangan aksara Lampung. Hasil tersebut menjadikan model ResNet50v2 dengan tuning sebagai final model untuk pengenalan aksara Lampung.
Lampung Provincial Regulation No. 2/2008 on the Maintenance of Lampung Culture emphasizes the importance of preserving the cultural values of Lampung people, including language and script, to ensure the preservation and continuity of the culture. Lampung script becomes the main focus of preservation due to its limited use, causing difficulties in recognition and understanding by the community.
This research proposes the use of transfer learning method with CNN pretrained model and random forest combination to recognize Lampung script as part of the cultural preservation effort. This research involves three main processes: preprocessing, feature extraction and classification for script recognition. There are four categories of Lampung script studied, namely the parrent character, parrent character with sub-letter above, parrent character with sub-letter on the side, and parrent character with sub-letter below.
From eight model variations tested, the CNN model with the modified ResNet50v2 architecture (tuning) showed the best performance, with accuracy on the test data reaching 93.75% for the parrent character, 99.17% for parrent character with sub-letter above, 99.27% for parrent character with sub-letter on the side, and 98.75% for parrent character with sub-letter below. The ResNet50v2 tuning model successfully recognizes all types of data in Lampung script handwriting images. These results make the ResNet50v2 model with tuning the final model for Lampung script recognition.
Kata Kunci : pengenalan karakter, transfer learning, pretrained model, convolutional neural networks, random forest