Pendekatan Pembelajaran Segmentasi Semantik Pada Citra Udara Area Vegetasi Menggunakan U-Net VGG 19
MAURA WIDYANINGSIH, Prof. Dr. Tri Kuntoro Priyambodo,M.Sc., Moh Edi Wibowo, M.Kom., Ph.D., Prof. Muhammad Kamal, S.Si., M.GIS.,Ph.D.
2024 | Disertasi | S3 Ilmu Komputer
Informasi mengenai kondisi lahan atau objek area sawit, dapat dianalisis dari suatu representasi dengan menggunakan citra map, yang dihasilkan dari suatu proses segmentasi. Proses segmentasi dapat bekerja dengan baik diperlukan persediaan data yang baik dengan gambar berlabel lengkap. Selama ini pelabelan data yang didapatkan dari proses anotasi masih secara sederhana sehingga memerlukan banyak waktu untuk membuatnya. Persediaan dataset diperlukan untuk melatih model dengan konsep atau metode learning, yang dapat membantu otomatisasi kerja segmentasi dataset tanpa harus membuat label lengkap untuk setiap gambar.
Perbaikan kualitas citra merupakan salah satu pertimbangan untuk memperbaiki hasil perolehan gambar karena adanya interferensi, untuk mendukung persiapan data. Teknik penggabungan antara Contrast Limited Adaptive Histogram Equalization (CLAHE) dan Median Blur (MB), digunakan untuk perbaikan di preprocessing, terhadap kontras dan reduksi noise. Training U-Net VGG-19 TensorFlow/ Keras untuk komparasi metode enhancement, dengan usulan penggabungan CLAHE + MB, memberikan hasil perbaikan Accuracy sebesar 73,8%.
Deep Learning (DL) merupakan metode populer yang mampu menangani data citra yang komplek seperti citra udara, dengan model Fully Convolutional Network (FCN), salah satu arsitekturnya Convolutional Neural Network (CNN). Modifikasi CNN ke bentuk U-Net dengan mengganti lapisan inferensi dengan decoder (deconvolution) untuk proses kerja segmentasi semantik. Konstribusi dalam penelitian ini adalah memodifikasi U-Net VGG-19 dalam jaringan segmentasi dengan tuning parameter dan fungsi Residu.
Training jaringan dengan modifikasi U-Net VGG-19 dengan penambahan residu pada decoder, memberikan hasil informasi terbaik dibandingkan tuning parameter. Hasil rata-rata semua proses training jaringan, menghasilkan nilai Accuracy 84,19%, Precision 89,20%, dan Recall 84,27%, sedangkan hasil rata-rata dengan tuning parameter Accuracy 80,08%, Precision 85,37?n Recall 74,27%. Nilai parameter modifikasi arsitektur U-Net VGG-19 dengan tuning parameter adalah 19.715.104 (penurunan 68%), sedangkan penambahan residu menjadi 18.535.544 (penurunan 64%).
Information regarding land conditions or oil palm area objects can be analyzed from a representation using map images, which are produced from a segmentation process. For the segmentation process to work well, it requires a sound data supply with fully labeled images. So far, labeling data obtained from the annotation process is still simple, so it takes much time to make it. Dataset supplies are needed to train models with learning concepts or methods, which can help automate dataset segmentation work without creating complete labels for each image.
Improving image quality is one of the considerations for improving image acquisition results due to interference in supporting data preparation. A combination technique between contrast-limited Adaptive Histogram Equalization (CLAHE) and Median Blur (MB) improves pre-processing, contrast, and noise reduction. U-Net VGG-19 TensorFlow/ Keras training for comparison of enhancement methods, with the proposed combination of CLAHE + MB, provides accuracy improvement results
of 73.8%.
Deep Learning (DL) is a popular method that can handle complex image data, such as aerial images, with a Fully Convolutional Network (FCN) model, one of the architectures of which is a Convolutional Neural Network (CNN). Modify CNN to U-Net form by replacing the inference layer with a decoder (deconvolution) for the semantic segmentation work process. This research contributes to modifying U-Net VGG-19 in segmentation networks by tuning parameters and the Residue function.
Network training with modified U-Net VGG-19 and adding residuals in the decoder provides the best information results compared to parameter tuning. The average results of all network training processes produce Accuracy values of 84.19%, Precision of 89.20%, and Recall of 84.27%. In comparison, the average results with parameter tuning are Accuracy of 80.08%, Precision of 85.37%, and Recall of 74.27%. The parameter value of modifying the U-Net VGG-19 architecture with parameter tuning is 19,715,104 (68?crease), while the residual addition is 18,535,544 (64?crease).
Kata Kunci : Pendekatan Pembelajaran Citra, Segmentasi Semantik, CNN, U-Net VGG-19