Implementasi Mask R-CNN untuk Deteksi dan Klasifikasi Fungsi Bangunan Menggunakan Ground Orthophoto (Studi Kasus: Kota Bogor)
WD NUR ESHA AMALIA, Dr. Like Indrawati, S.Si., M.Sc.
2025 | Tugas Akhir | D4 SISTEM INFORMASI GEOGRAFIS
Bangunan merupakan salah satu fitur visual penting dalam lingkungan urban yang memiliki beragam fungsi, seperti fasilitas kesehatan, pendidikan, peribadatan, dan lain sebagainya. Klasifikasi fungsi bangunan berperan penting dalam mendukung perencanaan kota, pengelolaan sumber daya, serta penataan ruang yang lebih efisien. Namun, proses klasifikasi secara manual membutuhkan waktu yang lama dan sumber daya manusia yang besar. Penelitian ini bertujuan untuk mengembangkan metode klasifikasi fungsi bangunan secara otomatis dengan memanfaatkan informasi bentuk atap sebagai fitur utama.
Penelitian ini menggunakan teknologi deep learning dengan Mask R-CNN sebagai model utama untuk deteksi dan klasifikasi fungsi bangunan berdasarkan bentuk atap. Dataset khusus yang mencakup berbagai bentuk atap bangunan di Kota Bogor digunakan sebagai data pelatihan. Dataset tersebut diperoleh dari citra ground orthophoto dan dilengkapi dengan anotasi yeng merepresentasikan bentuk atap dan fungsi bangunan. Model dilatih untuk dapat menghasilkan deteksi bounding box dan mask segmentation pada objek bangunan.
Hasil pelatihan model Mask R-CNN menunjukkan nilai mAP[0,5:0,95] sebesar 0,489 dan mAP[0,5] sebesar 0,527. Namun, pengujian pada dataset test set menunjukkan performa yang kurang memuaskan, dengan nilai mAP[0,5:0,95] sebesar 0,0085 dan mAP[0,5] sebesar 0,10, yang mengindikasikan adanya underfitting pada model. Selain itu, pengujian pada area dengan karakterisitk visual bangunan yang spesifik juga menunjukkan ketidakakuratan model dalam mengklasifikasi fungsi bangunan secara optimal.
Buildings are one of the most important visual features in the urban environment and have various functions, such as health facilities, education, worship, and so on. Classification of building functions plays an important role in supporting urban planning, resource management, and more efficient spatial planning. However, the manual classification process requires a long time and large human resources. This research aims to develop an automatic building function classification method by utilizing roof shape information as the main feature.
This research uses deep learning technology with Mask R-CNN as the main model for building function detection and classification based on roof shape. A customized dataset that includes various roof shapes of buildings in Bogor City is used as training data. The dataset is obtained from ground orthophoto images and comes with annotations that represent the roof shape and building function. The model was trained to be able to produce bounding box detection and mask segmentation on building objects.
The Mask R-CNN model training results show an mAP[0.5:0.95] value of 0.489 and mAP[0.5] of 0.527. However, testing on the test set showed unsatisfactory performance, with mAP[0.5:0.95] of 0.0085 and mAP[0.5] of 0.10, indicating underfitting of the model. In addition, testing in areas with specific building visual characteristics also showed the inaccuracy of the model in optimally classifying building functions.
Kata Kunci : Mask R-CNN, Klasifikasi Fungsi Bangunan, Bentuk Atap, Instance Segmentation, Ground Orthophoto