Segmentasi Atap Bangunan dari Citra Satelit Resolusi Tinggi Menggunakan Arsitektur CBAM-UNet
Muhammad Azhar Rafi' Samudra, Prof. Dr. Ir. Harintaka, S.T., M.T., IPU, ASEAN Eng.
2026 | Tesis | S2 Teknik Geomatika
Bangunan merupakan salah satu unsur pada peta dasar yang mengalami perkembangan pesat. Proses pembaruan informasi dan pemetaan bangunan masih banyak dilakukan melalui interpretasi manual dari visual atap bangunan menggunakan citra satelit resolusi tinggi, sehingga perlu waktu lama dan rentan terhadap inkonsistensi antar-operator. Perkembangan teknologi penginderaan jauh dan kemajuan metode deep learning telah membuka peluang besar untuk otomatisasi ekstraksi bangunan secara lebih cepat, objektif, dan efisien. Saat ini, terdapat berbagai arsitektur deep learning yang dapat digunakan untuk otomatisasi segmentasi atap bangunan, seperti Fully Convolutional Network (FCN), SegNet, DeepLab, Mask R-CNN, dan U-Net. Namun, di antara berbagai pendekatan tersebut, U-Net tetap lebih unggul karena kesederhanaan struktur, efektivitas pada data terbatas, serta fleksibilitas dalam modifikasi untuk peningkatan performa. Meski demikian, U-Net kurang mampu mengenali fitur penting ketika objek-objek yang diklasifikasikan memiliki bentuk yang kompleks dan ukuran yang beragam. Selain itu, performa U-Net juga dapat menurun ketika dihadapkan pada citra dengan area urban yang padat, sehingga diperlukan diperlukan pengembangan arsitektur, salah satunya melalui integrasi attention mechanism seperti Convolutional Block Attention Module (CBAM) untuk menekankan fitur relevan dan meningkatkan akurasi segmentasi atap bangunan melalui channel attention dan spatial attention. Integrasi ini dilakukan untuk mengevaluasi sejauh mana pengaruh modul CBAM terhadap kinerja arsitektur U-Net dalam segmentasi citra dibandingkan dengan arsitektur basic U-Net.
Penelitian ini dilakukan untuk segmentasi batas atap bangunan menggunakan arsitektur CBAM-UNet. Bahan yang digunakan pada penelitian ini adalah citra satelit resolusi tinggi dengan resolusi spasial sebesar 50 centimeter. Model dari arsitektur CBAM-UNet dilatih menggunakan training data yang bervariasi dan teraugmentasi. Kemudian, pengujian hasil dilakukan pada lima area yang memiliki karakteristik bentuk dan kepadatan bangunan yang berbeda. Area dengan bentuk atap bangunan seragam hingga bentuk bangunan acak terdapat pada area testing data. Hal tersebut dilakukan untuk menilai akurasi model CBAM-UNet pada kondisi dan situasi citra yang berbeda. Hasil segmentasi kemudian dievaluasi berdasarkan perbandingan nilai piksel hasil segmentasi terhadap data ground truth.
Hasil penelitian menunjukkan bahwa model CBAM-UNet berhasil dilatih secara optimal untuk segmentasi atap bangunan pada citra satelit resolusi tinggi, dengan nilai validation loss sebesar 0,0589 yang lebih baik dibandingkan Basic U-Net yang memperoleh 0,0627. Model ini mampu memisahkan objek bangunan dan non-bangunan secara otomatis dengan performa segmentasi yang stabil. Selain itu, hasil segmentasi dari model CBAM-UNet memberikan akurasi yang lebih tinggi dibandingkan Basic U-Net, dengan nilai rerata IoU sebesar 0,8538 dan rerata F1-Score sebesar 0,9211, meningkat dari IoU 0,8093 dan F1-Score 0,8945 pada model basic U-Net.
Buildings are one of the fundamental elements in base maps that have experienced rapid development. The process of updating building information and mapping is still largely conducted through manual visual interpretation of building roofs using high-resolution satellite imagery, which is time-consuming and prone to inter-operator inconsistencies. Advances in remote sensing technology and deep learning methods have created significant opportunities for the automation of building extraction in a faster, more objective, and more efficient manner. Currently, various deep learning architectures have been applied for automatic building roof segmentation, including Fully Convolutional Networks (FCN), SegNet, DeepLab, Mask R-CNN, and U-Net. Among these approaches, U-Net remains superior due to its structural simplicity, effectiveness on limited datasets, and flexibility for performance enhancement through architectural modifications. However, U-Net has limitations in identifying salient features when the target objects exhibit complex shapes and diverse sizes. In addition, its performance may degrade in dense urban areas, which necessitates architectural improvements, one of which is the integration of attention mechanisms such as the Convolutional Block Attention Module (CBAM) to emphasize relevant features and enhance building roof segmentation accuracy through channel and spatial attention. This integration is conducted to evaluate the extent to which the CBAM module influences the performance of the U-Net architecture in image segmentation compared to the basic U-Net architecture.
This study focuses on the segmentation of building roof boundaries using the CBAM-UNet architecture. The data used in this study consist of high-resolution satellite imagery with a spatial resolution of 50 centimeters. The CBAM-UNet model was trained using diverse and augmented training datasets. The segmentation results were then tested on five areas with different building shape characteristics and density levels, ranging from uniform roof structures to irregular building patterns. This experimental design was intended to evaluate the robustness and accuracy of the CBAM-UNet model under varying image conditions. The segmentation outputs were evaluated by comparing the predicted segmentation pixels with ground truth data.
The results demonstrate that the CBAM-UNet model was optimally trained for building roof segmentation in high-resolution satellite imagery, achieving a validation loss of 0.0589, outperforming the basic U-Net model, which obtained a validation loss of 0.0627. The model successfully separated building and non-building objects automatically with stable segmentation performance. Furthermore, the CBAM-UNet model produced higher segmentation accuracy than the basic U-Net model, achieving an average IoU of 0.8538 and an average F1-score of 0.9211, compared to an IoU of 0.8093 and an F1-score of 0.8945 for the basic U-Net model.
Kata Kunci : segmentasi, atap bangunan, CBAM-UNet, IoU, F1-Score