EVALUASI HASIL EKSTRAKSI BANGUNAN DI KAWASAN PERMUKIMAN MENGGUNAKAN METODE MASK R-CNN DARI DATA TRUE ORTOPHOTO DAN LIDAR
AGRI KRISTAL, Dr. Ir. Harintaka, ST., MT., IPM
2022 | Tesis | MAGISTER TEKNIK GEOMATIKAFitur bangunan merupakan salah satu unsur penting dalam peta dasar untuk perencanaan kota, penyusunan Rencana Detil Tata Ruang dan Kota (RDTR), dan lain sebagainya. Ekstraksi fitur bangunan pada Peta Rupabumi Indonesia (Peta RBI) dilakukan secara manual, sehingga membutuhkan waktu yang lama serta sumber daya manusia yang banyak. Deteksi dan segmentasi garis tepi bangunan secara otomatis menggunakan teknologi computer vision dari kombinasi antara citra optis dan data points cloud Light Detection And Ranging (Lidar) telah populer beberapa tahun terakhir. Kombinasi citra optis dan data points cloud Lidar diharapkan dapat mendapatkan hasil yang lebih optimal dibandingkan hanya menggunakan salah satu datanya saja. Salah satu teknologi yang sedang dikembangkan adalah dengan metode deep learning berbasis Mask Region-base Convolutional Neural Networks (Mask R-CNN). Keunggulan dari model Mask R-CNN yaitu menghasilkan output berupa label dan segmentation mask dalam waktu yang singkat. Namun demikian ekstraksi garis bangunan dengan pendekatan deep learning memiliki kelemahan yaitu garis poligon bangunan yang dihasilkan tidak teratur, sehingga diperlukan proses lanjutan yaitu regularisasi bangunan agar garis tepi bangunan lebih teratur. Penelitian ini bertujuan untuk mengetahui kualitas hasil ekstraksi fitur bangunan secara otomatis di area pemukiman menggunakan kombinasi data true ortophoto dan Lidar dengan metode deep learning berbasis Mask R-CNN. Proses ektraksi garis tepi bangunan secara otomatis dilakukan menggunakan data true ortophoto yang mempunyai Ground Sample Distance (GSD) 15 cm, data points cloud lidar dan data vektor bangunan Peta RBI. Penelitian berfokus pada evaluasi kualitas garis bangunan hasil ekstraksi. Area penelitian berada di sebagian Kota Solok, Provinsi Sumatera Barat. Tahapan penelitian meliputi persiapan, pengumpulan data, pemotongan data sesuai lokasi penelitian yang telah ditentukan, pembuatan dataset training, pelatihan model deep learning, ekstraksi garis tepi bangunan pada setiap Area of Interest (AoI), editing dan regularisasi garis bangunan hasil ekstraksi, dan evaluasi kualitas hasil regularisasi. Evaluasi kualitas dilakukan terhadap garis bangunan hasil ekstraksi dan garis bangunan setelah editing dan regularisasi. Metode evaluasi menggunakan tiga cara, yaitu indeks Intersection over Union (IoU), match rate, perhitungan ketelitian geometri horisontal bangunan dan aspek kecepatan proses ekstraksi garis bangunan. Hasil penelitian menunjukkan rata-rata indeks IoU garis bangunan hasil ekstraksi, garis bangunan setelah editing, dan garis bangunan setelah regularisasi pada semua AoI berturut-turut adalah 86,433%; 86, 869% dan 85,472%. Kualitas pada metode match rate garis bangunan hasil ekstraksi, garis bangunan setelah editing, dan garis bangunan setelah regularisasi pada semua AoI berturut-turut adalah 86,037%; 86,756%; dan 85,339%. Nilai CE90 titik pusat bangunan hasil ekstraksi garis bangunan sebelum dan sesudah regularisasi mempunyai nilai kurang dari 1,5 sehingga fitur bangunan tersebut masuk ke dalam kelas satu ketelitian Peta RBI skala 1:5.000.
Building is one of the most important features in base map especially for urban planning, detailed spatial planning etc. RBI building feature extraction is conducted manually therefore need large number of human resources and is time-consuming activity. Automatic detection and segmentation of building footprint using computer vision technology from optic imagery and Lidar points cloud combination is popular in recent years. Optic imagery and Lidar point clouds data combination is expected to be able to enhance the extraction result quality compared to the extraction resulted from either optic imagery or Lidar points could data only. One of the technologies developed for the extraction is Mask R-CNNN based deep learning approach. The advantage of this model (approach) is that it produces label and segmentation mask in relatively short time. However, building footprint extraction using this approach also has disadvantage which is the irregular shape of the building polygon. Therefore, a further processing is needed to correct the irregularity. This research aims to analyse quality of automatically extracted building feature in the settlement area resulted from deep learning approach based on Mask R-CNN using combination data of true orthophoto and Lidar. The process of extracting building footprint is automatically processed using true orthophoto data which has a Ground Sample Distance (GSD) of 15 cm, lidar cloud data points and RBI Map building vector data. The research focuses on evaluating the quality of the extracted building line. The analysis was conducted in some area of Solok City in Sumatera Barat Province. The research was accomplished through 8 phases: (1) data preparation; (2) data collection; (3) data masking based on study area; (4) data set training; (5) deep learning model training; (6) building line extraction in every AoI; (7) editing; and (8) regularisation. The evaluation methods applied were IoU index, match rate and building horisontal geometric accuracy assessment and the velocity aspect of the building footprint extraction process. The result shows the IoU index averages of building line extraction result, building line after editing, and building line after regularisation in every AoI are 86.433%; 86.869%; and 85.472% respectively. The building line quality assessment of the extraction result, after editing and regularisation in every AoI using match rate method produces 86.037%, 86.756%, and 85.339% respectively. The study finds that based the accuracy of building line, assessed both using IoU index and match rate method, is increased after the editing process using classified Lidar data, however it is decreased after the building line is regularised. The CE90 value of building centre resulted from the building line extraction before and after regularisation is 1.5. Therefore, the accuracy of building feature is classified as the class 1 in accordance with 1:5,000 RBI map accuracy standard.
Kata Kunci : ekstraksi bangunan, true ortophoto, Mask R-CNN, Indeks IoU, Match Rate