Laporkan Masalah

Ekstraksi Tutupan Objek Jalan dari Data Orthophoto menggunakan Ensemble Deep Learning

ADINDA WIDYA KUSUMA DEWI, Ir. Ruli Andaru S.T., M.Eng., Ph.D.

2025 | Skripsi | TEKNIK GEODESI

Pembangunan infrastruktur yang masif dan peningkatan kebutuhan aksesibilitas  yang cukup cepat membutuhkan proses pemutakhiran data spasial yang akurat dan up-to date, salah satunya adalah data spasial objek jalan. Dalam dekade terakhir ini, teknologi fotogrametri berkembang sangat pesat sebagai salah satu metode pemutakhiran data spasial secara cepat, akurat, dan beresolusi tinggi. Perkembangan ini membuka peluang pemanfaatan teknologi fotogrametri dalam menghasilkan data spasial dengan kualitas yang tinggi. Data dengan kualitas tinggi tersebut perlu dioptimalkan penggunaannya untuk keperluan pemutakhiran data jalan secara efektif dari segi waktu dan tenaga. Umumnya proses penggambaran objek jalan pada peta rupa bumi masih dilakukan secara manual, di mana metode manual ini kecepatan dan keakuratannya sangat bergantung pada jumlah dan skill operator. Oleh karena itu, diperlukan pendekatan yang dapat melakukan ekstraksi tutupan jalan secara otomatis untuk pola jalan yang kompleks. Salah satu metode yang mampu mengolah data dengan jumlah data yang besar dan kompleksitas yang tinggi adalah deep learning. Tujuan penelitian ini adalah melakukan ekstraksi tutupan jalan secara otomatis berbasis pendekatan deep learning yang mengombinasikan hasil prediksi biner dari arsitektur model U-Net dan DeepLab-V3. Kombinasi kedua model tersebut membentuk model pendekatan (ensemble learning) yang diharapkan mampu untuk meningkatkan akurasi prediksi. Penelitian dilakukan di dua wilayah yaitu Yogyakarta dan Surabaya, dimana memiliki kemiripan karakteristik bentuk dan pola jalan.  

Data yang digunakan sebagai dataset pada penelitian ini berupa data orthophoto dan data shapefile jalan. Data shapefile jalan yang digunakan berupa jalan sekunder dengan lebar jalan kurang lebih 5 meter. Data orthophoto sebagai data spasial dasar yang merepresentasikan kondisi jalan, sedangkan data shapefile sebagai data pembanding. Kedua data tersebut digunakan sebagai input utama dalam pembangunan training dan testing dataset. Pelatihan model deep learning dilakukan secara independen untuk U-Net dan DeepLab-V3 dengan menggunakan training dataset sebagai input data. Pada proses pelatihan model, validation dataset yang digunakan sebesar 20?ri training dataset untuk memastikan model bisa fit di luar area data pelatihan. Dari proses pelatihan, dihasilkan model deep learning (*.emd) yang bisa digunakan untuk klasifikasi piksel. Selanjutnya, hasil prediksi dari kedua model digabungkan menggunakan metode logical operations (AND, OR).  

Secara visual, ekstraksi tutupan jalan dengan metode ensemble learning ini mampu memberikan hasil yang representatif dalam mendeteksi bentuk dan pola jalan. Namun, pada beberapa kasus di mana terdapat bayangan dan vegetasi, metode ensemble learning masih mengalami hambatan dalam mengenali objek jalan. Berdasarkan hasil perhitungan metrik evaluasi, metode ensemble learning memiliki nilai Intersection over Union (IoU) sebesar 78,2% untuk wilayah Yogyakarta dan 77,4% untuk wilayah Surabaya. Metode ensemble learning juga memiliki nilai overall accuracy yang tinggi, yaitu 97,7% untuk wilayah Yogyakarta dan 94,8% untuk wilayah Surabaya. Secara keseluruhan, penelitian ini memberikan hasil yang baik berdasarkan konteks jenis jalan sekunder dan kelas jalan III. 

Massive infrastructure development and the rapid increase in accessibility needs require an accurate and up-to-date spatial data updating process, one of which is spatial data on road objects. In the last decade, photogrammetry technology has developed rapidly as a method for updating spatial data quickly, accurately, and with high resolution. This development opens up opportunities for photogrammetry technology to produce high-quality spatial data. High-quality data needs to be optimized to update road data effectively in terms of time and energy. Generally, the process of depicting road objects on topographic maps is still done manually, where the speed and accuracy of this manual method are highly dependent on the number and skills of the operator. Therefore, an approach is needed to automatically extract road cover for complex road patterns. One method that is able to process data with a large amount of data and high complexity is deep learning. The purpose of this study is to automatically extract road cover based on a deep learning approach that combines binary prediction results from the U-Net and DeepLab-V3 model architectures. The combination of the two models forms an approach model (ensemble learning) which is expected to be able to improve prediction accuracy. The study was conducted in two areas, namely Yogyakarta and Surabaya, which have similar characteristics of road shapes and patterns. 

The data used as datasets in this study are orthophoto data and road shapefile data. The road shapefile data used is a secondary road with a road width of approximately 5 meters. Orthophoto data is basic spatial data that represents road conditions, while shapefile data is comparative data. Both data are used as the main input in building training and testing datasets. Deep learning model training is carried out independently for U-Net and DeepLab-V3 using the training dataset as input data. In the model training process, the validation dataset used is 20% of the training dataset to ensure that the model can fit outside the training data area. From the training process, a deep learning model (*.emd) is produced that can be used for pixel classification. Furthermore, the prediction results from the two models are combined using the logical operations method (AND, OR). 

Visually, road cover extraction with the ensemble learning method is able to provide representative results in detecting road shapes and patterns. However, in some cases where there are shadows and vegetation, the ensemble learning method still experiences obstacles in recognizing road objects. Based on the results of the evaluation metric calculations, the ensemble learning method has an Intersection over Union (IoU) value of 78.2% for the Yogyakarta area and 77.4% for the Surabaya area. The ensemble learning method also has a high overall accuracy value, which is 97.7% for the Yogyakarta area and 94.8% for the Surabaya area. Overall, this study provides good results based on the context of secondary road types and road class III. 

Kata Kunci : Ekstraksi Jalan, Orthophoto, Ensemble Deep Learning, U-Net, DeepLab-V3, Road Extraction, Orthophoto, Ensemble Deep Learning, U-Net, DeepLab-V3

  1. S1-2025-460239-abstract.pdf  
  2. S1-2025-460239-bibliography.pdf  
  3. S1-2025-460239-tableofcontent.pdf  
  4. S1-2025-460239-title.pdf