Laporkan Masalah

Optimalisasi Model YOLOv8 dengan Dual Attention untuk Segmentasi Keretakan Jalan

MICHAEL HAMONANGAN SITORUS, Syukron Abu Ishaq Alfarozi, S.T., Ph.D. ; Teguh Bharata Adji, S.T., M.T., M.Eng., Ph.D.

2024 | Skripsi | TEKNOLOGI INFORMASI

Perkembangan teknologi informasi telah memberikan dampak signifikan pada pemeliharaan infrastruktur jalan, terutama dalam inspeksi keretakan jalan. Identifikasi keretakan jalan secara tradisional dilakukan secara manual, tetapi metode ini memiliki sejumlah keterbatasan baik dari segi waktu, biaya, maupun akurasi. Untuk mengatasi permasalahan tersebut, teknologi deep learning berbasis computer vision, khususnya Convolutional Neural Networks (CNN), kini semakin banyak diterapkan. Salah satu model terbaru yang diakui unggul dalam efisiensi dan akurasi untuk tugas segmentasi keretakan jalan adalah YOLOv8.

Penelitian ini bertujuan untuk mengoptimalkan arsitektur YOLOv8 untuk tugas segmentasi keretakan jalan. Pada hasil segmentasi model YOLOv8-seg standar, nilai metrik mAP@50-95 mencapai 0.242, meningkat 7,5% dibandingkan YOLOv7-seg. Untuk meningkatkan sensitivitas model dalam menangkap detail keretakan jalan, penelitian ini juga mengintegrasikan beberapa attention mechanism seperti Efficient Channel Attention (ECA), Shuffle Attention (SA), Global Attention Mechanism (GAM), dan ResBlock CBAM (Convolutional Block Attention Module). Hasil penelitian menunjukkan bahwa dalam segmentasi keretakan jalan, attention mechanism pada YOLOv8 menghasilkan peningkatan kinerja yang signifikan dibandingkan model standar, dengan GAM dan ResBlock CBAM memberikan hasil terbaik dalam akurasi segmentasi. Penelitian ini juga memperkenalkan mekanisme Dual Attention, yang merupakan kombinasi antara GAM dan ResBlock CBAM. Mekanisme ini meningkatkan kemampuan model dalam mengenali detail keretakan yang lebih halus, sekaligus mempertahankan konteks global citra. Pengujian menunjukkan arsitektur YOLOv8-seg dengan Dual Attention menghasilkan peningkatan metrik mAP@50 menjadi 0.757 (peningkatan 5.7%) dan mAP@50-95 menjadi 0.258 (peningkatan 6,6%) dibandingkan model YOLOv8 standar, memberikan hasil tertinggi dari seluruh model yang diuji dalam penelitian ini. Pendekatan ini memungkinkan pemetaan keretakan jalan yang cepat dan akurat, memungkinkan pengambilan keputusan yang lebih efektif dalam pemeliharaan infrastruktur jalan.

The advancement of information technology has significantly impacted road infrastructure maintenance, particularly in road crack inspection. Traditionally, road crack identification was conducted manually; however, this method presents several limitations in terms of time, cost, and accuracy. To address these issues, deep learning technologies based on computer vision, specifically Convolutional Neural Networks (CNN), have been increasingly adopted. One of the latest models recognized for its efficiency and accuracy in road crack segmentation tasks is YOLOv8.

This study aims to optimize the YOLOv8 architecture for road crack segmentation tasks. The standard YOLOv8-seg model achieved a mAP@50-95 metric of 0.242, a 7.5% improvement over its predecessor, YOLOv7-seg. To enhance the model’s sensitivity in capturing fine-grained road crack details, this study integrates several attention mechanisms, such as Efficient Channel Attention (ECA), Shuffle Attention (SA), Global Attention Mechanism (GAM), and ResBlock CBAM (Convolutional Block Attention Module). Results indicate that the inclusion of attention mechanisms in YOLOv8 significantly improves performance compared to the standard model, with GAM and ResBlock CBAM providing the best segmentation accuracy. Additionally, this research introduces a Dual Attention Mechanism, combining GAM and ResBlock CBAM, which enhances the model’s ability to recognize fine damage details while maintaining the global context of the image. Testing shows that the YOLOv8-seg architecture with Dual Attention achieves a mAP@50 of 0.757 (a 5.7% improvement) and a mAP@50-95 of 0.258 (a 6.6% improvement) compared to the standard YOLOv8 model, yielding the highest performance among all models tested in this study. This approach enables faster and more accurate road crack mapping, facilitating more effective decision-making in road infrastructure maintenance.

Kata Kunci : deep learning, computer vision, YOLOv8 instance segmentation, attention mechanism, segmentasi keretakan jalan

  1. S1-2024-460552-abstract.pdf  
  2. S1-2024-460552-bibliography.pdf  
  3. S1-2024-460552-tableofcontent.pdf  
  4. S1-2024-460552-title.pdf