SEGMENTASI CITRA JALAN RAYA MENGGUNAKAN AUTOENCODER CONVOLUTIONAL NEURAL NETWORK BERBASIS AGGREGATED RESIDUAL TRANSFORMATIONS
IGNATIUS IWAN, Ika Candradewi, S.Si, M.Cs;Muhammad Idham Ananta Timur, S.T., M.Kom.
2020 | Skripsi | S1 ELEKTRONIKA DAN INSTRUMENTASITeknologi autonomous car menjadi bidang baru dalam penelitian kecerdasan buatan. Salah satunya adalah path planning dengan menentukan jalan yang bisa dilalui. Tugas segmentasi dengan Convolutional Neural Network (CNN) lebih efektif terhadap data yang belum diketahui, namun banyaknya parameter dan kompleksnya membuat waktu komputasi lebih lama dan kurang sesuai untuk inference. Hal ini dikarenakan kebanyakan CNN membangun layer secara mendalam atau menumpuk. CNN dengan layer yang bersifat melebar dalam ILSVRC 2016 ResNeXt dapat digunakan sebagai solusi baru. Fungsi ResNeXt untuk klasifikasi gambar dapat dirubah untuk mengklasifikasi tiap pixel citra. Adapun citra yang digunakan sebagai masukkan dapat divariasi dari pemotongan secara acak dan blurring secara acak. Kumpulan prediksi ini kemudian perlu direkonstruksi ulang, operasi upscaling citra dapat mengubah resolusi kecil menjadi besar dan dapat ditumpuk menjadi beberapa layer. Hasilnya adalah binary map prediksi kategori tiap pixel. Dalam penelitian ini, digunakan model autoencoder dengan memodifikasi ResNeXt menjadi encoder dan digabungkan dengan sekumpulan layer operasi upscaling (UpscaleBlock) sebagai decoder untuk mensegmentasi citra jalan raya. Data latih dan uji menggunakan KITTI Road Evaluation 2013 dan mencapai performa F-max 89.28% pada kategori UM, 91.70% pada kategori UMM, 87.02% pada kategori UU, dan 89.83% pada kategori Urban dengan waktu komputasi 0.1 detik pada GPU.
Autonomous car technology became a new field for articifal intelligence research. One of the studied problems is path planning to determine which lane for vehicle. Segmentation task with Convolutional Neural Network (CNN) proved to be more effective against unknown data, but there is some drawback. CNN creates a lot and complex parameters which makes computation longer and doesn’t fit very well in inference circumstances. Those happened because CNN build with deeply stacked layers. CNN build with parallel stacked network like ResNeXt in ILSVRC 2016 can be used as a new approach to road segmentation. We converted ResNeXt to classify each pixel instead image. For variation, input images are randomly cropped and blurred. All predicted pixels then require reconstruction, upscaling operation can alter small image reconstruction and grouped. Final result is a binary map that contains pixel according to their predicted category. In this study, ResNeXt network for image classification was modified as encoder with group of upscaling process (UpscaleBlock) as decoder for road segmentation task. Training images and testing came from KITTI Road Evaluation 2013. Proposed architecture achieved F-max 89.28% on UM, 91.70% on UMM, 87.02% on UU, and 89.93% on Urban category with computation speed of 0.1s on GPU.
Kata Kunci : road detection, lane estimation, residual network, aggregated residual network, encoder-decoder network