Laporkan Masalah

Analisis Jumlah Lapisan Jaringan Syaraf Tiruan dan Jumlah Dataset Gambar terhadap Akurasi Pengenalan Rambu Lalu Lintas

YURINTA DIMAS H G, Ir. Agus Bejo, S.T., M.Eng., D.Eng., IPM.; Ir. Prapto Nugroho, S.T., M.Eng., D.Eng., IPM.

2020 | Skripsi | S1 TEKNIK ELEKTRO

Deep learning merupakan fungsi kecerdasan buatan yang mereplikasi cara berpikir manusia dalam memahami sesuatu dan menentukan keputusan berdasarkan pemahaman. Deep learning merupakan bagian dari machine learning yang berkembang dengan mengandalkan kemampuan pengolahan citra pada perangkat komputasi modern. Kemampuan deep learning dalam mengolah data citra, salah satunya dapat dimanfaatkan untuk pengenalan obyek. Pada pemrograman Python terdapat dua pustaka yang dapat digunakan untuk mengembangkan pengenalan citra dengan deep learning, yaitu TensorFlow dan Keras. Akurasi menjadi masalah utama dalam membangun pengenalan obyek dengan pustaka TensorFlow dan Keras untuk pengenalan rambu lalu lintas, termasuk dalam kompetisi dunia pengolahan citra untuk pengenalan rambu lalu lintas yaitu The German Traffic Sign Recognition Benchmark (GTSRB). Solusi yang dapat digunakan untuk meningkatkan akurasi tersebut adalah menambah jumlah lapisan Convolutional Neural Network (CNN) atau menambah jumlah data dengan augmentasi data berdasarkan data yang sudah ada. Keduanya memiliki kekurangan yang sama, yaitu meningkatkan waktu olah data. Hal ini kemudian menimbulkan ketertarikan untuk menyelidiki solusi mana yang memiliki waktu olah data lebih singkat. Penelitian dilakukan dengan membuat tiga model berbeda jumlah lapisan CNN dan membuat dua dataset citra augmentasi berukuran sebesar dua kali dan empat kali dari jumlah citra di awal penelitian. Satu model dengan jumlah lapisan paling sedikit kemudian dijadikan pembanding. Dari sini, hasil dari penambahan lapisan ataupun ukuran data dapat diuji untuk mengetahui apakah keduanya akan meningkatkan akurasi pengenalan. Pada penelitian ini, hasil pengujian kami menunjukkan bahwa peningkatkan akurasi dengan menambah lapisan CNN memiliki waktu olah data lebih singkat, dibandingkan dengan waktu olah data dari menambah jumlah data augmentasi citra. Selain itu, kami juga menemukan perbedaan waktu yang signifikan saat pelatihan deep learning dengan menggunakan pengolah GPU, dibandingkan dengan pengolah CPU. Dalam percobaan kami, pelatihan deep learning dengan menggunakan GPU 9x lebih cepat dibandingkan menggunakan pengolah CPU pada sistem yang kami gunakan.

Deep learning is a function of artificial intelligence that replicates the way humans mind in grasping something and deciding based on understanding. Deep learning is part of machine learning which evolves on the expanding image processing capabilities on modern computing devices. One of practical applications of deep learning capability in image processing is objects recogniton. In Python, there are two libraries which can be readily used as developement tools in deep learning based image recognition namely TensorFlow and Keras. Accuration becomes a challenging problem to solve in a traffic sign recognition using TensorFlow and Keras libraries , as introduced in the world image-processing competition of traffic sign recognition namely The German Traffic Sign Recognition Benchmark (GTSRB). There are two considered optional solutions to this accuracy problemnamely either to increase the Convolutional Neural Network (CNN) layer complexity or to generate data augmentation based on available data. However, both of them have a serious drawback of increasing data processing time which makes it interesting to find out which one has the least data processing time. The study was conducted by making three different models with different CNN layers number and generating two datasets with augmented images in two and four times images number sizes than the base dataset. One model with the least number of layers is then used as a comparison. From here, the results of adding layers or data sizes can be tested to see if they will improve recognition accuracy. In this study, our test results indicate that increasing accuracy by adding CNN layers will have shorter data processing time, compared to the data processing time from increasing the amount of image augmentation dataset size. Additionally, we also found a significant time difference when training the deep learning models using a GPU processor, compared to a CPU processor. Our experiment shown that deep learning training using a GPU is 9x faster than using a CPU processor on the systems we use.

Kata Kunci : Deep Learning, Pengenalan Rambu Lalu Lintas, TensorFlow, Keras, Convolutional Neural Network (CNN), Klasifikasi Citra

  1. S1-2020-333822-abstract.pdf  
  2. S1-2020-333822-bibliography.pdf  
  3. S1-2020-333822-tableofcontent.pdf  
  4. S1-2020-333822-title.pdf