Comparison of YOLOv5 Variants with YOLOv7-tiny Model for Indonesian License Plate Detection
Muhammad Aziz Hamdani Hammadallah, Dr. Agus Sihabuddin, S.Si., M.Kom.
2023 | Skripsi | ILMU KOMPUTER
Teknologi otomatis seperti pembelajaran mesin dan peran visi komputer dalam kegiatan sehari-hari telah meningkat pesat selama bertahun-tahun dan sangat mempengaruhi cara kerja sistem pengawasan dan keamanan. Salah satu sistem pengawasan yang telah dibuat dan telah meningkat pesat berkat visi komputer dan pembelajaran mesin adalah sistem Pengenalan Plat Nomor Otomatis (ANPR). Namun, beberapa keterbatasan dari sistem ini adalah foto yang buram dan eksposur yang berlebihan. Penelitian ini bermaksud untuk membandingkan semua model dari metode state-of-the-art sebelumnya, You Only Look Once (YOLO), khususnya YOLOv5n, YOLOv5s, YOLOv5m dengan model dasar YOLOv7-tiny dan YOLOv7 untuk menentukan model dengan kinerja terbaik untuk sistem ANPR berdaya rendah, serta mengembangkan model yang dapat bekerja secara real-time yang menghasilkan posisi yang akurat dalam lokalisasi, presisi tinggi, recall, dan MAP. Implementasi model ini akan menggunakan kombinasi dari tiga dataset yang tersedia untuk umum, yaitu 502 gambar plat nomor Indonesia dengan warna dasar hitam dan teks putih, 300 gambar plat nomor Eropa, dan 160 gambar plat nomor India. Gambar-gambar tersebut juga akan melalui proses pra-pemrosesan dan augmentasi untuk meningkatkan hasil pelatihan. Penelitian ini menyimpulkan bahwa YOLOv7-tiny adalah model yang paling cocok untuk skema pendeteksian pelat nomor waktu nyata, dengan FPS rata-rata 64,1 FPS, dan YOLOv7 memiliki akurasi terbaik secara keseluruhan di 95,45?n F1-Score di 97,67%. Meskipun demikian, jika akurasi tidak menjadi pertimbangan dan waktu inferensi lebih diprioritaskan, model YOLOv5 masih menjadi yang terbaik, dengan YOLOv5n memiliki waktu inferensi tercepat pada 117,67 FPS - hampir dua kali lipat dari kecepatan YOLOv7.
Autonomous technologies such as machine learning and computer vision’s roles in everyday activities have increased greatly throughout the years and have massively influenced how the surveillance and security systems work. One of the surveillance systems that have been created and have improved greatly thanks to computer vision and machine learning is the Automatic Number Plate Recognition (ANPR) systems. However, some limitations for this system are blurry photos and overexposure. This research intends to compare all the models of the former state-of-the-art method, You Only Look Once (YOLO), specifically YOLOv5n, YOLOv5s, YOLOv5m with the YOLOv7-tiny and YOLOv7 base model to determine the best performing model for low-power ANPR systems, and to develop a model that will be able to perform in real-time that results in the accurate positioning in the localization, high precision, recall, and MAP. The implementation of the model will use a combination of three publicly available dataset contains 502 images of Indonesian number plate with black colored base and white texts, 300 images of European license plates, and 160 images of Indian license plates. The images will also undergo preprocessing and augmentation to further improve the training results. This study concludes that YOLOv7-tiny is the best suited model for real-time license plate detection scenarios, with an average FPS of 64.1 FPS, and YOLOv7 has the best overall accuracy at 95.45% and F1-Score at 97.67%. Nevertheless, if accuracy is not a concern and inference time is prioritized, YOLOv5 models still come out on top, with YOLOv5n having the fastest inference time at 117.67 FPS – almost twice the speed of YOLOv7-tiny.
Kata Kunci : deep learning, computer vision, YOLOv5, YOLOv7, number plate detection