Laporkan Masalah

REAL-TIME PEOPLE COUNTING AND TRACKING SYSTEM USING OMNIDIRECTIONAL CAMERA BASED ON YOLO ALGORITHM

Zikra Fathirizqi Aknes, Dr.techn Aufaclav Zatu Kusuma Frisky, S.Si, M.Sc.; Ika Candradewi, S.Si., M.Cs.

2025 | Skripsi | ELEKTRONIKA DAN INSTRUMENTASI

Sistem penghitungan dan pelacakan orang dapat meningkatkan kinerja bisnis ritel, yang mana kinerjanya dipengaruhi oleh beberapa faktor, termasuk alokasi sumber daya dan penjadwalan staf. Kamera omnidirectional digunakan sebagai sensor untuk sistem ini guna menangani titik buta yang muncul saat menggunakan kamera lensa normal. Kamera omnidirectional memiliki keluaran gambar yang unik di mana lensa cembung menyebabkan gambar menjadi terdistorsi. Untuk mendeteksi orang dari gambar yang terdistorsi, diperlukan pembuatan model pembelajaran mendalam yang dapat membedakan antara orang dan objek lain berdasarkan gambar yang terdistorsi.

Penelitian ini menggunakan algoritma YOLO untuk mendeteksi lokasi orang dengan menggunakan koordinat kotak pembatas sebagai keluaran deteksi. Versi YOLO terbaru, YOLO11, akan digunakan dalam penelitian ini karena ringan dan akurasinya yang tinggi. Model pra-latih YOLO11 akan dilatih menggunakan 740 gambar pelatihan yang diperoleh dari kamera omnidirectional. Algoritma pelacakan centroid akan digunakan dalam penelitian ini untuk melacak pergerakan orang berdasarkan kedekatan centroid mereka di antara bingkai. Program ini akan diunggah ke NVIDIA Jetson Orin Nano sebagai single board computer (SBC) untuk sistem ini, guna menciptakan sistem yang ringkas dan sederhana.

Model YOLO11s yang telah dilatih dapat mencapai average precision (AP) hingga 82% untuk 43 gambar pengujian dengan total 163 orang dalam gambar tersebut. Di sisi lain, pelacak dapat memperoleh nilai multiple object trecking accuracy (MOTA) sebesar 0,943 dan multiple object tracking precision (MOTP) sebesar 0,118. Saat berjalan pada NVIDIA Jetson Orin Nano, sistem dapat mencapai kecepatan bingkai hingga 20 frame per second (FPS).

People counting and tracking system can enhance the performance of a retail business, where the performance is influenced by several factors, including resource allocation and staff scheduling. An omnidirectional camera is used as a sensor for this system to handle blind spots that appears when using a normal lens camera. Omnidirectional camera has a unique image output where the convex lens causing the image to be distorted. To detect person from a distorted image, it is required to create a deep learning model that can differentiate between a person and other objects based on the distorted images.

This research is using YOLO algorithm to detect a person location by using a bounding box coordinate as a detection output. The latest YOLO version, YOLO11, will be used in this research due to its lightweight and high accuracy. YOLO11s pretrained model will be trained using 740 training images obtained from the omnidirectional camera. A centroid tracking algorithm will be used in this research to track the person movement based on the closeness of their centroids between frames. The program will be uploaded into NVIDIA Jetson Orin Nano as a single-board computer (SBC) for this system, to create a compact and simple system.

The trained YOLO11s model can achieve an average precision (AP) up to 82% for 43 testing images with a total of 163 persons in those images. The tracker in the other hand, could obtain the multiple objects tracking accuracy (MOTA) value of 0.943 and multiple object tracking precision (MOTP) of 0.118. When running on NVIDIA Jetson Orin Nano, the system could achieve frame rate up to 20 frame per second (FPS).

Kata Kunci : Omnidirectional Camera, YOLO11, Centroid Tracking, NVIDIA Jetson, People Counting

  1. S1-2025-472779-abstract.pdf  
  2. S1-2025-472779-bibliography.pdf  
  3. S1-2025-472779-tableofcontent.pdf  
  4. S1-2025-472779-title.pdf