Laporkan Masalah

HUMAN DETECTION FOR BOUNDING BOX OUTPUT USING NON MAXIMUM SUPRESSION ALGORITHMS

RAMA MAHATVA, Azhari, Drs., M.T., Dr

2021 | Skripsi | S1 ILMU KOMPUTER

Manusia merupakan objek penting dari video surveillance sehingga penerapan teknologi pendeteksian manusia sangat penting dalam bidang kebutuhan video surveillance dimana peran detektor objek berguna untuk menganalisis gambar dan kemudian menunjukkan kepada kita objek tersebut, dan dalam hal ini adalah manusia. Sistem pendeteksian yang dilakukan pada penelitian ini adalah untuk pendeteksian manusia pada setting pejalan kaki di dalam sebuah citra. Fokus utama dari penelitian ini adalah bagaimana mengurangi output positif palsu yang terdeteksi, diusulkan pembelajaran mesin yang membantu mendeteksi manusia di dalam gambar menggunakan algoritma HOG, Linear SVM dan NMS untuk meningkatkan kualitas kotak pembatas yang terdeteksi pada gambar. dengan menghapus kotak pembatas yang tidak perlu yang terdeteksi dalam deteksi akhir. HOG digunakan untuk mengekstrak fitur dari citra untuk diteruskan ke Linear SVM untuk melakukan tugas klasifikasi, kemudian hasil performansinya dari beberapa percobaan yang menggunakan jumlah dataset yang berbeda dibandingkan dan dievaluasi untuk mendapatkan hasil terbaik. Setelah dilakukan evaluasi terhadap classifier, selanjutnya dilakukan pendeteksian manusia di dalam citra menggunakan sliding window search dan deteksi NMS untuk membuat bounding box akhir di sekitar objek yang terdeteksi. Hasil penelitian menggambarkan akurasi, skor presisi, skor f-1, dan skor recall model SVM terlatih dari beberapa percobaan yang dilakukan. Dataset dengan citra terbanyak berisi 1200 citra untuk eksperimen yang akan diekstraksi fitur dengan HOG yang kemudian dimasukkan ke dalam model pelatihan SVM Linear yang dikombinasikan dengan algoritma NMS untuk menyaring kotak pembatas yang tidak perlu yang terdeteksi pada hasil deteksi mengembalikan akurasi terbaik sebesar 99,33%. Skor IoU dari kotak pembatas akhir di dalam gambar diekstraksi untuk menunjukkan stabilitas model yang digunakan dengan percobaan ketiga yang berisi 1200 dataset gambar sebagai model pelatihan, mengembalikan skor IoU terbaik masing-masing sebesar 0,9568 dan 0,9720 pada gambar uji 1 dan 2 untuk evaluasi ekstraksi skor IoU.

Humans are an important object of an image base video surveillance thus the application of human detection technology is very important in the field of video surveillance needs where the role of object detectors comes in handy for analyzing the images and then showing us the object, and in this case is the humans. The detection system conducted in this research is for human detection in a pedestrian setting inside an image. The main focus of this research is on how to reduce the false positive output detected, a machine learning is proposed that helps detecting the human inside an image using HOG, Linear SVM and NMS algorithms to improve the quality of the detected bounding box in the images by removing the unnecessary bounding box detected in the final detection. HOG is used to extract the features from the images to be passed on to the Linear SVM to do the classification task, then its performance results from multiple experiment which use a different amount of dataset conducted are compared and evaluated to get the best result. After the evaluation of the classifier, next was the detection of the human inside the image using the sliding window search and NMS detection to make the final bounding box around the detected object. The result of the research illustrates the accuracy, precision score, f-1 score, and recall score of the trained SVM model from multiple experiments conducted. The dataset with the most image containing 1200 images for the experiment to be feature extracted with HOG which then fed into the Linear SVM training model combined with NMS algorithm to filter the unnecessary bounding box detected in the detection result returns the best accuracy at 99.33%. The IoU score of the final bounding box inside the image are extracted using the model trained from three different experiments to show the stability of the model used with the third experiment containing 1200 image dataset as the training model, return the best IoU score of 0.9568 and 0.9720 in test image 1 and 2 respectively for the IoU score extraction evaluation.

Kata Kunci : Human Detection, HOG (Histogram of Oriented Gradients), SVM (Support Vector Machine), NMS (Non-Maximum Suppression), Machine Learning

  1. S1-2021-411464-abstract.pdf  
  2. S1-2021-411464-bibliography.pdf  
  3. S1-2021-411464-tableofcontent.pdf  
  4. S1-2021-411464-title.pdf