Klasifikasi Citra Sampah menggunakan Algoritma Support Vector Machine
HANIFA MAHIRA, Aina Musdholifah, S.Kom., M.Kom., Ph.D.
2024 | Skripsi | ILMU KOMPUTER
Permasalahan mengenai penumpukan sampah semakin memburuk. Bahkan, World Bank (2018) memprediksi bahwa sampah akan bertambah sebanyak 70% pada tahun 2050. Hal tersebut salah satunya dapat diatasi dengan melakukan pemilahan sampah kemudian mendaur ulang. Namun, kondisi sampah yang menumpuk di tempat pembuangan akhir (TPA) menyebabkan proses pemilahan secara konvensional tidak lagi efektif. Untuk membantu mengatasi hal tersebut, penelitian ini mengimplementasikan klasifikasi sampah berbasis citra pada dataset TrashNet. Terdapat total 2527 citra pada enam kelas yang kemudian dibagi menjadi tiga kelas: landfill, paper, dan recyclable. Sebagai perbandingan, dibuat dataset baru dengan menghapus latar belakang setiap citra menggunakan Rembg. TIdak adanya latar belakang berarti informasi yang dimuat hanya bagian objek saja.
Eksperimen yang dilakukan adalah membandingkan hasil dengan dan tanpa ekstraksi fitur Gray Level Co-Occurence Matrix (GLCM) Histogram of Oriented Gradients (HOG), dan Local Binary Pattern (LBP), serta dengan dan tanpa reduksi dimensi menggunakan Principal Component Analysis (PCA). Fitur yang dihasilkan dari data asli dan rembg menjadi masukan pada classifier Support Vector Machine (SVM). Hasil klasifikasi paling baik diraih oleh fitur HOG pada data asli dengan akurasi 84%. Pada fitur yang sama, data rembg hanya mencapai akurasi 78?n akurasi terbaiknya hanya 79% oleh fitur HOG dan PCA. Ditinjau lebih lanjut, citra yang mengalami salah klasifikasi pada HOG memperlihatkan bahwa bentuk citra yang mirip antarkelas dan konten atau informasi pada objek mempengaruhi akurasi. Jika dilihat dari keseluruhan eksperimen, data rembg tidak lebih baik dari data asli dengan akurasi yang lebih rendah pada tujuh dari delapan model. Hal tersebut menunjukkan bahwa tidak adanya latar belakang tidak membuat SVM lebih baik dalam membedakan objek pada citra.
The problem of waste accumulation is worsening. In fact, the World Bank (2018) predicted that waste will increase by 70% in 2050. One of the ways to address this is by sorting and recycling waste. However, the accumulation of waste at landfill sites renders conventional sorting processes ineffective. In order to help address this issue, this research implemented image-based waste classification on the TrashNet dataset. There were a total of 2527 images across six classes, which were then divided into three classes: landfill, paper, and recyclable. For comparison, a new dataset was created by removing the background from each image using Rembg. The absence of background meant that only the object part was retained.
The experiments conducted involve comparing
results with and without feature extraction using Gray Level Co-Occurence
Matrix (GLCM), Histogram of Oriented Gradients (HOG), and Local Binary Pattern
(LBP), as well as with and without dimensionality reduction using Principal
Component Analysis (PCA). Features generated from the original data and Rembg
data became input into the Support Vector Machine (SVM) classifier. The best
classification result was achieved by HOG features on the original data with an
accuracy of 84%. For the same features, Rembg data only reached 78?curacy,
with its best accuracy being 79% using HOG and PCA features. Upon further
examination, misclassified images in the HOG features set showed that similar
image shapes across classes and the content or information on the objects
affected accuracy. Looking at the overall experiments, Rembg data did not
outperform the original data, with lower accuracy in seven out of eight models.
This indicated that the absence of background did not necessarily improve SVM's
ability to differentiate objects in images.
Kata Kunci : Sampah, Rembg, GLCM, HOG, LBP, Support Vector Machine