Laporkan Masalah

Penanganan Data Tidak Seimbang Menggunakan Majority Weighted Minority Oversampling Technique (MWMOTE) Pada Analisis Klasifikasi Random Forest

GALAN DZILAL 'AZAM, Drs. Zulaela., Dipl.Med.Stats., M.Si.

2022 | Skripsi | S1 STATISTIKA

Teknologi informasi terus mengalami perkembangan seiring berjalannya waktu. Data yang tersedia menjadi semakin banyak dan beragam. Permasalahan pada data sering dijumpai, salah satunya adalah data tidak seimbang. Kondisi seperti ini akan berpengaruh terhadap hasil analisis. Pada analisis klasifikasi, data tidak seimbang mengakibatkan model menjadi cenderung memperhatikan data dari kelas mayoritas dibandingkan kelas minoritas sehingga berpengaruh pada hasil prediksi yang tidak mewakili dua kelas. Terdapat beberapa metode yang dapat digunakan untuk mengatasi data tidak seimbang. Majority Weighted Minority Oversampling Technique (MWMOTE) menjadi salah satu metode oversampling yang dapat diterapkan untuk menangani permasalahan data tidak seimbang. Metode MWMOTE merupakan pengembangan dari metode SMOTE. Pada MWMOTE, pembentukan data sintetik dilakukan dengan memberikan bobot dan klasterisasi data minoritas. Pada skripsi ini dilakukan penerapan metode MWMOTE dan SMOTE pada klasifikasi Random Forest pada tiga dataset dengan tingkat ketidakseimbangan yang berbeda. Dari analisis yang dilakukan, diperoleh kesimpulan bahwa penerapan metode MWMOTE pada tingkat ketidakseimbangan rendah dan sedang memperoleh performa klasifikasi Random Forest yang lebih baik. Pada tingkat ketidakseimbangan rendah, metode SMOTE menunjukkan performa klasifikasi Random Forest yang lebih baik.

Information technology evolves over time. The data available are becoming more and more various. Problems with data are often encountered, and one of them is imbalanced data. Imbalanced data affects the result of the analysis. In classification analysis, imbalanced data causes the model tend to consider data from the majority class rather than from minority class, affecting prediction results which two of the classes become not represented. There are several methods that can be used to overcome imbalanced data. The Majority Weighted Minority Oversampling Technique (MWMOTE) is one of oversampling method that can be applied to address the problem of imbalanced data. The MWMOTE method is a development of the SMOTE method. In MWMOTE, forming synthetic data is done by assigning weights and clustering minority data. In this undergraduate thesis, MWMOTE and SMOTE method is applied to imbalanced data using Random Forest classification method on three datasets with different levels of imbalance ratio. From the analysis, we can conclude that the application of the MWMOTE method at low and moderate levels of imbalance obtains better Random Forest classification performance. At a low level of imbalance, the SMOTE method shows better random forest classification performance

Kata Kunci : Klasifikasi, Data tidak seimbang, Majority Weighted Minority Oversampling Technique (MWMOTE), Random Forest/Classification, Imbalanced data, Majority Weighted Minority Oversampling Technique (MWMOTE), Random Forest/Classification, Imbalanced data, Majorit