Implementasi Metode Random Forest dan Artificial Neural Network pada Imbalanced dan Balanced Data dalam Mendeteksi Penipuan Kartu Kredit
DESY AMBARWATI, Dr. Herni Utami, M.Si.
2020 | Skripsi | S1 STATISTIKAPerkembangan zaman telah mengantarkan manusia kepada era digital yang semakin memudahkan manusia dalam melakukan pekerjaan, interaksi, dan transaksi. Salah satu inovasi yang sangat bermanfaat adalah adanya kartu kredit terlihat dari semakin bertambahnya pengguna kartu pintar tersebut dari waktu ke waktu. Namun, seiring dengan meningkatnya penggunaan kartu kredit, tindak penipuan kartu kredit pun ikut meningkat sehingga dapat menyebabkan kerugian keuangan yang tidak sedikit. Oleh karena itu, diperlukan metode yang efektif dalam mendeteksi penipuan kartu kredit (credit card fraud detection) sehingga dapat mencegah atau mengurangi kerugian yang akan terjadi akibat adanya penipuan tersebut. Metode analisis yang digunakan dalam penelitian ini adalah Random Forest dan Backpropagation Artificial Neural Network (ANN) sedangkan teknik untuk mengatasi imbalanced training data adalah Synthetic Minority Oversampling Technique (SMOTE). Hasil analisis menunjukkan bahwa pembentukan model dengan imbalanced training data mempunyai performa yang lebih baik dibandingkan dengan balanced training data walau perbedaan keduanya tidak terlalu signifikan, Backpropagation ANN mempunyai performa yang lebih baik dibandingkan dengan Random Forest namun juga dengan perbedaan yang tidak terlalu signifikan, dan penggunaan SMOTE dapat meningkatkan sensitivitas pada performa model. Oleh karena itu, kedua metode sangat baik dalam melakukan klasifikasi atau prediksi terhadap data tidak seimbang maupun data seimbang.
The development of times has led humans to the digital era which makes it easier for people to carry out work, interactions, and transactions. One of the most useful innovations is the existence of a credit card that can be seen from the increasing number of that smart card users from time to time. However, in line with the use of credit cards, the credit card fraud is also increasing so that it can cause significant financial losses. Therefore, an effective method of credit card fraud detection is needed to prevent or reduce losses that will occur due to the fraud. The analytical method used in this research is Random Forest and Backpropagation Artificial Neural Network (ANN), while the technique used for overcoming the imbalanced training data is Synthetic Minority Oversampling Technique (SMOTE). The results of the analysis show that the models that are formed by imbalanced training data has better performance than that are formed by the balanced training data although the difference values between those models are not too significant, Backpropagation ANN has better performance compared to Random Forest but also with less significant difference values, and the use of SMOTE can increase the sensitivity of the performance model. Therefore, both methods are very good at classifying or predicting unbalanced and balanced data.
Kata Kunci : analisis penipuan kartu kredit, SMOTE, Random Forest, Backpropagation, Artificial Neural Network, klasifikasi