Machine Learning for Fraud Detection in the Expenditure Cycle: A Model Comparative Study
AFIF HAIDAR ENDRASWARA, Haryono, Drs., M.Com., Ak., CA.
2025 | Skripsi | AKUNTANSI
Penelitian ini membandingkan beberapa model machine learning untuk mendeteksi transaksi penipuan pada siklus pengeluaran (expenditure cycle) dalam Sistem Informasi Akuntansi (SIA). Latar belakang penelitian ini adalah meningkatnya kompleksitas transaksi digital yang sulit diawasi dengan sistem berbasis aturan (rule-based systems). Dataset yang digunakan berasal dari Kaggle dengan lebih dari 6,3 juta transaksi dan 10 variabel. Enam algoritma diuji, yaitu Logistic Regression, Random Forest, XGBoost, SVM, KNN, dan Neural Network, melalui proses preprocessing, penyeimbangan kelas dengan SMOTE, serta evaluasi berdasarkan akurasi dan ROC-AUC. Hasil menunjukkan XGBoost sebagai model paling optimal dengan akurasi 99,78?n fitur saldo bernilai nol sebagai indikator utama kecurangan. Penelitian ini mengusulkan integrasi XGBoost ke dalam SIA untuk mendukung audit berkelanjutan berbasis data.
This study compares several machine learning models for detecting fraudulent transactions within the expenditure cycle of Accounting Information Systems (AIS). The research addresses the growing complexity of digital transactions that traditional rule-based systems can no longer effectively detect. The dataset from Kaggle contains over 6.3 million records and 10 variables. Six algorithms — Logistic Regression, Random Forest, XGBoost, SVM, KNN, and Neural Network — were evaluated using SMOTE, preprocessing, and metrics such as accuracy and ROC-AUC. Results indicate that XGBoost achieved the best performance with 99.78?curacy, identifying zero-balance features as key fraud indicators. The study proposes integrating XGBoost into AIS to enable continuous, data-driven audit monitoring.
Kata Kunci : machine learning, pendeteksian kecurangan, sistem informasi akuntansi, XGBoost, siklus pengeluaran