Machine Learning and Pareto Analysis for Institutional Healthcare Fraud Detection
Adrianus Agung Satriyo Wicaksono, Dr. Lukman Heryawan, S.T., M.T.
2025 | Skripsi | ILMU KOMPUTER
Penipuan institusional dalam sektor layanan kesehatan merupakan ancaman yang kompleks dan signifikan, menyebabkan kerugian finansial yang besar serta melemahkan integritas sistem kesehatan. Deteksi penipuan konvensional sering kali mengabaikan aktor-aktor institusional. Penelitian ini bertujuan untuk mengatasi kesenjangan tersebut dengan mengembangkan dan mengevaluasi kerangka kerja pembelajaran mesin yang tangguh, yang secara khusus dirancang untuk mengidentifikasi aktivitas penipuan yang berasal dari institusi layanan kesehatan, dengan tujuan meningkatkan kapabilitas deteksi.
Penelitian ini memanfaatkan dataset layanan kesehatan yang relevan serta melakukan analisis komparatif terhadap berbagai algoritma pembelajaran mesin, dengan memilih model paling efektif berdasarkan akurasi prediktif. Mengingat kompleksitas data yang tinggi, analisis Pareto (prinsip 80/20) diterapkan dalam seleksi fitur untuk mengidentifikasi indikator penipuan yang krusial sekaligus meningkatkan efisiensi dan interpretabilitas model. Studi ini bertujuan menghasilkan metodologi yang tervalidasi dan teroptimasi, serta memberikan wawasan mengenai teknik komputasi yang efektif dan fitur data utama dalam upaya pemberantasan penipuan institusional di sektor layanan kesehatan, yang bermanfaat bagi lembaga pengawas maupun program pemeliharaan integritas layanan kesehatan.
Institutional healthcare fraud represents a complex and significant threat, causing substantial financial losses and undermining healthcare system integrity. Traditional fraud detection often overlooks institutional actors. This research addresses this gap by developing and evaluating a robust machine learning framework specifically designed to identify fraudulent activities originating from healthcare institutions, aiming to enhance detection capabilities.
The research utilizes relevant healthcare datasets and employs a comparative analysis of various machine learning algorithms, selecting the most effective models based on predictive accuracy. Recognizing data complexity, Pareto Analysis (80/20 principle) is incorporated for feature selection to identify critical fraud indicators while improving model efficiency and interpretability. The study aims to deliver a validated, optimized methodology, providing insights into effective computational techniques and key data features for combating institutional healthcare fraud, benefiting regulatory bodies and healthcare integrity programs.
Kata Kunci : Healthcare Fraud Detection, Institutional Fraud, Machine Learning, Feature Selection, Pareto Principle, Predictive Modeling, Health Informatics