Implementation of Hybrid Model: Auto-Encoder and Isolation Forest for Anomaly Detection in BPJS Healthcare Billing Data
Clara Shinta Dea Ananda Rosalie, Dr. Lukman Heryawan, S.T., M.T.
2025 | Skripsi | ILMU KOMPUTER
Modernisasi Program Jaminan Kesehatan Nasional Indonesia telah menghasilkan perubahan pada proses penagihan layanan kesehatan, yang mengharuskannya untuk beradaptasi dengan lebih banyak data dan catatan. Fenomena ini membuat deteksi dini terhadap ketidakteraturan dan pola klaim yang tidak biasa menjadi sangat penting untuk menjaga integritas keuangan dan efisiensi sistem. Namun, data penagihan layanan kesehatan pada dasarnya tidak seimbang, berdimensi tinggi, dan sebagian besar tidak berlabel, sehingga tinjauan manual atau berbasis aturan tradisional menjadi membosankan dan sulit dilakukan. Penelitian ini mengusulkan deteksi anomali hibrida yang menggabungkan Auto-Encoder dan Isolation Forest untuk mengidentifikasi perilaku penagihan atipikal dalam klaim kesehatan BPJS, dengan harapan dapat membantu auditor dalam pengambilan keputusan dengan memunculkan catatan yang mungkin memerlukan pemeriksaan lebih lanjut.
Auto-Encoder mempelajari struktur laten dari pola penagihan normal dan mendeteksi anomali melalui kesalahan rekonstruksi, sementara Isolation Forest mengisolasi titik data yang tidak biasa berdasarkan partisi berbasis pohon yang efisien. Dengan mengintegrasikan kedua metode tersebut, pendekatan hibrida ini memanfaatkan kekuatan pembelajaran fitur mendalam dan isolasi berbasis distribusi untuk meningkatkan kekokohan deteksi anomali.
Eksperimen dilakukan menggunakan data penagihan BPJS yang tersedia untuk umum, dengan pra-pemrosesan dan rekayasa fitur yang diterapkan untuk menangani kelangkaan data dan dimensi tinggi. Karena tidak adanya label yang diverifikasi oleh ahli, evaluasi mengandalkan metrik tanpa pengawasan dan analisis skor, termasuk distribusi kesalahan rekonstruksi, skor anomali Isolation Forest, penandaan berbasis ambang batas (p99), dan tingkat kesepakatan antar model.
Hasilnya menunjukkan bahwa model hibrida AE-IF secara konsisten menyoroti catatan klaim yang menyimpang dari pola penagihan tipikal, dan mungkin memerlukan tinjauan ahli lebih lanjut. Meskipun tidak mengklasifikasikan kecurangan secara definitif, model ini berfungsi sebagai alat pendukung keputusan praktis untuk memprioritaskan klaim yang mencurigakan atau anomali, meningkatkan efisiensi audit, dan mendukung model berbasis data yang lebih kuat dalam sistem kesehatan nasional.
The modernization of Indonesia’s National Health Insurance Program has resulted in the changes on healthcare billing process, requiring it to adapt to more data and records. This phenomenon makes early detection of irregularities and unusual claim patterns essential for maintaining financial integrity and system efficiency. However, healthcare billing data is inherently imbalanced, high-dimensional, and largely unlabeled, rendering traditional rule-based or manual review tedious and hard to do. This study proposes a hybrid anomaly detection combining Auto-Encoder and Isolation Forest to identify atypical billing behaviors within BPJS healthcare claims, in hope to help auditors in their decision-making by surfacing records that might warrant closer examination.
The Auto-Encoder learns the latent structure of normal billing patterns and detects anomalies through reconstruction error, while the Isolation Forest isolates unusual data points based on efficient tree-based partitioning. By integrating both methods, the hybrid approach leverages the strengths of deep feature learning and distribution-based isolation to improve anomaly detection robustness.
Experiments were conducted using publicly available BPJS billing data, with preprocessing and feature engineering applied to address sparsity and high dimensionality. Due to the absence of expert-verified labels, evaluation relies on unsupervised metrics and score analysis, including reconstruction error distributions, Isolation Forest anomaly scores, threshold-based flagging (p99), and agreement rates between the models.
The result indicate that the hybrid AE-IF model consistently highlights claim records that deviate from typical billing patterns, and may warrant further expert review. While it does not classify definitive fraud, the model serves as a practical decision-support tool to prioritize suspicious or anomaly claims, improve auditing efficiency, and support more data-driven model within the national healthcare system.
Kata Kunci : anomaly detection, auto-encoder, isolation forest, healthcare billing