Analisis dan Prediksi Data Survival Menggunakan Model Case-Base Neural Network (CBNN)
Diana Puspitasari, Drs. Danardono, MPH., Ph.D.
2025 | Tesis | S2 Matematika
Analisis data survival banyak diterapkan dalam berbagai
bidang, terutama dalam ilmu kedokteran dan epidemiologi, untuk memahami risiko
yang berkaitan dengan waktu hingga suatu kejadian. Salah satu metode yang umum
digunakan adalah regresi Cox, namun model ini memiliki keterbatasan, terutama
karena mengasumsikan proporsionalitas hazard. Ketika asumsi ini tidak
terpenuhi, regresi Cox tidak bisa menangani data survival yang kompleks,
nonlinear, serta melibatkan data tersensor dan kovariat yang berubah terhadap
waktu. Model Case-Base Neural Network (CBNN) dikembangkan untuk mengatasi
keterbatasan ini melalui pendekatan \textit{case-base sampling}, yang serupa
dengan teknik time-slicing dan memanfaatkan fleksibilitas arsitektur jaringan
saraf untuk mengestimasi fungsi hazard yang dinamis. Dalam penelitian ini,
model CBNN diterapkan pada dua jenis data survival, yakni data survival publik
yang tersedia secara terbuka dan data klinis nyata dari rumah sakit. Evaluasi
model menggunakan metrik akurasi survival, termasuk Integrated Brier Score (IBS), IPA Score, dan AUC
IPCW. Hasilnya menunjukkan bahwa model CBNN mengungguli regresi Cox pada semua
metrik, menandakan kemampuannya yang lebih baik dalam menangani data survival
yang kompleks dan time-varying. Selain itu, prediksi fungsi survival, hazard,
dan risiko kumulatif juga dilakukan untuk mengevaluasi profil risiko individual
berdasarkan variabel klinis.
Survival data analysis plays a crucial role in various disciplines, particularly in medical science and epidemiology, for understanding risks associated with time-to-event outcomes. The Cox proportional hazards model is widely used for this purpose; however, it has notable limitations, particularly when the assumption of proportional hazards is violated. This model struggles to capture complex, nonlinear relationships in survival data, particularly in the presence of censoring and time-dependent covariates. To overcome these challenges, the Case-Base Neural Network (CBNN) model integrates a case-based sampling strategy akin to time slicing, with the modeling flexibility of neural networks to estimate dynamic hazard functions. Model performance was evaluated using standard survival evaluation metrics, including the Integrated Brier Score (IBS), the IPA score, and the time-dependent AUC with Inverse Probability of Censoring Weighting (AUC-IPCW). The results indicate that the CBNN model consistently outperforms Cox regression across all evaluation criteria, demonstrating superior ability to handle complex and time-varying survival data. Furthermore, to evaluate its generalizability, the CBNN model was applied to both publicly available datasets and real-world clinical data. Predictions of survival probabilities, hazard rates, and cumulative risk functions were also performed to assess individual risk profiles under each dataset setting.
Kata Kunci : Analisis Survival, Case-Base Sampling, Data Tersensor, Neural Network