ANALISIS DATA LONGITUDINAL DENGAN NILAI RESPON DATA HILANG MENGGUNAKAN MISSIN LONGITUDINAL INFORMATION (MLIC)
Tekla Unik Kartika, Drs. Danardono, MPH., Ph.D. ; Drs. Zulaela. Dipl. Med. Stats., M.Si.
2024 | Tesis | S2 Matematika
Pemilihan model regresi merupakan aspek penting dalam analisis data. Quasi likelihood Information Criterion (QIC) saat ini sangat populer untuk pemilihan model GEE dan telah diimplementasikan dalam perangkat lunak SAS 9.2. Keterbatasan utama dari prosedur pemilihan model \Generalized Estimating Equation (GEE) adalah tidak dapat mengakomodasi data yang hilang. Dengan adanya data yang hilang, tidak menjamin prosedur QIC dapat bekerja dengan baik, terutama ketika data tidak Missing Completely at Random (MCAR). Oleh karena itu, Shen dan Chen (2013) memperkenalkan Missing Longitudinal Information Criterion (MLIC) untuk pemilihan model mean berdasarkan estimasi kuadratik kerugian dan estimasi Weighted Generalized Estimating Equation(WGEE). Penelitian ini akan menunjukkan keakuratan QIC dan MLIC dalam mengakomodasi data hilang pada data longitudinal. Kinerja model ini akan ditunjukkan melalui simulasi dan analisis dengan menggunakan data ICHS (Indonesian Children's Health Study). Setiap pengolahan data diulang sebanyak 50 kali untuk melihat hasil pengolahan data secara akurat dengan proporsi missing 5%, 15%, 25%, dan 40%. Hasil analisis menunjukkan bahwa pemilihan model dengan QIC lebih akurat dibandingkan dengan pemilihan model MLIC. Hal ini berarti pemilihan model dengan tidak mengakomodir data hilang pada data longitudinal tidak memberikan pengaruh yang signifikan terhadap penentuan model terbaik.
Regression model selection is an important aspect of data analysis. The Quasi-likelihood Information Criterion (QIC) is currently very popular for GEE model selection and has been implemented in SAS 9.2 software.
The main limitation of the Generalized Estimating Equation (GEE) model selection procedure is that it cannot accommodate missing data. In the presence of missing data, it does not guarantee that the QIC procedure can work well, especially when the data is not missing completely at random (MCAR). Therefore, Shen and Chen (2013) introduced the Missing Longitudinal Information Criterion (MLIC) for mean model selection based on quadratic loss estimation and weighted generalized estimation equation (WGEE) estimation. This study will show the accuracy of QIC and MLIC in accommodating missing data in longitudinal data. The performance of this model will be demonstrated through simulation and analysis using ICHS (Indonesian Children's Health Study) data. Each data processing is repeated 50 times to see the results of the data processing accurately with the proportion of missing 5%, 15%, 25%, and 40%. The analysis results show that model selection with QIC is more accurate than MLIC model selection. This means that model selection by not accommodating missing data in longitudinal data does significantly affect determining the best model.
Kata Kunci : Persamaan estimasi tergeneralisasi terbobot, data longitudinal, data hilang, pemilihan model, wgeesel.