PEMILIHAN MODEL PADA DATA LONGITUDINAL DENGAN DATA HILANG MENGGUNAKAN MISSING LONGITUDINAL INFORMATION CRITERION (MLIC)
PARAMITHA KURNIAJATI, Zulaela, Dipl.Med.Stats., M.Si.
2021 | Skripsi | S1 STATISTIKAData hilang sering muncul di bidang klinis dan epidemiologi, khususnya dalam studi longitudinal yang menggabungkan antara pengamatan cross section dan time series. Persamaan estimasi tergeneralisasi (GEE) telah menjadi alat yang populer untuk analisis regresi marjinal dengan data longitudinal. Namun, metodologi pemilihan model untuk GEE belum dikembangkan secara sistematis untuk memungkinkan analisis dengan data hilang. Maka diusulkan Missing Longitudinal Information Criterion (MLIC) untuk pemilihan mean model berdasarkan pada estimasi persamaan estimasi tergeneralisasi terboboti (WGEE) ketika hasil data adalah subjek dengan pola data hilang yang monoton dengan asumsi hilangnya secara acak (MAR). Pada perangkat lunak R telah tersedia paket wgeesel yang mengimplementasikan model marjinal dan menyediakan kriteria informasi yang ada untuk pemilihan model WGEE pada mean marjinal atau struktur korelasi. Performa dari metode ini akan ditunjukkan melalui simulasi dan analisis menggunakan data nyata yaitu data angka prevalensi pemakaian kontrasepsi (CPR) di 33 provinsi di Indonesia pada tahun 2008-2012.
Missing data arise frequently in clinical and epidemiological fields, particularly in longitudinal studies that combine cross section and time series observations. Generalized Estimating Equation (GEE) has been a popular tool for marginal regression analysis with longitudinal data. However, model selection methodologies for GEE have not been systematically developed to allow for missing data. So, the Missing Longitudinal Information Criterion (MLIC) for selection of the mean model in Weighted Generalized Estimating Equation (WGEE) when the outcome data are subject with monotone missing data pattern assuming Missing at Random ( MAR) are proposed. R software provides a wgeesel package which implements marginal model fitting and provide existing information criteria for WGEE model selection on marginal mean or correlation structures. The performance of this method will be demonstrated through simulation and analysis of real data on Contraceptive Prevalence Rate (CPR) in 33 provinces in Indonesia during 2008-2012
Kata Kunci : persamaan estimasi tergeneralisasi terboboti, data longitudinal, data hilang, pemilihan model, wgeesel, weighted generalized estimating equation, longitudinal data, missing data, model selection