Laporkan Masalah

Pengembangan Model Mixture untuk analisis Cure Rate Penderita Kanker Payudara dengan Missing Data

DRA. NURKAROMAH DWI DAYATI, M.SI, Prof. Dr. Hj. Sri Haryatmi Kartiko, M.Sc.; Prof. Drs. H. Subanar, Ph.D.

2015 | Disertasi | S3 Matematika

Penelitian ini bertujuan mengembangkan model mixture untuk analisis cure rate dengan missing data, dengan cara: (1) menentukan model mixture untuk analisis cure rate dengan missing data, (2) melakukan estimasi parameter dalam model mixture untuk analisis cure rate dengan missing data, (3) mengkaji sifat-sifat estimator yang diperoleh dalam model mixture untuk analisis cure rate dengan missing data, dan (4) mengaplikasikan model mixture untuk analisis cure rate penderita kanker payudara (PKPD) dengan missing data berdasar data nyata. Untuk analisis cure rate dengan missing data, dikembangkan model mixture dengan menggabungkan fungsi densitas tahan hidup pasien yang sembuh (cure) dan fungsi densitas tahan hidup pasien yang tak sembuh (uncured). Dalam hal ini, tahan hidup pasien yang sembuh merupakan data yang terobservasi, sedangkan tahan hidup pasien yang tak sembuh memuat missing data. Dengan demikian dalam dalam model mixture, fungsi densitas data lengkap dapat diformulasikan sebagai perkalian fungsi densitas data terobservasi dengan fungsi densitas bersyarat dari missing data diberikan data terobservasi. Estimasi parameter dalam model mixture untuk analisis cure rate dengan missing data didasarkan pada algoritma EM (Expectation Maximization Algorithm), yang merupakan pendekatan iterasi untuk menganalisis missing data. Algoritma EM meliputi 2 langkah yaitu: E-step dan M-step. Pada E-step ditentukan ekspekstasi fungsi log likelihood data lengkap. Pada M-step dilakukan maksimasi dari ekspektasi fungsi log likelihood yang diperoleh pada E-step, sehingga diperoleh estimator parameter dalam model. Baseline survival function tidak dapat dieliminasi secara lengkap pada algoritma EM. Untuk estimasi baseline survival function digunakan asumsi proportional hazard (PH) sebagaimana yang digunakan dalam model PH Cox. Baseline survival ini digunakan untuk menghitung survival rate pada waktu tertentu dan sesuai karakteristik tertentu. Pada algoritma EM, log likelihood data lengkap mengalami kenaikan pada setiap iterasinya. Barisan log-likelihood ini konvergen jika log-likelihood terbatas ke atas. Estimator dalam model mixture untuk analisis cure rate dengan missing data yang diperoleh melalui algoritma EM, konvergen ke lokal maksimum dari fungsi likelihood, meskipun untuk mencapai kekonvergenan sangat lamban. Model mixture untuk analisis cure rate PKPD yang berobat di di RSUP Dr. Sardjito Yogyakarta tahun 2004-2009 adalah model mixture Weibull. Pada model ini dikombinasikan 2 (dua) distribusi Weibull 2 parameter sebagai fungsi densitas tahan hidup PKPD yang sembuh, dan fungsi densitas tahan hidup PKPD yang tak sembuh yang memuat missing data. Analisis data dilakukan berbantuan software Maple dan program iterasi yang dikembangkan berbantuan software Matlab. Berdasarkan hasil penelitian ini ditemukan beberapa permasalahan terbuka yang memerlukan penelitian lebih lanjut (1) perlu dikembangkan software lain terkait iterasi numerik pada estimasi parameter dalam model mixture dengan distribusi lifetime tertentu, dimana solusi maksimasi ekpekstasi fungsi log-likelihood nya not closed-form (2) perlu dilakukan penelitian lanjutan dengan fokus pengembangan analisis survival untuk uji sufficient follow up dalam analisis cure rate.

This research aims to develop a mixture model for the cure rate analysis with missing data, by way of: ( 1 ) determine the mixture models for the analysis of the cure rate with missing data, ( 2 ) to estimate the parameters of mixture models for the analysis of the cure rate with missing data, ( 3 ) study of the properties of estimators obtained in mixture models for the analysis of the cure rate with missing data, and ( 4 ) apply the mixture models for the analysis of the cure rate of patients with breast cancer ( PBC ) with missing data based on real data . To cure rate analysis with missing data, developed a model mixture by combining the density function of life time of cure patients and density function of life time of uncured patients. In this case, life time of cure patients is the observed data , whereas life time of uncured patients includes missing data. Thus in the mixture models, the density function of complete data can be formulated as a multiplication of density function of the observed data with the conditional density function of the missing data given the observed data. Estimation of parameters in the mixture model for the cure rate analysis with missing data based on the EM (Expectation Maximization) Algorithm, which is an iterative approach to analyzing the missing data. EM algorithm includes two steps: the E-step and M-step. In the E-step, determined expectations of log likelihood function of complete data. In the M-step is done to maximize expectations of the log likelihood function of obtained in the E-step, in order to obtain estimators of parameters in the model. Baseline survival function can not be eliminated on the EM algorithm. To estimate the baseline survival function is used assuming proportional hazards (PH) as used in the Cox PH models. Baseline survival function is used to calculate the survival rate at certain times and in accordance certain characteristics. The EM algorithm is guaranted to converge to a local maximum of the likelihood function, with each iteration increasing the log likelihood. Rows of log likelihood is convergent if the log likelihood is bounded above. Estimator in mixture models for the analysis of the cure rate with missing data obtained via the EM algorithm converges, although to achieve convergence is very slow . Mixture models for analysis PBC who seek treatment at RSUP Dr. Sardjito Yogyakarta in 2004-2009 is Weibull mixture models . In this model combined 2 (two) Weibull distribution with 2 (two) parameters as a density function of life time of the cured PBC, and the density function of life time of uncured PBC containing missing data. To analysis the data was performed aided Maple software and iteration programs developed Matlab software assisted. Based on the results of this study found several open issues that need further investigation ( 1 ) needs to be developed other software related numerical iteration on the model parameter estimation in mixture with certain lifetime distribution , where the solution maximizing the log -likelihood function ekpekstasi its not closed - form ( 2 ) further research needs to be done to focus the development of the survival analysis for sufficient follow-up test in the analysis of the cure rate .

Kata Kunci : model mixture, cure rate, missing data, algoritma EM, proportional hazard, baseline survival function, survival rate


    Tidak tersedia file untuk ditampilkan ke publik.