BOOTSTRAP PADA DATA TERSENSOR UNTUK ESTIMASI KOEFISEN ï¢ DALAM MODEL REGRESI COX
Azimmatul Ihwah, Prof. Dr. Sri Haryatmi. K, M.Sc.
2012 | Tesis | S2 MatematikaModel regresi survival merupakan model regresi yang memodelkan hubungan antara waktu survival (variabel dependen) dan kovariat (variabel independen). Model regresi linier ganda tidak dapat digunakan dalam data survival saat terdapat data yang tersensor. Model regresi Cox merupakan model regresi survival yang sering digunakan pada banyak kasus data tersensor karena tidak mensyaratkan distribusi waktu survival. Koefisien ï¢ dalam model regresi Cox diestimasi dengan metode partial likelihood. Selanjutnya digunakan metode untuk inferensi berdasarkan teori maksimum likelihood yang membutuhkan sampel besar. Teori ini akan memberikan aproksimasi yang kurang baik untuk sampel kecil. Dapat dikatakan bahwa keakuratan inferensi statistik tergantung dari ukuran sampel. Di samping itu, pengumpulan data bertujuan untuk mengetahui distribusi probabilitas dari suatu statistik. Metode bootstrap merupakan metode resampling yang dapat digunakan untuk mengatasi keduanya sekaligus. Metode bootstrap mengestimasi distribusi probabilitas suatu statistik dengan menggunakan distribusi probabilitas yang dibangun dari sampel bootstrap.Termasuk juga memeriksa keakuratan statistik melalui standar eror estimatornya. Dalam penulisan ini, metode bootstrap digunakan untuk mengestimasi koefisien ï¢ dalam model regresi Cox. Disajikan algoritma dari metode bootstrap untuk data tersensor. Properti asimtotik dari estimatornya ditunjukkan dalam beberapa teorema. Dengan memperhatikan histogram estimator bootstrapnya dapat dilihat bahwa distribusi estimator bootstrap mendekati distribusi normal. Berdasarkan properti dari estimator, dapat dilakukan inferensi statistik dan salah satu hasilnya adalah interval konfidensi. Simulasi numerik dengan program R digunakan untuk menunjukkan bagaimana algoritma metode bootstrap diterapkan pada data tersensor.
Survival regression model is used to make correlation form between survival time (dependent variable) and covariate (independent variable). Multiple linier regression is not well suited to survival data when we have censored data. Cox regression model is one of survival regression that often used in many cases which there is censored data because it does not require any asumptions about the survival time distribution. ï¢ coefficients in Cox regression model estimates with partial likelihood method. Then we use method for inference based on maximum likelihood theory that need large sample. This theory gives bad approximation when we use small sample. So we can say that the accuracy of statistic inference depend on sample size. Beside, we need to know the probability distribution of a statistiscs. Bootstrap method is the resampling method that can be used to handled two of those. Bootstrap methods can use to estimate probability distribution of a statistics with built probability distribution from bootstrap samples. Bootstrap method use to examine the accuracy of statistic by standard error of estimator. In this paper, bootstrap method is used to estimate ï¢ coefficients in Cox regression model. The algorithm of bootstrap method for Cox regression model were presented. Asymptotic properties of the estimates can be shown in some theorems. The histogram of bootstrap estimator were presented to show that the ditribution of the bootstrap estimates limiting to the normal distribution. Based on the properties of estimator, statistical inference can be derived and the one of the result is confidence interval. Numerical simulation with R is used to show how bootstrap method work in censored data.
Kata Kunci : model regresi Cox, data tersensor, bootstrap, standar eror estimator.