ESTIMASI MAKSIMUM LIKELIHOOD MELALUI ALGORITMA EKSPEKTASI MAKSIMISASI UNTUK MODEL REGRESI LINEAR DENGAN DATA HILANG
HARIZAHAYU, Prof. Drs. H. Subanar, Ph.D.
2015 | Tesis | S2 MatematikaData merupakan salah satu poin penting dalam setiap analisis data, karena tidak akan mungkin analisis dapat dilakukan jika datanya tidak lengkap. Data yang digunakan diharapkan merupakan data yang baik. Namun pada kenyataannya, seringkali data tidak sesuai dengan yang kita harapkan. Data yang tidak lengkap menyebabkan proses mengambil kesimpulan mejadi lebih sulit. Jika data yang hilang diabaikan, maka akan menyebabkan kesimpulan bias atau tidak valid. Dalam penelitian ini akan digunakan model regresi linear. Analisis regresi adalah analisis statistik yang dilakukan untuk memodelkan hubungan antara (variabel dependen) dan variabel random kategorik (variabel independen). Untuk variabel kontinu dan variabel diskrit, dengan mengasumsikan variabel yang seluruhnya teramati dan terdapat beberapa variabel yang hilang. Adapun klasifikasi data hilang yang akan dibandingkan terdiri dari tiga klasifikasi yaitu: MCAR, MAR, dan MNAR. Pembahasan ini diakhiri dengan studi kasus mengenai estimasi nilai data hilang pada variabel presentasi data xerostomia dengan menggunakan algoritma EM untuk menghitung maksimum likelihood estimasi (MLE) pada model regresi linear dengan tiga klasifikasi data hilang. Kata kunci: regresi linear, data hilang, missing completely at random, missing at random, missing not at random, Lagrange multipliers, ekspektasi maksimisasi.
Data is one of the important points in every data analysis as it is impossible to conduct data analysis without data. The data used is expected to be good data. In fact, it is commonly found that the data doesn’t meet the expectation. Incommplete data causes the difficult in drawing the conclusion. If missing data are ignored, it causes the conclusion are bias or invalid. This research will use a linear regression model. Regression analysis is a statistical analysis is performed to model the relationship between Y (the dependent variable) and a categorical random variable X (the independent variable). For continuous variables for Y and discrete variables for X, assuming that all of the observed variables Y and X are some missing variables. The classification of missing data to be compared consists of three classifications, namely: MCAR, MAR, and MNAR. This discussion concludes with a case study on the estimated value of the missing data on the variable data presentation xerostomia using EM algorithm to calculate the maximum likelihood estimation (MLE) in a linear regression model with the three classifications of missing data. Keywords: linear regression, missing data, missing completely at random, missing at random, missing not at random, Lagrange multipliers, ekspectation maximization.
Kata Kunci : regresi linear, data hilang, missing completely at random, missing at random, missing not at random, Lagrange multipliers, ekspektasi maksimisasi; linear regression, missing data, missing completely at random, missing at random, missing not at random, Lag