Estimasi LTS dan Estimasi LMS Pada Regresi Robust Linear
SIFAULU DUHA, Drs. Zulaela, Dipl.Med.Stats., M.Si
2019 | Skripsi | S1 STATISTIKAAnalisis regresi linear merupakan analisis statistik yang bertujuan untuk mengetahui hubungan antar variabel. Salah satu metode untuk mengestimasi parameter regresi linear adalah metode kuadrat terkecil. Diketahui bahwa estimasi metode kuadrat terkecil merupakan metode yang relatif lebih mudah, metode ini memiliki asumsi klasik yang harus dipenuhi, salah satunya residual yang berdistribusi normal. Pada kenyataannya masih terdapat data yang tidak memenuhi asumsi klasik tersebut, sehingga estimasi metode kuadrat terkecil tidak tepat digunakan. Skripsi ini membahas perbandingan dua estimasi robust pada regresi linear sebagai estimasi alternatif dari metode kuadrat terkecil saat residual tidak berdistribusi normal yakni saat data terkontaminasi dengan outlier. Metode estimasi robust dapat mengatasi outlier dengan mencocokkan model regresi dengan sebagian besar data, sehingga analisis regresi dengan estimasi robust dapat menghasilkan estimasi yang adaptif terhadap outlier. Metode estimasi yang digunakan dalam skripsi ini adalah estimasi least trimmed square (LTS) dan estimasi least median square (LMS). Data yang digunakan adalah data kadar kolesterol seseorang di Balai Laboratorium Kesehatan Yogyakarta tahun 2016 hubungannya dengan variabel HDL, LDL dan Trigliserida. Diperoleh hasil bahwa kedua estimasi robust lebih baik dari estimasi kuadrat terkecil berdasarka standard error yang lebih kecil. Di antara kedua estimasi robust diperoleh bahwa estimasi LTS lebih baik dari estimasi LMS berdasarkan efisiensi variansi parameter.
Linear regression analysis is a statistical analysis that aims to determine the relationship between variables. One method for estimating linear regression parameters is the least squares method. It is known that the estimation of the least squares method is a relatively easier method, this method has a classic assumption that must be fulfilled, one of which is a residual that is normally distributed. In fact, there are still data that do not fulfill the classical assumptions, so the estimation of the least squares method is not appropriate to use. This paper discusses the comparison of two robust estimates of linear regression as an alternative estimate of the least squares method when the residual is not normally distributed, i.e when the data is contaminated with outliers. Robust estimation method can overcome outliers by matching regression models with most data, so that regression analysis with robust estimation can produce estimates that are adaptive to outliers. The estimation method used in this paper is the least trimmed square (LTS) estimate and least median square (LMS) estimation. The data used is a person's cholesterol level data at the Yogyakarta Health Laboratory Center in 2016 in relation to the variables HDL, LDL and Triglycerides. The results obtained by the two robust estimates are better than the least squares estimation based on a smaller standard error. Between the two robust estimates, it is obtained that the LTS estimation is better than the LMS estimation based on the efficiency of the variance parameters.
Kata Kunci : outlier, robust, estimasi LTS, estimasi LMS