Estimasi-S Robust untuk Regresi Spline Terpenalti
HENNI PRATIKA, Dr. Adhitya Ronnie Effendie, M.Si, M.Sc
2014 | Skripsi | STATISTIKARegresi spline terpenalti adalah salah satu metode yang saat ini sering digunakan untuk smoothing noisy data. Model regresi spline terpenalti adalah alat statistik yang popular untuk masalah fitting kurva karena fleksibilitas dan efisiensi dalam kumputasinya. Pada regresi spline, estimasi kurva regresi dapat diselesaikan dengan kuadrat terkecil terpenalti atau Penalized Least Square. Namun metode estimasi ini rentan terhadap kehadiran pencilan. Sehingga diperkenalkan metode estimasi-S robust terpenalti. Oleh karena itu metode estimasi kuadrat terkecil untuk regresi spline terpenalti diganti dengan metode estimasi-S robust yang mampu menangani kehadiran pencilan dalam data. Dengan tetap menjaga pembentukan model spline dan menjaga bentuk penalti, meskipun menggunakan estimator-S daripada estimator kuadrat terkecil, didapatkan metode estimasi yang robust dan cukup fleksibel untuk menangkap trend non-linear dalam data. Dalam skripsi ini juga mempelajari bagaimana memilih secara robust parameter penalti ketika kemungkinan terdapat outlier pada data. Diberikan kriteria pemilihan parameter penalti robust berdasarkan generalized cross-validation yang juga didapat dari gambaran weighted penalized least square dari estimator S-regresi terpenalti. Contoh data simulasi dan data riil digunakan untuk menggambarkan efektivitas prosedur.
Penalized regression splines are one of the currently most used methods for smoothing noisy data. Penalized spline regression models are a popular statistical tool for curve fitting problems due to their flexibility and computational efficiency. In spline regression, regression curve estimation can be solved by Penalized Least Square. However, this estimation method vulnerable to the presence of outliers. Therefore we proposed robust Penalised-S estimation method. Hereby we replace the least squares estimation method for penalized regression splines by S-estimation method, that capable of addressing the presence of outlier in the data. By keeping the modeling of splines and by keeping the penalty term, though using S-estimators instead of least squares estimators, we arrive at an estimation method that is both robust and flexible enough to capture non-linear trends in the data. This Undergraduate thesis also learn how to choose the penalty parameter robust when there are possibilities of outliers in the data. We propose a robust penalty parameter selection criteria based on generalized cross-validation that also borrows from the weighted penalized least squares representation of the penalized S-regression estimator. Simulated data and a real data example are used to illustrate the effectiveness of the procedure.
Kata Kunci : estimasi-S robust, regresi spline terpenalti, estimasi-S terpenalti, parameter pemulus, regresi nonparametrik, rgcv