SPLINE PADA REGRESI SEMIPARAMETRIK MULTIRESPON
WAHYU WIBOWO, Prof. Dr. Sri Haryatmi, M.Sc; Prof. Dr. Drs. I Nyoman Budiantara, MS.
2014 | Disertasi | S3 MatematikaRegresi semiparametrik merupakan model regresi yang mengkombinasikan antara regresi parametrik dan nonparametrik. Sehingga, regresi semiparametrik memuat sekaligus estimator parametrik dan nonparametrik. Munculnya estimator spline sebagai estimator nonparametrik dalam regresi semiparametrik dikarenakan penggunaan metode penalized least square sebagai metode estimasi parameter. Estimator spline dalam regresi semiparametrik dikenal juga sebagai estimator spline parsial. Sejauh ini, estimator spline parsial yang sudah dikembangkan merupakan estimator untuk model regresi semiparametrik satu respon. Sementara dalam aplikasi banyak kasus pemodelan dengan respon lebih dari satu. Oleh karena itu, penelitian ini mengusulkan pembentukan model regresi semiparametrik spline multirespon. Diberikan data ( , , ) i i ji t x y ɶ dengan j =1, 2,…, r menunjukkan banyaknya respon dan i =1,2,⋯,n menunjukkan banyak pengamatan. Dalam hal ini 1 2 ( , ,..., ) i i i ip x = x x x ɶ vektor berukuran 1´ p dan diasumsikan memiliki hubungan yang linear dengan variabel respon ji y . Sedangkan variabel prediktor [ , ] i t Î a b , tidak diketahui bentuk pola hubungannya dengan variabel respon ji y . Hubungan antara , , i i ji t x y ɶ dimodelkan dengan regresi semiparametrik multirespon : ( ) , 1,2, , ; 1,2, , ji j i i j ji y = f t + x β +e j = ⋯ r i = ⋯ n ɶ ɶ ( ) j i f t merupakan komponen nonparametrik yang diasumsikan berada di dalam ruang Sobolev 2 W m[a,b] . Suku i i x β ɶ ɶ merupakan komponen parametrik dan parameter 1 2 ( , ,..., )T p βj = b j b j b jp Î℠ɶ merupakan vektor parameter komponen parametrik yang tidak diketahui berukuran p´1. Error random ji e , i =1, 2,⋯, n saling independen dengan mean nol dan variansi 2 j s . Error ji e dan ki e saling berkorelasi dengan ( , ) , ; ji ki corr e e = r j ¹ k j, k =1, 2,⋯, r . Penelitian ini bertujuan untuk mengembangkan model regresi semiparametrik multirespon baik secara teori maupun aplikasi. Secara lebih rinci, tujuan penelitian ini adalah menurunkan estimator spline parsial sebagai estimator nonparametrik dan estimator parameter komponen parametrik model regresi semiparametrik multirespon. Selanjutnya karena estimator yang diperoleh tergantung pada parameter penghalus, maka penelitian ini juga akan menurunkan metode memilih parameter penghalus optimal untuk estimator spline parsial dalam regresi semiparametrik multirespon. Selanjutnya sifat konsisten estimator komponen parametrik akan diturunkan dalam penelitian ini. Penelitian ini juga akan menyusun prosedur simulasi untuk menyelidiki kebaikan estimator spline parsial untuk menduga kurva regresi semiparametrik multirespon. Berikutnya, model yang dikembangkan akan diilustrasikan penggunaannya untuk pemodelan data perbankan regional. Untuk mempermudah aplikasi model yang diusulkan, penelitian ini juga akan menyusun implementasi komputasi model regresi semiparametrik pada Microsoft Excel. Hasil penelitian menunjukkan bahwa estimator model dapat diperoleh dengan metode weighted penalized least square. Estimator untuk bagian nonparametrik pada setiap model merupakan spline natural orde (2m-1) . Estimator spline bergantung pada parameter penghalus yang nilai optimalnya dapat dipilih dengan dengan penerapan kriteria generalized cross validation. Estimator parametrik model regresi semiparametrik multirespon merupakan estimator yang konsisten. Model regresi semiparametrik multirespon dapat diterapkan pada dapat diterapkan pada data simulasi dan juga pada data real. Komputasi estimator model dapat diterapkan dengan program open source R.
Semiparametric regression is model that combines between parametric and nonparametric model. Thus, there is parametric and nonparametric estimator in the semiparametric regression. The emerging of spline estimator as nonparametric estimator is caused by penalized least square as parameter estimation method. Spline estimator in the semiparametric regression is also called partial spline estimator. So far, partial spline estimator for semiparametric regression is approriate for single response model. Thus, this research will propose development of multiresponse semiparametrik regression using spline as nonparametric component. We hope that the model can support many application of modeling with more than single response. Suppose ( , , ) i i ji t x y ɶ data deal with r response and n observation for each response with j =1, 2,…, r ; i =1,2,⋯,n. In this case, 1 2 ( , ,..., ) i i i ip x = x x x ɶ is vektor with 1´ p dimension and has linear relationship with response variable ji y , as well as the relation between predictor [ , ] i t Î a b and response variable is unknown. So, the relation between , , i i ji t x y ɶ will be modeled by multiresponse semiparametric regression. The model is, ( ) , 1,2, , ; 1, 2, , ji j i i j ji y = f t + x β +e j = ⋯ r i = ⋯ n ɶ ɶ Where ( ) j i f t is nonparametric component and assumed in 2 W m[a,b] Sobolev space. Term i i x β ɶ ɶ is parametric component and parameter 1 ( ,..., )T p βj = b j b jp Î℠unknown parameter with p´1 dimension. Random erroɶr , 1, 2, , ji e i = ⋯ n and for some j is independently with mean zero and variance 2 j s . Error ji e and ki e correlated with ( , ) , ; ji ki corr e e = r j ¹ k j, k =1, 2,⋯, r . The main objectives of this research are to develop theory and application of multiresponse semiparametric regression. In regard to the the theory, this research will derive both parametric and nonparametric estimator of semiparametric regression model, develop methods for choosing optimal smoothing parameter and derive consistency properties of parametric component. Meanwhile, regarding the application, simulation procedure also will be developed to show performance of partial spline estimator to estimate curve of multiresponse semiparametric regression. Then, the application of the model was ilustrated to model regional banking activities. Finally, to facilitate the implementation of this model, computation package in Microsoft Excel will be developed. The theoretical result shows that the estimator of nonparametric component is partial spline and for special condition we use, the spline is natural polynomial spline order (2m-1) . This estimator depends on smoothing parameter and the optimal condition can be obtained by applying generalized cross validation criteria. Then, we also showed that the parametric estimator is consistency estimator. The empirical results show that the model can be applied well for simulation or real data modeling. Then, the computational estimator also can be implemented by open source R software.
Kata Kunci : regresi, semiparametrik, multirespon, spline