Laporkan Masalah

Seleksi model linear menggunakan metode Cross Validation

SAGALA, Prihatin Ningsih, Prof.Dr. Zanzawi Soejoeti, Ph.D

2007 | Tesis | S2 Matematika

Masalah yang akan dibahas adalah tentang pemilihan sebuah model yang mempunyai kemampuan memprediksi terbaik diantara satu kelas model- model linear. Ketika data yang diberikan sangat besar, ada alternatif cara untuk menyelesaikannya. Yaitu dengan proses pemisahan data menjadi dua bagian. Bagian pertama disebut model building set ( test set ) yang digunakan untuk membentuk model. Sedangkan yang kedua disebut validation set ( prediction set ) yang digunakan untuk mengevaluasi kemampuan prediksi dari model yang dipilih. Metode validitas ini yang disebut cross validation, yang secara asimtot sama dengan kebanyakan model- model seleksi yang lain. Seperti Kriteria Informasi Akaike ( AIC ), Cp, dan secara asimtot tidak konsisten dalam pengertian bahwa probabilitas seleksi model dengan kemampuan memprediksi terbaik tidak konvergen ke 1, sebagai jumlah total observasi n®¥. Oleh karena itu, agar model regresi menjadi konsisten , maka kami menunjukkan bahwa ketidak sesuaian validitas leave one-out cross validation dapat diperbaiki dengan menggunakan leave v n -out cross validation, jumlah observasi yang disediakan untuk validasi memenuhi 1 v n n® dan n®¥.

Problem which will be studied is concerning selection a model having ability of predicting is best between one classes modeling linear. When data which very big given, there is alternative of way of finishing ( That is with separation process of data become two part. Part firstly called as model building set ( set test ) which applied for forming model. While secondly called as validation set ( prediction set ) which applied for evaluating ability of prediction from the selected model. This validity method so-called cross validation, what asymtotically equal to mostly modeling other selections. Like Information Criterion Akaike ( AIC)),, Cp, and the bootstrap , is asymtotically inconsistent in the meaning that probability selecting model ably predict is best not convergent to 1, as full scale of observation n®¥. Therefore, to model regression become consistence, We show that the inconsistency of the leave one-out cross validation can be rectifed by using a leave v n - out cross validation with v n , the number of observation reserved for validation, satisfying 1 v n n® as n®¥.

Kata Kunci : Regresi Linear,Cross Validation,Pemisahan Data, Cross Validation, Consis tency, Data Spliting


    Tidak tersedia file untuk ditampilkan ke publik.