PENERAPAN ALGORITMA GENETIKA DALAM PEMILIHAN VARIABEL PADA MODEL REGRESI LOGISTIK
LABIBAH ALYA HUWAIDA, Drs. Danardono, M.P.H., Ph.D
2019 | Skripsi | S1 STATISTIKAPemilihan fitur atau variabel merupakan hal yang sangat penting dalam membangun sebuah model prediksi. Metode pemilihan variabel ada berbagai macam seperti purposeful selection, best subset, dan stepwise. Namun, metode-metode tersebut memiliki banyak kekurangan khususnya pada era big data. Pada penelitian ini digunakan metode Algoritma Genetika untuk memilih variabel yang relevan dalam model regresi logistik. Metode seleksi backward, forward, dan stepwise digunakan sebagai pembanding untuk mengetahui metode mana yang memiliki performa lebih baik. Dari hasil analisis dengan menggunakan dua buah data set dengan ukuran variabel yang berbeda diperoleh kesimpulan bahwa metode Algoritma Genetika memberikan nilai akurasi, sensitivitas, dan spesifisitas yang lebih baik dibandingkan dengan metode seleksi backward, forward, dan stepwise.
Feature selection is very important to consturct a predictive model. There are several methods of feature selection such as purposeful selection, best subset, and stepwise. Nevertheless, those methods have many drawbacks especially in big data era. In this study, genetic algorithm will be used to select variables which are relevant in logistic regression model. Backward, forward, and stepwise selection method are used to compare which method gives the better performance. In this study, two datasets with different dimensions are used. The conclusion from the analysis is genetic algorithm gives higher accuracy, sensitivity, and specificity than backward, forward, and stepwise selection.
Kata Kunci : Pemilihan Variabel, Algoritma Genetika, Seleksi Backward, Seleksi Forward, Seleksi Stepwise/ Feature Selection, Genetic Algortihm, Backward Selection, Forward Selection, Stepwise Selection