STUDI EMPIRIS PERBANDINGAN REGRESI LOGISTIK, KLASIFIKASI NAIVE BAYES, DAN RANDOM FOREST
SRI W. KALUMBANG, Prof. Subanar, Ph.D.
2020 | Tesis | MAGISTER MATEMATIKAAnalisis klasifikasi adalah suatu metode yang bertujuan untuk mengelompokkan sejumlah observasi atau pengamatan ke dalam kelas-kelas tertentu berdasarkan feature atau variabel independen dari observasi tersebut. Dalam Hasti dkk (2009) disebutkan bahwa para peneliti statistika pada tahun 2003 melakukan kompetisi berbagai metode klasifikasi dan berbagai metrik untuk ukuran kebaikannya sejalan dengan kegiatan ilmiah yang dilakukan para statistikawan di atas. Oleh karena itu, Peneliti mempunyai ketertarikan untuk membandingkan 2 metode klasik dalam klasifikasi dan metode yang sekarang populer yaitu random forest dengan menggunakan data set yang diambil dari kaggle.com. Untuk melihat kebaikan modelnya digunakan FPR dan akurasi. Pada penelitian ini data set yang digunakan adalah heart disease, income evaluation, dan candy-data. Hasil penelitian ini menunjukkan bahwa metode random forest memiliki hasil prediksi terbaik pada heart disease, income evaluation, dan candy-data dataset kaggle.com dilihat dari akurasinya.
Classification analysis is a method that aims to group a number of observations or observations into certain classes based on features or independent variables from these observations. In Hasti et al. (2009) it is stated that statistical researchers in 2003 competed various classification methods and various metrics to measure their goodness in line with the scientific activities carried out by the statisticians above. Therefore, the researcher is interested in comparing 2 classical methods in classification and the now popular method, namely the random forest, using data sets taken from kaggle.com.To see the goodness of the model used FPR and accuracy. In this study the data set used were heart disease, income evaluation, and candy-data. The results of this study indicate that the random forest method has the best prediction results on heart disease, income evaluation, and candy-data dataset kaggle.com seen from its accuracy.
Kata Kunci : machine learning classification, classical method, random forest, FPR.