Laporkan Masalah

KLASIFIKASI DENGAN METODE RANDOM FOREST DAN ANALISIS DISKRIMINAN LINEAR

CUT ASYRAF ANZILA, Adhitya Ronnie Effendie, S.Si., M.Sc.

2014 | Skripsi | STATISTIKA

Pohon Keputusan telah banyak digunakan pada berbagai macam masalah karena melihat efisiensi waktu dalam menganalisa dan keakuratan klasifikasinya. Salah satu pengembangan dari pohon keputusan adalah metode klasifikasi Random Forest. Penggunaan metode random forest untuk menghasilkan pohon gabungan telah memberikan dugaan yang lebih tinggi akurasinya dibandingkan dengan pohon tunggal. Analisis klasifikasi klasik yang biasa digunakan adalah Analisis Diskriminan Linear. Namun biasanya Analisis Diskriminan akan menghasilkan prediksi dibawah metode Random Forest. Untuk meningkatkan akurasi dari Analisis Diskriminan Linear ini, akan digunakan seleksi fitur dari Random Forest. Seleksi fitur merupakan sebuah tahapan penting dalam proses klasifikasi, karena fitur yang terseleksi sangat mempengaruhi tingkat akurasi dari klasifikasi. Pada dataset yang memiliki banyak fitur membutuhkan proses untuk mereduksi fitur yang dianggap kurang penting. Setelah menyeleksi fitur tahap selanjutnya adalah mengklasifikasikan data.

Decision Tree has been widely used in various cases due the time efficiency in the analysis and classification accuracy. One of the development of Decision Tree is Random Forest classification method. The use of this method to produce the joint tree have provided more accurate allegation compared to the single tree. The common used for classification analysis is Linear Discriminant Analysis. Usually, Linear discriminant Analysis provide lower accuracy compared to the Random Forest Methods. In order to increase the accuracy of Linear Discriminant Analysis, features selection will be used with Random Forest. The features selection is an important stage in classification proccess, because the selected features will greatly affect the accuracy of classification. In the dataset with many features require a proccess to reduce the insignificant feature. After selecting the features, the data will be classified with Linear Discriminant Analysis.

Kata Kunci : Klasifikasi, Random Forest, Analisis Diskriminan Linear, seleksi fitur.


    Tidak tersedia file untuk ditampilkan ke publik.