ANALISIS KLASIFIKASI MENGGUNAKAN KOMBINASI METODE NAIVE BAYES DAN POHON KEPUTUSAN (NBTREE)
MUHAMMAD REZA ADI KUSUMA , Drs. Danardono, MPH., Ph.D.
2020 | Skripsi | S1 STATISTIKAPohon Keputusan merupakan metode klasifikasi yang terbukti akurat. Metode ini bekerja dengan mempartisi data latih secara rekursif hingga didapatkan partisi yang hanya memiliki satu kelas. Metode Naive Bayes juga telah terbukti sebagai metode klasifikasi yang akurat. Namun ketika digunakan pada data yang berukuran besar, metode ini sering kali memberikan performa yang kurang baik dibandingkan metode lainnya. Metode NBTree merupakan metode kombinasi Naive Bayes dengan Pohon Keputusan yang bertujuan untuk mengatasi kelemahan ini dengan mempartisi data seperti pada Pohon Keputusan, namun setelah sejumlah partisi, data diklasifikasi dengan metode Naive Bayes. Cara ini lebih baik daripada Pohon Keputusan karena sangat mungkin partisi tersebut berukuran kecil sedangkan metode Naive Bayes unggul dalam melakukan klasifikasi meski dengan ukuran data latih yang kecil. Penelitian ini difokuskan pada metode Pohon Keputusan, Naive Bayes, dan NBTree dalam mengklasifikasi suatu dataset yang berukuran cukup besar. Algoritma C4.5 digunakan untuk membentuk Pohon Keputusan. Dari hasil penelitian ini dapat dilihat bahwa metode NBTree memberikan performa yang lebih baik daripada metode Naive Bayes dan Pohon Keputusan C4.5.
Decision Tree is a classification method that is proven to be accurate. It works by partitioning training data recursively to obtain partitions that only belong to one class. Naive Bayes is also proven as an accurate classification method, however it usually gives lower performance compared to other methods when used to classify large dataset. NBTree is a Naive Bayes and decision tree hybrid classification method made purposely to resolve this weakness by partitioning the training data similar to decision tree, however after several partitionings it classifies these partitions by Naive Bayes method. This method is better than decision tree due to these partitions probably have small size and Naive Bayes method excels in classifying small training data. This research was concerned to classify a quite large dataset using decision tree, Naive Bayes, and NBTree methods. C4.5 algorithm was used to construct decision tree. It could be concluded from the result of this research that NBTree method gave better performance than Naive Bayes and Decision Tree C4.5 methods.
Kata Kunci : klasifikasi, metode kombinasi, hybrid, Pohon Keputusan, decision tree, C4.5, Naive Bayes, NBTree