Laporkan Masalah

ANALISIS SENTIMEN DAN KLASIFIKASI KATEGORI TERHADAP TOKOH PUBLIK PADA DATA TWITTER MENGGUNAKAN NAIVE BAYES CLASSIFIER

AHMAD FATHAN HIDAYATULLAH, Dr. Azhari SN, M.T.

2014 | Tesis | S2 Ilmu Komputer

Keberadaan Twitter yang telah digunakan secara luas oleh berbagai lapisan masyarakat merupakan media yang dapat merepresentasikan apa yang sedang menjadi tren pembicaraan di masyarakat luas. Kebiasaan masyarakat mem-posting tweet dalam menanggapi apa yang dilakukan oleh tokoh publik dapat menjadi salah satu acuan untuk mengetahui sentimen masyarakat terhadap tokoh publik. Kebutuhan mengenai analisis sentimen terhadap tokoh publik biasanya muncul apabila ada pihak yang ingin mengetahui sentimen dan tanggapan publik menjelang pemilihan umum. Penelitian ini melakukan analisis sentimen dan klasifikasi tweet berbahasa Indonesia terhadap tokoh publik menggunakan metode Naive Bayes Classifier. Metode Naive Bayes dikombinasikan dengan menambahkan fitur untuk dapat mendeteksi negasi dan pembobotan dengan fitur term frequency serta TF-IDF. Klasifikasi tweet pada penelitian ini dilakukan berdasarkan sentimen terhadap fitur tokoh publik. Hasil pengujian pada aplikasi yang dibangun dan pada tools RapidMiner memperlihatkan bahwa akurasi dengan fitur term frequency memberikan hasil akurasi yang lebih baik daripada akurasi dengan fitur TF-IDF. Metode Support Vector Machine juga menghasilkan akurasi performansi yang lebih baik daripada metode Naive Bayes. Namun demikian, secara keseluruhan penggunaan metode Support Vector Machine dan Naive Bayes sama-sama memiliki performansi yang cukup baik untuk melakukan klasifikasi tweet.

Twitter has been used extensively by various segments of society. Hence, it can be a media that represent trending issues in public. The people habbits of posting tweet can be a refference to find out the public sentiment toward public figures. The needs of sentiment analysis toward public figures are usually necessary when people want to know the public sentiment and response toward the public figures especially before elections. This research analyzes and classifies tweets in Indonesian language using Naive Bayes Classifier combined with negation detection and term weighting feature using term frequency and TF-IDF. The classification in this research is classified based on sentiment about public figure's feature. Based on the evaluation of the application and RapidMiner tools, the accuration result shows that the term frequency feature gives better result than that of TF-IDF. The Support Vector Machine method gives better result than that of Naive Bayes in classifying tweet. However, both of these methods have the same good performance to classify tweet.

Kata Kunci : analisis sentimen, klasifikasi, Naive Bayes , Support Vector Machine, sentiment analysis, classification, Naive Bayes, Support Vector Machine


    Tidak tersedia file untuk ditampilkan ke publik.