STUDI PERBANDINGAN METODE EKSTRAKSI FITUR, SELEKSI FITUR, DAN KLASIFIKASI PADA ANALISIS SENTIMEN SELAMA PEMILIHAN UMUM INDONESIA 2019
Gama Candra Tri Kartika, Sri Mulyana, Drs., M Kom.
2019 | Skripsi | S1 ILMU KOMPUTERData dari media sosial seperti Twitter dan situs portal berita seperti Line-Today merupakan data yang objektif untuk diolah dikarenakan penggunanya yangsangat aktif dalam menyampaikan pendapatnya di kedua media sosial dan portal be-rita tersebut. Namun perbandingan metode dalam analisis sentimen belum banyakditerapkan dalam domain Bahasa Indonesia dan dataset Twitter dan Line-Today.Tujuan dari penelitian ini adalah untuk mengetahui nilai terbaik dari metodeekstraksi fitur, seleksi fitur, dan metode pengklasifikasian serta pemilihan kombinasiyang terbaik dari proses seleksi fitur dan ekstraksi fitur, terhadap nilai analisis senti-men dengan berbagai metode pengklasifikasian.Hasil penelitian ini adalah pada dataset Line-Today, pengklasifikasi terbaikpada masing-masing rata-rata semua nilai adalah Extra Tree (akurasi = 84.15 %), danExtra Tree Classifier (f1 score= 78.44 %). Kemudian pada dataset Twitter, pengkla-sifikasi terbaik pada masing-masing rata-rata semua nilai adalah Extra Tree (akurasi= 81.25 %) dan Extra Tree Classifier (f1 score= 78.45 %).
Data from social media such as Twitter and online news portal such as Line-Today are objective data to be processed because users are very active in expressingtheir opinions on both social media and online news portal. But the comparison ofmethods in sentiment analysis has not been widely applied in the Indonesian lan-guage, Twitter and Line-Today dataset .The purpose of this study was to determine the best value of feature extractionmethods, feature selection methods, and classification methods and the selection ofthe best combination of feature selection and feature extraction processes, to the valueof sentiment analysis with various classification methods.The results of this study on the Line-Today dataset, the best classifiers for eachaverage of all values are Extra Trees (accuracy = 84.15 %), and Extra Tree Classifiers(f1 score = 78.44 %). Then on the Twitter dataset, the best classifiers in each averageof all values are Extra Trees (accuracy = 81.25 %), and Extra Tree Classifier ( f1 score= 78.45 %).
Kata Kunci : analisis sentimen, seleksi fitur, ekstraksi fitur, klasifikasi teks / sentiment analysis, feature selection, feature extraction, text classification