Laporkan Masalah

Analisis Sentimen dengan Metode Support Vector Machine dan Seleksi Fitur Mutual Information (Studi Kasus Tweet tentang SiCepat)

Ismah Hanifi Salihah, Dr. Abdurakhman, S.Si., M.Si.

2023 | Skripsi | S1 STATISTIKA

Twitter merupakan salah satu media sosial dimana penggunanya bisa berkomunikasi dengan pengguna lain dan mengungkapkan opininya secara bebas. Media sosial ini dapat digunakan oleh perusahaan untuk mendapatkan feedback tentang produk atau jasanya dari konsumen secara cepat dan mudah. Jumlah tweet dan gaya penulisan yang banyak di twitter menyebabkan sulitnya melihat gambaran sentimen secara cepat. Analisis sentimen dapat mengklasifikasikan sebuah tulisan ke dalam sentimen positif dan negatif secara otomatis dan cepat. Pada penelitian ini dilakukan analisis klasifikasi sentimen menggunakan data tweet terkait suatu perusahaan jasa pengiriman yang diperoleh dari Twitter API. Metode klasifikasi yang digunakan pada penelitian ini adalah Support Vector Machine dengan seleksi fitur Mutual Information. Seleksi fitur dilakukan untuk memilih fitur-fitur yang relevan dan membuang fitur-fitur yang tidak relevan. Berdasarkan eksperimen dengan jumlah fitur yang digunakan, diperoleh kesimpulan bahwa metode Support Vector Machine dengan seleksi fitur Mutual Information menggunakan 90 % fitur memiliki performa yang paling baik dengan akurasi sebesar 87,64%, presisi sebesar 89,13%, sensitifitas atau recall sebesar 94,61%, dan f-score sebesar 91,79%.

Twitter is one of the social media where the user can communicate with other users and express their opinions freely. This social media can be used by companies to get feedback quickly and easily about their products or services. The large number of tweets and writing styles on twitter makes it difficult to quickly get the picture of sentiment. Sentiment analysis can automatically classify a writing into positive and negative sentiment quickly. In this study, sentiment classification analysis was carried out using tweet data related to a delivery service company obtained from the Twitter API. The classification method used in this study is Support Vector Machine with Mutual Information feature selection. Feature selection is used to select relevant features and remove irrelevant features. Based on experiments with the number of features used, it can be concluded that Support Vector Machine method with Mutual Information feature selection using 90% of all features has the best performance with an accuracy of 87,64%, a precision of 89,13%, a sensitivity or recall of 94,61%, and an f-score of 91,79%.

Kata Kunci : analisis sentimen, support vector machine, seleksi fitur, mutual information

  1. S1-2023-424290-abstract.pdf  
  2. S1-2023-424290-bibliography.pdf  
  3. S1-2023-424290-tableofcontent.pdf  
  4. S1-2023-424290-title.pdf