Laporkan Masalah

PERBANDINGAN METODE K-NEAREST NEIGHBOR DAN SUPPORT VECTOR MACHINE DALAM ANALISIS SENTIMEN TWITTER TERHADAP STASIUN TELEVISI BERITA INDONESIA

SITI RINZHANI GHUSTY PERTIWI, Anny Kartika Sari, S.Si, M.Sc., Ph. D

2018 | Skripsi | S1 ILMU KOMPUTER

Konten berita merupakan salah satu topik yang paling digemari warganet, dengan persentase sebesar 96,4% atau berjumlah 127,9 juta pengakses. Stasiun televisi berita adalah salah satu penyaji konten berita terbesar di Twitter. Masyarakat diharapkan dapat memilih penyaji konten berita yang kredibel dan menghindari yang memiliki image buruk. Salah satu tolak ukur untuk mengetahui image suatu televisi berita adalah melihat opini yang diberikan masyarakat terhadap stasiun televisi berita tersebut. Namun karena Twitter tidak dapat secara otomatis memberikan kesimpulan sentimen masyarakat terhadap stasiun televisi berita yang ada, maka perlu dilakukan analisis sentimen. Penelitian ini akan membangun model analisis sentimen Twitter pada stasiun televisi berita Indonesia populer, yaitu Metro TV, Kompas TV, dan TV One, serta membandingkan nilai akurasi akhir dan waktu proses dari metode klasifikasi yang dipakai untuk mencari tahu metode mana yang memiliki performa yang paling baik. Model analisis sentimen dibangun menggunakan metode pembobotan TF-IDF dengan dua metode klasifikasi, yaitu Support Vector Machine dan K-Nearest Neighbor. Evaluasi model dilakukan dengan metode 5-fold cross validation dan 10-fold cross validation. Metode Support Vector Machine memiliki tingkat akurasi yang lebih tinggi dibandingkan dengan metode K-Nearest Neighbor, yaitu sebesar 76,9% pada pengujian tanpa k-fold cross validation dan 76,8% pada pengujian dengan 5-fold cross validation dan 10-fold cross validation. Metode K-Nearest Neighbor memiliki waktu proses yang lebih cepat dibandingkan dengan metode Support Vector Machine, yaitu dalam kisaran 0,04687 detik pada pengujian tanpa k-fold cross validation dan dalam kisaran 0,1562 detik untuk 5-fold cross validation dan rentang 0,28 hingga 0,3 detik untuk 10-fold cross validation.

News content is one of the most popular topics for netizens with 96,4% or 127,9 million accessors. News TV station is one of the biggest providers of news content on Twitter. People are expected to pick credible news content providers and avoid the bad ones. One of the tools to find out the image of news TV stations is to see opinions from people toward them. But since Twitter can't automatically conclude the sentiments for these news TV stations, sentiment analysis is needed to determine the sentiments from people toward these news TV stations. This research build a Twitter sentiment analysis model on Indonesia's popular news TV stations, Metro TV, Kompas TV, and TV One. The final accuracy score and running time will be compared to find which classification methods do their job the best. This research use TF-IDF method for term-weighting and use two kinds of classification methods, Support Vector Machine dan K-Nearest Neighbor. Model evaluation is conducted using 5-fold cross validation dan 10-fold cross validation. Support Vector Machine has better performance compared to K-Nearest Neighbor. Testing without k-fold cross validation generates highest accuracy score 76,9%, while testing with k-fold cross validation generates highest accuracy score 76,8% with 5-fold and 10-fold cross validation method. K-Nearest Neighbor method has faster processing time compared to Support Vector Machine. Processing time without k-fold cross validation is in 0,04687 seconds range while testing with k-fold cross validation took around 0,1562 seconds for 5-fold cross validation method and in range of 0,28 to 0,3 seconds for 10-fold cross validation.

Kata Kunci : Analisis Sentimen, Twitter, TF-IDF, Support Vector Machine (SVM), K-Nearest Neighbor (K-NN), K-fold Cross Validation


    Tidak tersedia file untuk ditampilkan ke publik.