Laporkan Masalah

ANALISIS SENTIMEN MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER DENGAN MODEL DOKUMEN BERNOULLI DAN SUPPORT VECTOR MACHINE; SENTIMENT ANALYSIS USING NAÏVE BAYES CLASSIFIER WITH BERNOULLI DOCUMENT MODEL AND SUPPORT VECTOR MACHINE

Tiara Gumilang Ramadhani, Dedi Rosadi

2015 | Skripsi | PROGRAM STUDI STATISTIKA

Berkembang pesatnya sistem informasi berbasis website memberikan berbagai kemudahan untuk mendapatkan informasi dalam jumlah besar dan secara cuma – cuma. Informasi yang tersaji dalam bentuk tekstual seringkali berbentuk dokumen yang tidak terstuktur. Untuk menangani dokumen dengan pola tidak terstruktur ini analisis text mining sangat diperlukan. Salah satu analisis text mining yang sering digunakan adalah klasifikasi sentimen atau klasifikasi teks. Dari hasil klasifikasi sentimen mengenai suatu topik ini dapat disimpulkan opini tertentu dengan melihat proporsi kelas dari keseluruhan dokumen yang disajikan. Metode yang akan dibahas kali ini adalah metode probabilistic Naïve Bayes Classifier dan metode Support Vector Machine untuk menentukan kelas suatu dokumen secara biner yaitu kelas positif dan kelas negatif. Naïve Bayes Classifier merupakan metode klasifikasi menggunakan aturan Bayesian dengan memanfaatkan probabilitas prior serta probabilitas bersyarat dari frekuensi kata yang muncul pada masing – masing kelas dokumen training. Nilai tersebut yang akan digunakan untuk menentukan kelas dokumen testing dengan melihat nilai maximum a posteriori masing – masing kelas. Data yang telah diklasifikasi kemudian dihitung tingkat akurasi kebenarannya menggunakan metode support vector machine dengan menentukan fungsi Kernel serta proporsi untuk data training dan data testing yang sesuai. Dari perbandingan nilai akurasi klasifikasi dengan menggunakan kedua metode diatas, didapatkan nilai akurasi paling tinggi adalah dengan menggunakan metode naïve bayes classifier (NBC) dengan akurasi sebesar 62,6295%. Dari 5.412 dokumen training dan 2701 dokumen testing yang telah dilkasifikasi, didapatkan proporsi opini untuk kelas positif sebesar 44,46501% dan opini untuk kelas negatif sebesar 55,53499%.

Kata Kunci : Klasifikasi sentimen, opini, text mining, aturan Bayesian, Naïve bayes classifier, support vector machine.


    Tidak tersedia file untuk ditampilkan ke publik.