ANALISIS SENTIMEN MENGGUNAKAN METODE NAIVE BAYES CLASSIFIER DENGAN MODEL DOKUMEN BERNOULLI DAN SUPPORT VECTOR MACHINE

Penulis

Tiara Gumilang Ramadhani

Pembimbing: Prof. Dr. rer. nat. Dedi Rosadi, S.Si., M.Sc.Eng. Math


ABSTRACT: The rise of information system base on website has given a lot of simplicity to get the information in a large number and for free. An information with textual document is usually given as an unstructured form. To dealing these unstructured document form, text mining is being required. One of analysis in text mining which is often used is sentimen classification or text classification. From the result of the classification about one topic we can specify the classes for the opinions by seeing the proportion on each class from the entire documents provided. Two methods that will be discussed are naive bayes classifier and support vector machine to determine a binary classes for each document. Naive bayes classifier is a classification method with Bayesian rule by using the prior probabilities and conditional probabilities in each class from data training. The probabilities is being used to determine the maximum a posteriori each classes for the data testing and specify the document classes. The accuracy for the classified data is being calculated by using support vector machine method with the Kernel function and data proportion determined from the data training. By comparing these two methods, the best accurate rate for the sentimen classification is by using naive bayes classifier (NBC) which is reached a percentage 62,6295%. By classifying 5.412 data training and 2701 data testing using naive bayes classifier, the result shows from the entire documents the proportion for the positive class is 44,46501% and for the negative class is 55,53499%.

INTISARI: Berkembang pesatnya sistem informasi berbasis website memberikan berbagai kemudahan untuk mendapatkan informasi dalam jumlah besar dan secara cuma - cuma. Informasi yang tersaji dalam bentuk tekstual seringkali berbentuk dokumen yang tidak terstuktur. Untuk menangani dokumen dengan pola tidak terstruktur ini analisis text mining sangat diperlukan. Salah satu analisis text mining yang sering digunakan adalah klasifikasi sentimen atau klasifikasi teks. Dari hasil klasifikasi sentimen mengenai suatu topik ini dapat disimpulkan opini tertentu dengan melihat proporsi kelas dari keseluruhan dokumen yang disajikan. Metode yang akan dibahas kali ini adalah metode probabilistic Naive Bayes Classifier dan metode Support Vector Machine untuk menentukan kelas suatu dokumen secara biner yaitu kelas positif dan kelas negatif. Naive Bayes Classifier merupakan metode klasifikasi menggunakan aturan Bayesian dengan memanfaatkan probabilitas prior serta probabilitas bersyarat dari frekuensi kata yang muncul pada masing - masing kelas dokumen training. Nilai tersebut yang akan digunakan untuk menentukan kelas dokumen testing dengan melihat nilai maximum a posteriori masing - masing kelas. Data yang telah diklasifikasi kemudian dihitung tingkat akurasi kebenarannya menggunakan metode support vector machine dengan menentukan fungsi Kernel serta proporsi untuk data training dan data testing yang sesuai. Dari perbandingan nilai akurasi klasifikasi dengan menggunakan kedua metode diatas, didapatkan nilai akurasi paling tinggi adalah dengan menggunakan metode naive bayes classifier (NBC) dengan akurasi sebesar 62,6295%. Dari 5.412 dokumen training dan 2701 dokumen testing yang telah dilkasifikasi, didapatkan proporsi opini untuk kelas positif sebesar 44,46501% dan opini untuk kelas negatif sebesar 55,53499%.

Kata kunci Klasifikasi sentimen, opini, text mining, aturan Bayesian, Naive bayes classifier, support vector machine.
Program Studi S1 STATISTIKA UGM
No Inventaris
Deskripsi
Bahasa Indonesia
Jenis Skripsi
Penerbit [Yogyakarta] : Universitas Gadjah Mada, 2015
Lokasi Perpustakaan Pusat UGM
File Tulisan Lengkap dapat Dibaca di Ruang Tesis/Disertasi
  • Anda dapat mengecek ketersediaan versi cetak dari penelitian ini melalui petugas kami dengan mencatat nomor inventaris di atas (apabila ada)
  • Ketentuan Layanan:
    1. Pemustaka diperkenankan mengkopi cover, abstrak, daftar isi, bab pendahuluan, bab penutup/ kesimpulan, daftar pusatak
    2. Tidak diperbolehkan mengkopi Bab Tinjauan Pustaka, Bab Pembahasan dan Lampiran (data perusahaan/ lembaga tempat penelitian)
    3. Mengisi surat pernyataan, menyertakakan FC kartu identitas yang berlaku

<< kembali