IMPLEMENTASI DAN PERBANDINGAN METODE PRAPEMPROSESAN PADA ANALISIS SENTIMEN GUBERNUR DKI JAKARTA MENGGUNAKAN METODE SUPPORT VECTOR MACHINE DAN NAIVE BAYES

Penulis

Bagus Rianto

Pembimbing: Nur Rokhman, S.Si., M.Kom


ABSTRACT: Sentiment analysis is an interdisciplinary science that surrounds Natural Lan- guage Processing (NLP), artificial intelligence, and text mining. The use of senti- ment analysis commonly used in observing sentiment on products, famous figures, or events. Sentiment analysis approach is often done by machine learning using the mod- ern classification such as Support Vector Machine (SVM). In addition there are many other approaches, such as Naive Bayes. Those approaches are very common but just few have done using Indonesian language. This research uses data from the online news portal detik.com and kompas.com to be training data to train against sentiment analysis model. Proprocess was cus- tomed by the variation of preprocessing function to find the best preprocessing step. The result is SVM with preprocessing function consist of cleansing, casefolding and elimination of KBBI. Measured performance for precision is 65.61%, recall is 65.36% and F-measure is 65.06%.

INTISARI: Analisis sentimen merupakan ilmu lintas disiplin yang melingkupi Natural Language Processing(NLP), kecerdasan buatan, dan text mining. Penggunaan anali- sis sentimen biasa digunakan dalam melihat sentimen publik terhadap produk, tokoh terkenal, ataupun kejadian. Pendekatan analisis sentimen sering dilakukan dengan machine learning de- ngan menggunakan klasifikasi yang muktahir seperti Support Vector Machine (SVM). Selain menggunakan SVM pendekatan lainnya juga banyak dilakukan, salah satunya Naive Bayes. Pendekatan - pendekatan tersebut sangat sering ditemukan namun sa- ngat sedikit yang dilakukan dengan menggunakan bahasa Indonesia. Penelitian ini menggunakan sumber data dari detik.com dan kompas.com un- tuk menjadi pembelajaran model klasifikasi sentimen analisis. Dengan variasi-variasi proses prapemprosesan didapatkan model yang terbaik yaitu dengan menggunakan SVM dengan proses prapemprosesan cleansing, casefolding dan eliminasi KBBI. Dengan performa precision sebesar 65.61%, recall sebesar 65.36% dan F-measure 65.06%.

Kata kunci analisis sentimen, teks mining, opinion mining
Program Studi S1 ILMU KOMPUTER UGM
No Inventaris
Deskripsi
Bahasa Indonesia
Jenis Skripsi
Penerbit [Yogyakarta] : Universitas Gadjah Mada, 2016
Lokasi Perpustakaan Pusat UGM
File Tulisan Lengkap dapat Dibaca di Ruang Tesis/Disertasi
  • Anda dapat mengecek ketersediaan versi cetak dari penelitian ini melalui petugas kami dengan mencatat nomor inventaris di atas (apabila ada)
  • Ketentuan Layanan:
    1. Pemustaka diperkenankan mengkopi cover, abstrak, daftar isi, bab pendahuluan, bab penutup/ kesimpulan, daftar pusatak
    2. Tidak diperbolehkan mengkopi Bab Tinjauan Pustaka, Bab Pembahasan dan Lampiran (data perusahaan/ lembaga tempat penelitian)
    3. Mengisi surat pernyataan, menyertakakan FC kartu identitas yang berlaku

<< kembali