Analisis Sentimen pada Review Pengguna Sistem Operasi Windows Phone dengan Menggunakan Metode Support Vector Machine (SVM)
NINING WORO WIJAYANTI, Adhistya Erna P.; Indriana Hidayah
2014 | Skripsi | S1 TEKNOLOGI INFORMASIOpini adalah salah satu bagian penting dalam kehidupan manusia. Opini dapat mempengaruhi bagaimana cara seseorang menentukan keputusan. Tidak bisa dipungkiri bahwa opini yang muncul dari publik dapat mempengaruhi citra dari sebuah organisasi atau perusahaan. Oleh karena itu, penting bagi sebuah perusahaan atau organisasi untuk mengetahui tanggapan publik mengenai produk atau layanan yang mereka tawarkan. Akan tetapi, memantau dan mengorganisasi opini dari masyarakat juga bukanlah hal yang mudah. Opini yang dimuat di media sosial jumlahnya terlalu banyak untuk diproses secara manual. Oleh sebab itulah, diperlukan sebuah metode atau teknik khusus yang mampu mengkategorikan review-review tersebut secara otomatis, apakah termasuk positif atau negatif, berdasarkan sebuah properti. Penelitian ini menggunakan metode Support Vector Machine (SVM) dengan tipe kernel polinomial untuk mengklasifikasikan data review. Selain menggunakan SVM, penelitian ini juga menggunakan empat metode pada tahap tokenisasi, yaitu unigram, bigram, trigram, dan n-gram. Pada data preprocessing, dilakukan 8 eksperimen di mana masing-masing dari keempat metode tersebut akan menggunakan 2 algoritme stemming, yaitu algoritme Snowball Stemmer dan Iterated-Lovin Stemmer. Hasil dari preprocessing digunakan sebagai input dalam proses klasifikasi. Proses klasifikasi dari tiap-tiap input dilakukan sebanyak 3 kali dengan menggunakan nilai C yang berbeda-beda, yaitu C = 0,25, C = 0,5, dan C = 1,0. Tingkat akurasi tertinggi diperoleh dengan menggunakan metode n-gram, algoritme Snowball Stemmer, dan nilai parameter C = 1,0. Eksperimen dengan menggunakan metode undersampling untuk mengatasi permasalahan imbalanced data menunjukkan hasil yang lebih baik dari metode oversampling.
Opinion is one of the most important things in human life. Opinion can affect how the way people make some decision in their life. It is undeniable that opinion which comes from public can affect the image of some organization or company. Therefore it is important for company or organization to know about how public responds toward their products or services. In the other side, monitoring and organizing public opinion is not an easy work to do. The amount of opinion that expressed in social media is too much to be processed manually. Therefore, there is a need of method or special technique that can categorize the reviews automatically, whether it is positive or negative, based on a property. This study used Support Vector Machine (SVM) with polynomial kernel to classify the review. Beside using SVM, this study also used four method in tokenizing stage, i.e. unigram, bigram, trigram, and n-gram. In data preprocessing, performed eight experiments in which each of the four methods were use two stemming algorithms, i.e. Snowball Stemmer and Iterated-Lovin Stemmer. The results of preprocessing then was used as input in the classification process. The classification process of each input will be done three times by using the different value of C, that is, C = 0.25, C = 0.5, and C = 1.0. The highest level of accuracy obtained by using n-gram, Snowball Stemmer algorithm, and the value of parameter C = 1.0. Experiment by using undersampling method to overcome the problems of imbalanced data showed better results than the experiment that using oversampling method.
Kata Kunci : Analisis sentimen, SVM, undersampling, oversampling