Analisis Sentimen Berbasis Aspek Pada Ulasan Toko Online Menggunakan Convolutional Neural Network
MHD. THEO ARI BANGSA, Dr. Yohanes Suyanto, M.I.Kom; Dr. Sigit Priyanta, S.Si, M.Kom
2019 | Tesis | MAGISTER ILMU KOMPUTERSebagian besar toko online menyediakan fasilitas ulasan yang berisi tanggapan-tanggapan terhadap suatu produk. Banyaknya jumlah ulasan menyulitkan para calon pembeli untuk mengambil kesimpulan, sehingga diperlukan analisis sentimen untuk mengekstrak informasi dari ulasan-ulasan tersebut. Penelitian ini bertujuan untuk melakukan klasifikasi sentimen berbasis aspek terhadap ulasan toko online berbahasa Indonesia menggunakan metode convolutional neural network (CNN). Teks ulasan dijadikan vektor dengan menggunakan model Word2Vect. Teks ulasan yang sudah menjadi nilai vektor digunakan sebagai masukan CNN. Klasifikasi tahap pertama untuk mendeteksi aspek dan tahap kedua dilakukan klasifikasi untuk menentukan sentimen. Dataset yang digunakan adalah 7500 data ulasan berbahasa Indonesia dari situs bukalapak.com. Hasil pengujian pada sistem yang dibangun memperlihatkan bahwa metode CNN dengan ekstraksi fitur Word2Vec memiliki nilai score pada aspek akurasi 89,22%, kualitas 89,73%, pelayanan 81,09%, pengemasan 87,08%, harga 89,86%, dan pengiriman 85,56% sementara metode Naïve Bayes menggunakan fitur TF memperoleh akurasi pada aspek akurasi 84,74%, kualitas 74,33%, pelayanan 79,25%, pengemasan 82,38%, harga 73,33%, dan pengiriman 79,56%. Klasfikasi tanpa menggunakan preprocessing stemming pada dataset meningkatkan akurasi rata-rata sebesar 2.77%. Semakin besar jumlah data training, nilai akurasi yang didapatkan semakin meningkat.
Most online stores provide review facilities that contain responses to a product. The number of reviews makes it difficult for potential buyers to make conclusions, so that sentiment analysis is needed to extract information from these reviews. This research aims to classify sentiment-based sentiments towards online store reviews using the Convolutional Neural Network (CNN) method with the extraction of features using Word2Vec. The review text is vector by using the Word2Vect model of the review text that is already a vector value used as CNN input. Classification of the first stage to detect aspects and the second stage is performed classification to determine sentiment. The dataset used is 7500 Indonesian review data from bukalapak.com. The test results on the built system showed that CNN's method of Word2Vec feature extraction has a score rating on the aspect of accuracy 89.22%, quality 89.73% , service 81.09%, packaging 87.08%, price 89.86%, and delivery 85.56% while Naïve Bayes method using TF feature gained accuracy on the aspect of accuracy84.74%, quality 74.33%, service 79.25%, packaging 82.38%, price 73.33%, and delivery 79.56%. Classification without using stemming preprocessing on the dataset increases the average accuracy by 2.77%. The greater the amount of training data, the value of accuracy gained increasing.
Kata Kunci : analisis sentimen, klasifikasi kategori aspek, convolutional neural network, toko online