ANALISIS SENTIMEN DAN PEMODELAN TOPIK DENGAN PENDEKATAN METODE GLOBAL VECTORS FOR WORD REPRESENTATION (GLOVE) – LONG SHORT TERM MEMORY (LSTM) DAN BITERM TOPIC MODEL (BTM)
RIZKI WULANDARI, Dr. Abdurakhman, S.Si., M.Si.
2024 | Skripsi | STATISTIKA
Teknologi pemrosesan bahasa alami atau natural language processing telah
menjadi kunci dalam mengekstrak makna dari teks yang luas dan heterogen seperti
ulasan pengguna. Dalam konteks aplikasi belanja online seperti Lazada,
pemahaman sentimen pengguna dan pemodelan topik ulasan menjadi krusial untuk
memahami kepuasan pengguna, kekurangan, dan preferensi produk. Penelitian ini
bertujuan untuk mengklasifikasikan ulasan pengguna menjadi dua kelas sentimen,
yakni sentimen positif dan sentimen negatif. Pendekatan metode yang digunakan
adalah penggabungan metode word embedding Global Vectors for Word
Representation (GloVe) dan Long Short-Term Memory (LSTM) yang
menghasilkan performa akurasi sebesar 84.69%. Model yang diperoleh diterapkan
pada data uji yang mengklasifikasikan ulasan menjadi 70.1?rsentimen positif
dan 29.9?rsentimen negatif. Selanjutnya akan dilakukan identifikasi topik
apa saja yang dibahas pada tiap-tiap kelas sentimen dengan pendekatan metode Biterm
Topic Model (BTM) yang diajukan untuk menangani pemodelan pada teks
pendek seperti ulasan. Performa yang didapatkan dilihat dari coherence score
yang menunjukkan nilai -16.26 untuk ulasan bersentimen positif dan nilai
-16.17 untuk ulasan bersentimen negatif. Sebanyak 12 topik dibentuk pada ulasan bersentimen positif dengan 4 topik yang paling sering dibacarakan, sedangkan 8
topik dibentuk pada ulasan bersentimen negatif dengan 3 topik yang paling
banyak dikeluhkan. Hasil keseluruhan penelitian ini sudah cukup untuk dapat
menggambarkan bagaimana ulasan pengguna Lazada.
Natural language processing (NLP) technology has become essential in extracting meaning from vast and heterogeneous texts such as user reviews. In the context of online shopping applications like Lazada, understanding user sentiment and topic modeling are crucial for comprehending user satisfaction, drawbacks, and product preferences. This research aims to classify user reviews into two sentiment classes: positive and negative sentiment. The methodological approach involves combining the word embedding methods Global Vectors for Word Representation (GloVe) and Long Short-Term Memory (LSTM), resulting in an accuracy performance of 84.69%. The obtained model is applied to test data, classifying reviews as 70.1% positive sentiment and 29.9% negative sentiment. Furthermore, topic identification is conducted for each sentiment class using the Biterm Topic Model (BTM) approach, proposed to handle modeling in short texts like reviews. The performance is assessed using coherence scores, yielding a value of -16.26 for positive sentiment reviews and -16.17 for negative sentiment reviews. Twelve topics are formed for positive sentiment reviews, with four most frequently discussed topics, while eight topics are formed for negative sentiment reviews, with three most commonly complained about topics. The overall results of this research are adequate to illustrate user reviews on Lazada.
Kata Kunci : pemrosesan bahasa alami, analisis sentimen, pemodelan topik, Long Short-Term Memory (LSTM), Biterm Topic Model (BTM), ulasan pengguna, Lazada.