Laporkan Masalah

Analisis Sentimen Menggunakan Metode Stacking Ensemble dengan Recurrent Neural Network, Long Short-Term Memory, dan Gated Recurrent Unit

DANNY THEODORE DUNRUI, Dr. Abdurakhman, M.Si.

2023 | Skripsi | S1 STATISTIKA

Salah satu perkembangan ilmu pengolahan data adalah kemampuan dalam menganalisis sentimen yang terdapat dalam suatu teks. Pemodelan data teks dapat dilakukan menggunakan model yang dapat mengakomodasi data dengan dependensi berurutan seperti Recurrent Neural Network (RNN), Long Short-Term Memory (LSTM), dan Gated Recurrent Unit (GRU). Penelitian ini dilakukan untuk melihat performa model RNN, LSTM, dan GRU dalam mengklasifikasikan sentimen ulasan aplikasi digital banking, BRImo, milik PT Bank Rakyat Indonesia (Persero) Tbk pada Google Play Store dan Apple App Store. Adapun, penelitian juga akan melihat penggunaan metode stacking ensemble untuk meningkatkan performa klasifikasi. Performa klasifikasi diukur menggunakan akurasi dan skor F1, permasalahan kelas tidak seimbang ditangani dengan melakukan random over-sampling, dan meta learner yang digunakan dalam proses stacking adalah Multilayer Perceptron (MLP). Hasil akhir menunjukkan performa klasifikasi terbaik antara RNN, LSTM, dan GRU diberikan oleh model LSTM pada data dengan random over-sampling di mana diperoleh akurasi 89,8542%, skor F1 untuk kelas positif sebesar 92,0548%, dan skor F1 untuk kelas negatif sebesar 85,9677%. Selanjutnya, performa stacking terbaik diberikan oleh model stacking dengan mengambil base learner berupa masing-masing model terbaik dari RNN, LSTM, dan GRU dengan penanganan random over-sampling serta mengambil meta learner berupa MLP dengan 1 hidden layer dan 3 neuron pada hidden layer di mana diperoleh akurasi 90,4956%, skor F1 untuk kelas positif sebesar 92,4572% skor F1 untuk kelas negatif sebesar 87,1552%. Oleh karena itu, pada studi kasus yang dilakukan pada penelitian ini melakukan stacking mampu meningkatkan performa klasifikasi.

One of the developments in the field of data processing is the ability to analyze sentiment in a text. The modelling of text data can be done using models that can accommodate data with sequential dependencies like Recurrent Neural Network (RNN), Long Short-Term Memory (LSTM), and Gated Recurrent Unit (GRU). This research was done to see the performance of RNN, LSTM, and GRU model in classifying the sentiment of a digital banking application review, BRImo, belonging to Bank Rakyat Indonesia Inc. from Google Play Store and Apple App Store. Furthermore, this research will also look into the use of stacking ensemble method to improve the classification performance. Classification results will be measured using accuracy and F1 score, imbalanced class problems will be dealt with using random over-sampling, and meta learner used in stacking process is Multilayer Perceptron (MLP). Final result showed that the best performance among RNN, LSTM, and GRU models was given by LSTM model for data with random over-sampling with the accuracy of 89,8542%, and F1 score for positive and negative class were 92,0548% and 85,9677% respectively. Subsequently, the best stacking performance was given by stacking model with base learner using each of the best model from RNN, LSTM, and GRU for data with random over-sampling handling and meta learner of MLP with 1 hidden layer and 3 neurons in the hidden layer giving the accuracy of 90,4956%, and F1 score for positive and negative class were 92,4572% and 87,1552% respectively. Therefore, based on the case study done in this research, using stacking method able to increase the classification performance.

Kata Kunci : analisis sentimen, Recurrent Neural Network (RNN), Long Short-Term Memory (LSTM), Gated Recurrent Unit (GRU), metode stacking ensemble

  1. S1-2023-442591-abstract.pdf  
  2. S1-2023-442591-bibliography.pdf  
  3. S1-2023-442591-tableofcontent.pdf  
  4. S1-2023-442591-title.pdf