TWEET SENTIMENT ANALYSIS USING BILSTM AND RGAT
Muhammad Naufal Dzakki Rauf, Aina Musdholifah, S.Kom., M.Kom., Ph.D
2023 | Skripsi | ILMU KOMPUTER
Penggunaan sosial media yang meluas, khususnya Twitter, telah menghasilkan banyaknya data tekstual yang dapat memberikan wawasan berharga mengenai opini publik, perilaku konsumen, dan sentiment politik. Namun, menganalisis data teks dalam volume yang sangat besar secara manual sangatlah tidak praktis dikarenakan jumlah data yang dihasilkan setiap detik.
Untuk mengatasi masalah ini, berbagai teknik machine learning, termasuk transformer dan convolutional neural networks (CNN), telah dikembangkan. Penelitian ini bertujuan untuk menggunakan kombinasi BiLSTM dan Relational Graph Attention Network (RGAT) untuk mengklasifikasikan sentimen dari sejumlah besar tweet menggunakan dataset SemEval sebagai benchmark.
Dataset yang digunakan mencakup tweet dengan istilah target dan sentimen dari berbagai topik. Sebelum pelatihan model, kumpulan tweet ini akan menjalani prapemrosesan, pemisahan, penandaan POS, dan penguraian dependensi. Model BiLSTM-RGAT digunakan untuk menguji kemampuannya mengklasifikasikan sentimen tweet pada tweet dari dataset SemEval 2017 Task 4C, dan performa model akan dievaluasi menggunakan metrik seperti akurasi dan skor F1, dan dibandingkan dengan metode analisis sentimen lainnya.
Hasil percobaan menunjukkan bahwa model BiLSTM-RGAT mencapai akurasi tinggi dibandingkan dengan model deep learning lainnya dan membutuhkan waktu pelatihan yang lebih sedikit. Performa ini berkaitan dengan penggunaan model yang efektif dari ketergantungan relasional antara kata-kata.
The widespread use of social media platforms, Twitter in particular, has resulted in the creation of copious amounts of textual data that can offer valuable insights into public opinion, consumer behaviour, and political sentiment. However, manually analysing such a colossal amount of text data is impractical due to the massive volume of data generated every second.
To address this issue, various machine learning techniques, including transformers and convolutional neural networks (CNNs), have been developed. This study aims to use a combination of BiLSTM and Relational Graph Attention Network (RGAT) to classify the sentiments of a large number of tweets using the SemEval dataset as a benchmark.
The dataset includes tweets with target terms and sentiments in various topics. Before model training, these tweets will undergo preprocessing, splitting, POS-tagging, and dependency parsing. A BiLSTM-RGAT model were used to test its ability to classify tweet sentiments on a subset of tweets from the SemEval 2017 Task 4C dataset, and performance will be evaluated using metrics such as accuracy and mean-average F1 score and be compared to other sentiment analysis methods.
The experimental results demonstrate that the BiLSTM-RGAT model achieves high accuracy compared to other deep learning models, while requiring less training time. This performance is attributed to the model's effective utilization of the relational dependency between words.
Kata Kunci : Sentiment analysis, BiLSTM, Relational Graph Attention Network, SemEval