Laporkan Masalah

Analisis Sentimen Ulasan Menggunakan Variasi Model BERT dengan Penanganan Ketidakseimbangan Data melalui Teknik Augmentasi

Arridho Ramadhan Firdaus, Arif Nurwidyantoro S.Kom., M.Cs., Ph.D.

2024 | Tesis | S2 Ilmu Komputer

Penelitian ini mengevaluasi performa tiga model bahasa berbasis BERT, yaitu BERT, DistilBERT, dan ALBERT, untuk analisis sentimen pada ulasan pengguna Coursera, dengan fokus menangani ketidakseimbangan data menggunakan teknik augmentasi seperti Back Translation, Contextual Word Embedding, dan Synonym Replacement. Dengan teknik ini, variasi data meningkat terutama untuk kelas minoritas, yang membantu meningkatkan akurasi dalam klasifikasi sentimen. Hasil menunjukkan bahwa model DistilBERT memberikan performa terbaik pada teknik synonym replacement dengan hasil f1-score 0.9869, meskipun DistilBERT menghasilkan hasil tertinggi pada teknik synonym replacement, model seperti BERT memberikan hasil yang selalu konsisten  begitupun dengan AlBERT hasil yang diberikan cukup konsisten. Berdasarkan ketiga model BERT tersebut model yang cocok untuk analisis sentiment yaitu BERT karena hasil yang didapatkan selalu konsisten.

This study evaluates the performance of three BERT-based language models: BERT, DistilBERT, and ALBERT, for sentiment analysis on Coursera user reviews, with a focus on addressing data imbalance using augmentation techniques such as Back Translation, Contextual Word Embedding, and Synonym Replacement. These techniques increase data variation, particularly for minority classes, which helps improve accuracy in sentiment classification. Results indicate that DistilBERT achieved the best performance using the synonym replacement technique, with an F1-score of 0.9869. Although DistilBERT provided the highest score for synonym replacement, models like BERT consistently delivered reliable results. Similarly, ALBERT exhibited consistent performance. Among the three BERT-based models, BERT is deemed the most suitable for sentiment analysis due to its consistently reliable outcomes.

Kata Kunci : Analisis Sentimen, BERT, DistilBERT, ALBERT, Ketidakseimbangan Data, Teknik Augmentasi/Sentiment Analysis, BERT, DistilBERT, ALBERT, Data Imbalance, Augmentation Techniques

  1. S2-2024-526962-abstract.pdf  
  2. S2-2024-526962-bibliography.pdf  
  3. S2-2024-526962-tableofcontent.pdf  
  4. S2-2024-526962-title.pdf  
  5. S2-2025-526962-abstract.pdf  
  6. S2-2025-526962-bibliography.pdf  
  7. S2-2025-526962-tableofcontent.pdf  
  8. S2-2025-526962-title.pdf