Laporkan Masalah

KLASIFIKASI EMOSI PADA KOMENTAR NOVEL BERBAHASA INDONESIA DI PLATFORM WATTPAD MENGGUNAKAN BERT

Dewa Anggun Wicaksono, Prof. Dr.-Ing. Mhd. Reza M. I. Pulungan, S.Si., M.Sc.

2024 | Skripsi | ILMU KOMPUTER

Kepuasan pembaca merupakan salah satu tujuan penulis novel. Salah satu cara untuk mengetahuinya adalah melalui ulasan. Namun, ketika tidak ada ulasan yang dapat dijadikan acuan, perlu dicari alternatif untuk mengatasinya. Komentar pembaca dapat dijadikan sebagai solusi. Namun, perlu perhatikan bahwa komentar pembaca cenderung memuat ekspresi spontan dan tidak lengkap. Oleh karena itu pendekatan analisisnya akan berbeda dengan ketika menganalisis ulasan.

Dalam penelitian ini, klasifikasi emosi dilakukan terhadap komentar novel berbahasa Indonesia di platform Wattpad dengan menggunakan model M-BERT dan IndoBERT. Emosi dalam komentar akan diklasifikasikan berdasarkan teori psikoevolusi emosi. Dataset yang digunakan merupakan komentar-komentar yang dikumpulkan dan dilabeli secara mandiri dari 10 novel yang pernah menjuarai atau masuk ke daftar pendek kontes Wattys Indonesia.

Hasil penelitian menunjukkan bahwa model IndoBERT memiliki performa yang lebih baik dari model M-BERT dengan nilai F1-score 58% dibanding 52%. Ketidakseimbangan dataset dan variasi data yang tinggi menjadi salah satu penyebab performa model yang tidak optimal terutama pada kelas-kelas minoritas dalam dataset.

Reader satisfaction is one of the goals of novel writers. One way to find that out is through reviews. However, when there are no reviews that can be used, it is necessary to find an alternative to overcome it. Reader comments can be used as a solution. However, it should be noted that reader comments tend to contain spontaneous and incomplete expressions. Therefore, the analysis approach will be different from when analyzing reviews.

In this study, emotion classification is performed on comments of Indonesian novel on Wattpad using the M-BERT and IndoBERT models. Emotions in the comments will be classified based on the psychoevolutionary theory of emotions. The dataset used are comments that are self collected and labeled from 10 novels that have won or belong to the shortlist of the Wattys Indonesia contest.

The result of the study showed that IndoBERT model performed better than the M-BERT model with an F1-score value of 58% compared to 52%. Dataset imbalance and high data variation are one of the cause of non-optimal model performance, especially for minority classes in the dataset.

Kata Kunci : BERT, klasifikasi emosi, novel, Wattpad

  1. S1-2024-442469-abstract.pdf  
  2. S1-2024-442469-bibliography.pdf  
  3. S1-2024-442469-tableofcontent.pdf  
  4. S1-2024-442469-title.pdf