Laporkan Masalah

DETEKSI SARKASME PADA KOMENTAR TWITTER BERBAHASA INDONESIA MENGGUNAKAN METODE LONG SHORT-TERM MEMORY

SUKO TYAS PERNANDA, Dr. Nur Rokhman, S.Si., M.Kom.; Moh. Edi Wibowo, S.Kom.,M.Kom., Ph.D.

2021 | Tesis | MAGISTER ILMU KOMPUTER

Twitter merupakan media sosial yang memberikan akses kepada penggunanya untuk menanggapi kejadian yang sedang diperbincangkan oleh publik. Seringkali pengguna Twitter menyampaikan pesan secara implisit dengan sarkasme, sehingga menyebabkan sebagian besar algoritma analisis sentimen tidak tepat dalam memberikan label. Penelitian ini bertujuan untuk mendeteksi sarkasme pada komentar Twitter berbahasa Indonesia dengan metode Long Short-Term Memory (LSTM). Data yang digunakan dikumpulkan dengan metode scraping, kemudian diberikan nilai vektor menggunakan metode Word2Vec, dan diklasifikasikan dengan metode LSTM. Pada tahap pengujian, metode LSTM dibandingkan dengan metode Naive Bayes dengan ekstraksi fitur TF-IDF untuk dicari kombinasi nilai akurasi, precision, recall, dan f1-score yang terbaik. Pengujian menunjukkan bahwa metode LSTM menghasilkan nilai yang lebih baik daripada Naive Bayes. Bidirectional LSTM sebagai salah satu variasi metode LSTM memiliki akurasi tertinggi 82.13%, precision 69.06%, recall 58.14%, dan f1-score 61.31%. Metode Naive Bayes dengan nilai alpha = 0.0001 memiliki akurasi tertinggi 80.16%, precision 67.03%, recall 46.92%, dan f1-score 55.20%.

Twitter is among the top social media today which provides its users access to express or response towards something that is being discussed in public. Oftentimes, Twitter's users post their tweets in an implicit way by using sarcasm, making it an issue for most sentiment analysis algorithm because they often misclassify a tweet due to the sarcasm content. This study aims to address the problem by detecting sarcasm in an Indonesian tweet by using Long Short-Term Memory (LSTM). The data used in this study is collected using scraping method, then will be assigned a vector for each word using Word2Vec method, and lastly it will be classified using LSTM method. In the evaluation step, LSTM is compared to Naive Bayes with feature extraction of TF-IDF to find the best combination value for their accuracy, precision, recall, and f1-score. Evaluation step shows that LSTM produces better results than Naive Bayes. Bidirectional LSTM, one of LSTM method variation, has highest accuracy of 82.13%, precision of 69.06%, recall of 58.14%, and f1-score of 61.31%. On the other hand, Naive Bayes with alpha = 0.0001 has highest accuracy of 80.16%, precision of 67.03%, recall of 46.92%, and f1-score of 55.20%.

Kata Kunci : sarkasme, twitter, lstm, naive bayes

  1. S2-2021-418668-abstract.pdf  
  2. S2-2021-418668-bibliography.pdf  
  3. S2-2021-418668-tableofcontent.pdf  
  4. S2-2021-418668-title.pdf