Analisis Pengaruh Emotikon untuk Deteksi Sarkasme pada Komentar Bahasa Indonesia Menggunakan Indobert–BiLSTM
Muhamad Nahrowi, Dr. Nur Rokhman, S.Si., M.Kom
2026 | Tesis | S2 Ilmu Komputer
Pesatnya penggunaan media sosial di Indonesia telah menghasilkan beragam bentuk ekspresi linguistik, termasuk sarkasme dan emotikon, yang menambah kompleksitas dalam analisis sentimen. Sarkasme kerap disampaikan melalui kalimat bernada positif namun bermakna negatif, sementara emotikon berfungsi sebagai sinyal emosional yang sering diabaikan dalam proses praproses data. Penghilangan emotikon berpotensi menghilangkan informasi semantik penting yang dapat memengaruhi kualitas deteksi sarkasme.
Penelitian ini menganalisis pengaruh emotikon terhadap performa model deteksi sarkasme menggunakan arsitektur IndoBERT–BiLSTM. IndoBERT digunakan sebagai ekstraktor fitur kontekstual, sedangkan BiLSTM berperan sebagai klasifikator sekuensial. Dataset yang digunakan adalah Reddit Indonesia Sarcastic dan Twitter Indonesia Sarcastic, yang telah dilabeli oleh pakar bahasa. Evaluasi dilakukan dengan tiga skenario: full dataset (teks dengan dan tanpa emotikon), no-emoji (emotikon dihapus), dan emoji-only (hanya komentar yang mengandung emotikon).
Hasil penelitian menunjukkan bahwa emotikon memberikan kontribusi penting dalam meningkatkan performa deteksi sarkasme. Pada skenario full dataset, model memperoleh akurasi 95,39?n macro F1-score 0,939. Ketika emotikon dihapus, performa menurun signifikan dengan akurasi 76,79?n macro F1-score 0,721, menandakan hilangnya informasi ekspresif yang relevan. Sebaliknya, skenario emoji-only menghasilkan performa tertinggi dengan akurasi 96,46?n macro F1-score 0,898, yang menunjukkan bahwa pola emotikon memberikan sinyal semantik yang kuat dalam mendeteksi sarkasme. Temuan ini menegaskan bahwa emotikon merupakan komponen penting dalam representasi teks pada media sosial dan memiliki pengaruh signifikan terhadap peningkatan akurasi deteksi sarkasme dalam bahasa Indonesia.
The rapid growth of social media usage in Indonesia has introduced diverse forms of linguistic expression, including sarcasm and emoticons, which pose challenges for sentiment analysis. Sarcasm is often conveyed through positive statements with negative intent, while emoticons provide explicit emotional cues that are frequently removed during preprocessing. This omission may lead to the loss of important semantic information essential for accurate sarcasm detection.
This study investigates the influence of emoticons on sarcasm detection performance using the IndoBERT–BiLSTM architecture. IndoBERT serves as a contextual feature extractor, while BiLSTM functions as a sequential classifier. The experiments employ the Reddit Indonesia Sarcastic and Twitter Indonesia Sarcastic datasets, annotated by linguistic experts. Three scenarios are evaluated: full dataset (with and without emoticons), no-emoji (emoticons removed), and emoji-only (samples containing emoticons only).
The results demonstrate that emoticons significantly enhance sarcasm detection performance. On the full dataset, the model achieves 95.39?curacy and a macro F1-score of 0.939. When emoticons are removed, performance declines substantially to 76.79?curacy and 0.721 macro F1-score, indicating the loss of important expressive cues. Conversely, the emoji-only scenario yields the highest performance, achieving 96.46?curacy and a macro F1-score of 0.898, highlighting the strong semantic value of emoticon patterns in identifying sarcasm. These findings confirm that emoticons play a crucial role in textual representation on social media and significantly contribute to improving sarcasm detection accuracy in Indonesian-language comments.
Kata Kunci : sentiment analysis, sarcasm, emoticons, IndoBERT, BiLSTM, social media, artificial intelligence