DETECTING DEPRESSIVE TWEETS USING GATED RECURRENT UNIT NETWORK (GRU)

GHINAYA FAIRUZ ZAHRA

GHINAYA FAIRUZ ZAHRA, Drs. Edi Winarko, M.Sc., Ph.D.

2020 | Skripsi | S1 ILMU KOMPUTER

Abstrak
File Pdf

Twitter adalah layanan microblogging dan jejaring sosial tempat pengguna dapat memposting dan berinteraksi dengan pesan yang dikenal sebagai "tweet", memberikan kebebasan kepada pengguna untuk mengekspresikan diri. Banyak kasus penyakit mental tidak terdiagnosis atau tidak dikenali karena stigmatisasi oleh media yang membuat keinginan untuk membantu mereka menjadi terbatas. Oleh karena itu, penelitian ini bertujuan untuk membuat model pendeteksian pada Tweet menggunakan Deep Learning Model RNN dan GRU. Penelitian ini memanfaatkan Word Embeddings yaitu Word2Vec dan GloVe untuk menghasilkan representasi kata yang lebih baik dibandingkan penelitian sebelumnya yang tidak menggunakan Word Embedding. Pengujian dilakukan pada dataset yang berisi total 10.314 tweet dengan label depresif (1) dan positif (0). Penelitian ini menggunakan train & validation split 60/20 dan kurva AUC ROC sebagai variabel evaluasi tambahan. Hasil setelah dilakukan pengujian pada 20% data menggunakan RNN & GRU adalah seri. RNN memperoleh akurasi 99,6% dan GRU pada 99,5% dengan perolehan yang sama, presisi, dan skor f-1 pada 99,5%. Namun, GRU berhasil memperoleh skor kinerja keseluruhan yang lebih besar dalam pelatihan & uji validasi dan skor kurva AUC ROC di mana ia memperoleh hasil yang lebih stabil, lebih tinggi, dan lebih sedikit berfluktuasi.

Twitter is a microblogging and social networking service on which users can post and interact with messages known as "tweets", giving users freedom to express themselves. Many cases of mental illness go undiagnosed or unrecognized due to stigmatization by the media making the desire to help them limited. Therefore, this research aims to create a detection model on Tweets using Deep Learning Model RNN and GRU. This research makes use of Word Embeddings, namely Word2Vec and GloVe in order to create improved representations of words than previous researches that did not use Word Embedding. The test is done on a dataset containing a total of 10,314 tweets with depressive (1) and positive (0) as the label. This research uses train & validation split of 60/20 and the AUC ROC curve as an additional evaluation variable. The results after testing on 20% data using RNN & GRU was a tie. RNN gained an accuracy of 99.6% and GRU at 99.5% with the same recall, precision and f-1 score at 99.5%. However, GRU managed to obtain a greater overall performance score in the training & validation test and the AUC ROC curve score where it obtained steadier, higher and less fluctuating results.

Kata Kunci : Twitter, prediksi, Deep Learning, Word Embeddings, Recurrent Neural Network, Gated Recurrent Unit Network, AUC ROC

S1-2020-392767-abstract.pdf
S1-2020-392767-bibliography.pdf
S1-2020-392767-tableofcontents.pdf
S1-2020-392767-title.pdf

LAYANAN

E-Resources

Quick Access