Laporkan Masalah

KONTEKSTUAL DAN NON-KONTEKSTUAL WORD EMBEDDING DALAM MENDETEKSI TWEET MULTICLASS BERNUANSA DEPRESIF DI TWITTER MENGGUNAKAN LONG SHORT-TERM MEMORY¸

ARIF FARHAN BUKHORI, Lukman Heryawan, S.T., M.T., Ph.D.; Drs. Edi Winarko, M.Sc.,Ph.D.

2022 | Skripsi | S1 ILMU KOMPUTER

Salah satu bentuk emosi yang diekspresikan melalui media sosial adalah perasaan yang bernuansa depresif. Salah satu situs jejaring sosial yang paling banyak digunakan adalah Twitter, dengan 300 juta lebih pengguna aktif, twitter telah menjadi platform besar untuk mengekspresikan pandangan seseorang, sehingga banyak peneliti yang kini mulai menggunakannya sebagai sumber yang baik untuk memperoleh data yang berkaitan dengan Kesehatan mental. Analisis sentimen merupakan cara untuk mengidentifikasi perilaku depresif di media sosial. Beberapa jenis word embedding dalam melakukan analisis sentimen yang terkenal adalah Word2Vec, FastText, dan juga BERT. Penelitian ini bertujuan untuk melakukan perbandingan kontekstual dan non kontektsual word embedding Word2Vec, FastText, dan BERT dalam mendeteksi tweet bernuansa depresif di media sosial twitter menggunakan model LSTM. Berdasarkan hasil pengujian dan perbandingan, kombinasi model word embedding kontekstual BERT dan Long Short-Term Memory terbukti dapat memberikan nilai yang lebih baik dalam melakukan klasifikasi pada tweet bernuansa depresif, dengan skor F1-Score mencapai diatas 95% terhadap dataset bersifat multiclass.

Feelings of depression are one type of emotion expressed on social media. With over 300 million active users, one of the most popular social networking sites, Twitter, has become a huge platform for people to express their feelings. So many researchers are now using it as a good source for obtaining data related to mental health. Sentiment analysis is a way to identify depressive behavior on social media. Word2Vec, FastText, and BERT are three well-known types of word embedding in sentiment analysis. This study aims to compare contextual and non-contextual word embedding Word2Vec, FastText, and BERT in detecting depressive tweets on Twitter social media using the LSTM model. Based on tests and comparisons, the combination of the BERT contextual word embedding model and Long Short-Term Memory proved to provide a better value in classifying tweets with depression nuances, with an F1-Score reaching 95% for a multiclass dataset.

Kata Kunci : Klasifikasi Teks, Tweet Depressive, BERT, Kontekstual Embedding, Long Short-Term Memory.

  1. S1-2022-432054-abstract.pdf  
  2. S1-2022-432054-bibliography.pdf  
  3. S1-2022-432054-tableofcontent.pdf  
  4. S1-2022-432054-title.pdf