Laporkan Masalah

Twitter Hate Speech Analysis by Using Support Vector Machines

ALILAH BALQIS, Mardhani Riasetiawan, M.T., Dr

2022 | Skripsi | S1 ILMU KOMPUTER

Di era kemajuan media sosial, ujaran kebencian dan kata-kata kasar semakin meningkat. Penelitian ini bertujuan untuk mendeteksi ujaran kebencian dan bahasa kasar di Twitter. Meskipun banyak penelitian sebelumnya berdasarkan mekanisme multilabel telah muncul dalam literatur, keuntungan dari pendekatan yang digunakan dalam penelitian ini telah meningkat. Oleh karena itu, tujuan dari penelitian ini adalah untuk membuat model klasifikasi multi-label, mengecualikan ujaran kebencian dan bahasa yang menyinggung dari kumpulan data, dan mengevaluasi model yang diusulkan sesuai dengan parameter kinerja. Kaggle digunakan untuk mendapatkan teks berbasis tweet untuk penelitian ini. Pendekatan model deteksi sentimen kebencian dilatih oleh model mesin pendukung vektor berbasis powerset dan chainer classifier. Tahap pra-pemrosesan dilakukan setelah meninjau data yang diunduh, dataset pelatihan dan pengujian dikumpulkan. Hasilnya disajikan analisis komparatif untuk kedua model. Terlihat dari hasil bahwa model SVM berdasarkan classifier Chainer mengungguli model SVM berdasarkan classifier Powerset. Hasil ini, dievaluasi terhadap parameter evaluasi, menyoroti keunggulan model SVM berbasis pengklasifikasi Chainer, serta efektivitas dan ketahanannya.

In the era of social media advancement, hate speech and offensive language are increasing tremendously. This research aims to detect hate speech and offensive language on Twitter. Although many previous studies based on multi label mechanisms have appeared in literatures, the advantages of the approach used in this research have increased. Therefore, the aim of this research is to create a multi-label classification model, exclude hate speech and offensive language from the dataset, and evaluating the proposed model according to the performance parameters. Kaggle is used to gain the tweet-based text for this research. The hate sentiment detection model approach was trained by powerset and chainer classifier-based support vector machine models. Pre-processing phase was done after reviewing the downloaded data, training and test datasets were collected. The results presented a comparative analysis for both models. It was observed from the results that the SVM model based on the Chainer classifier outperforms the SVM model based on the Powerset classifier. These results, evaluated against the evaluation parameters, highlight the superiority of the Chainer classifier-based SVM model, as well as its effectiveness and robustness.

Kata Kunci : SVM, Twitter, Hate-speech

  1. S1-2022-386851-abstract.pdf  
  2. S1-2022-386851-bibliography.pdf  
  3. S1-2022-386851-tableofcontent.pdf  
  4. S1-2022-386851-title.pdf