Laporkan Masalah

TWITTER POSTS EMOTION CLASSIFICATION USING SUPPORT VECTOR MACHINE AND NAIVE BAYES CLASSIFIERS FOR PRODUCTS' FEEDBACK ANALYSIS

AMIRA SALSABILA H, Edi Winarko, M. Sc., Ph. D

2021 | Skripsi | S1 ILMU KOMPUTER

Penelitian tesis ini terinspirasi dari skema anotasi yang ada untuk emosi dalam teks dan akan mengoptimalkan teknik pembelajaran mesin, Naive Bayes Classifiers dan Support Vector Machines, untuk klasifikasi. Model emosi skema untuk anotasi data dalam penelitian ini mendefinisikan emosi dasar menjadi kemarahan, kebahagiaan, kesedihan, kejutan positif dan kejutan negatif. Penelitian ini akan memberikan kontribusi pengetahuan terhadap model komputasi emosi yang paling sesuai untuk digunakan dalam proses analisis umpan balik. Selain itu, tesis ini mengkaji konten emosi dari postingan Twitter dan menggabungkan konten tersebut dalam strategi analisis umpan balik produk. Dataset yang dihasilkan dalam penelitian ini adalah dataset iPhone 11 Camera yang terdiri dari 4.046 tweet beranotasi, dataset Amazon Alexa yang terdiri dari 747 tweet beranotasi, dan dataset Kylie Lip Kit yang terdiri dari 293 tweet beranotasi. Semua dataset diimplementasikan pada dua Naive Bayes Classifiers dan tiga kernel Support Vector Machines. Penelitian ini menyimpulkan bahwa untuk klasifikasi emosi umpan balik produk, SVM linear dan RBF kernel memiliki kinerja terbaik, dengan akurasi 95% dan 96% pada Alexa Dataset masing-masing dan 91% dan 92% pada dataset iPhone 11 Camera. Sedangkan untuk Naive Bayes Classifiers, Complement Naive berkinerja terbaik, meskipun masih belum sebanding dengan RBF dan Linear kernel SVM, ia mengungguli kernel polinomial SVM.

This thesis research is inspired by existing annotation schemes for emotion in text and will optimise machine learning techniques, Naive Bayes Classifiers and Support Vector Machines, for classification. The emotion model schemed to annotate the data in this research defines basic emotions into anger, happiness, sadness, positive surprise and negative surprise. This research will contribute knowledge towards a computational model of emotions that is most suitable for use in the process of analyzing feedback. Moreover, this thesis examines the emotion contents of Twitter posts on and joins these contents in products' feedback analysis strategies. The datasets produced in the research are the iPhone 11 Camera dataset consisting of 4,046 annotated tweets, the Amazon Alexa dataset consisting of 747 annotated tweets and the Kylie Lip Kit dataset consisting of 293 annotated tweets. All datasets were implemented on two Naive Bayes Classifiers and three kernels of Support Vector Machines. This research concluded that for emotion classification of products' feedback, SVM's linear and RBF kernel performed best, with accuracies of 95% and 96% on the Alexa Dataset respectively and of 91% and 92% on the iPhone 11 Camera dataset. As for the Naive Bayes Classifiers, Complement Naive performed best, even though it was still not up to par with SVM's RBF and Linear kernels, it outperformed SVM's polynomial kernels.

Kata Kunci : emotion classification, Naive Bayes, SVM, feedbacks, tweets

  1. S1-2021-395993-abstract.pdf  
  2. S1-2021-395993-bibliography.pdf  
  3. S1-2021-395993-tableofcontent.pdf  
  4. S1-2021-395993-title.pdf