Laporkan Masalah

ANALISIS EMOSI PADA TWEET BERBAHASA INDONESIA TENTANG ULASAN FILM

ALFAN DINDA RAHMAWAN, Dr. Yohanes Suyanto,M.I.Kom;Dr.Sigit Priyanta, S.Si, M.Kom

2018 | Tesis | S2 Ilmu Komputer

Masyarakat saat ini memiliki kecenderungan untuk mencari informasi dan pendapat orang lain mengenai film yang akan ditonton. Twitter merupakan salah satu media sosial yang digunakan masyarakat dalam menyebarkan informasi, memberikan opini dan mengekspresikan emosi. Dengan banyaknya jumlah tweet yang tersebar, maka tidak memungkinkan jika pengambilan informasi mengenai film dilakukan secara manual, sehingga diperlukan teknik klasifikasi dalam mengambil informasi tentang sentimen emosi masyarakat terhadap sebuah film. Analisis emosi merupakan salah satu teknik yang dapat digunakan untuk menganalisis dan mengklasifikasikan tweet seseorang sesuai dengan sentimen emosi. Dalam analisis ini, emosi dasar manusia yang menjadi acuan dalam melaksanakan penelitian. Dua tahapan proses dilakukan untuk mencapai tujuan dari penelitian ini. Tahap pertama yakni menentukan data tweet beremosi dan data tweet tanpa emosi, pada tahap ini, penanganan negasi dilakukan bertujuan untuk mengubah polaritas kata yang terkena dampak negasi dengan menggunakan algoritme First Sentiment Word(FSW), Fixed Window Length(FWL) dengan rentang window (n) = 1 sampai 3 dan modifikasi First Sentimen Word dengan cakupan negasi n=2 dan n=3. Tahap kedua mengklasifikasikan tweet sesuai dengan tipe emosi yaitu cinta, senang, marah, sedih dan takut. Pada tahap ini menggunakan metode klasifikasi Multinomial Naive Bayes dengan menggunakan metode ekstraksi fitur unigram, TF dan TF-IDF. Hasil pengujian menunjukkan bahwa klasifikasi menggunakan metode MNB dengan fitur TF lebih baik daripada metode MNB dengan fitur TF-IDF dengan rata-rata nilai akurasi 74.8%, presisi 75.8%, recall 75% dan F-Measure 74.6%. Penambahan algoritme penanganan negasi FSW n=3 dapat meningkatkan performansi akurasi sebesar 4%, presisi 3%, recall 3% dan f-measure 4%, dibandingkan tanpa menggunakan algoritme penanganan negasi. Metode MNB dengan fitur TF dan dikombinasikan dengan algoritme FSW n=2 dan n=3 mampu menghasilkan akurasi yang paling baik dengan nilai akurasi 76%, presisi 77%, recall 76% dan F-Measure 76%.

Today's society has a tendency to seek information and opinions of others about the movie to watch. Twitter is one of the social media used by the public to share information, giving opinions and expressing emotions. With the large number of tweets scattered, it is not possible to get information sentiment data of the film is done manually, so classification techniques are needed to get information about people's emotional sentiments towards a film. Emotion analysis is one technique that can be used to analyze and classify tweet according to emotional sentiments. It basically is used to analyse people emotional sentiment towards a specific content based on human basic emotion. This research uses two approach techniques in analysing emotional sentiment in Twitter. The first stage is determining tweets that do and do not contain emotion. In this stage, negation management is done to change data polarity of words influenced by negation using the algorithm First Sentiment Word (FSW), Fixed Word Length (FWL) with window (n) = 1 to 3 and modify FSW with negation range (n) = 2 and (n) = 3. The second stage is classifying tweets based on emotion type: love, happy, angry, sad and afraid. In this stage, Multinominal Naive Bayes is employed using the extraction feature unigram, TF and TF-IDF. The result of system testing shows classification model MNB with TF feature is better compared to the TF-IDF one with the average accuracy 74.8%, precision 75.8%, recall 75% and F-Measure 74.6%. Algorithm addition in handling FSW negation n=3 in building the model can enhance performance for 4%, precision 3%, recall 3% and f-measure 4% compared to when algorithm of handling negation is not utilised. In model classification MNB with TF feature combined by the algorithm of handling negation FSW n=2 and n=3 can produce better accuracy with the value of 76%, precision 77%, recall 76% and F-measure 76%.

Kata Kunci : machine learning, analisis emosi, penanganan negasi


    Tidak tersedia file untuk ditampilkan ke publik.