Laporkan Masalah

SENTIMEN ANALISIS TWEET BERBAHASA INDONESIA DENGAN DEEP BELIEF NETWORK

IRA ZULFA, Drs. Edi Winarko, M.Sc., Ph.D

2017 | Tesis | S2 Ilmu Komputer

Sentimen analisis adalah riset komputasional dari opini sentimen dan emosi yang diekspresikan secara tekstual (Liu, 2010) yang diaplikasikan pada data seperti Twitter yang merupakan salah satu perangkat komunikasi paling popular di kalangan pengguna internet (Chirp, 2010). Para pengguna Twitter mengirimkan tweet mengenai produk, layanan, pandangan politik, ideologis, dan minat mereka dengan 55 juta tweet setiap harinya (Yarrow, 2010). Deep Belief Network (DBN) merupakan salah satu metode machine learning yang termasuk dalam metode Deep Learning yang merupakan tumpukan stack dari beberapa algoritma atau metode dengan feature extraction yang memanfaatkan seluruh resource seoptimal mungkin. Penelitian ini bertujuan untuk melakukan pengklasifikasian terhadap sentimen positif, negatif, dan netral terhadap data uji dan untuk mengetahui akurasi model klasifikasi dengan menggunakan metode Deep Belief Network ketika diaplikasikan pada klasifikasi tweet untuk menandai kelas sentimen data training tweet berbahasa Indonesia. Penelitian ini memperlihatkan hasil, metode terbaik pada dua masukan data tweet yang berjumlah 1037 dan 31850 adalah DBN. DBN dengan menggunakan struktur parameter satu hideen layer, 1000 fitur, dan 200 epoch pada learning rate 0.2, atau 0.3. DBN dapat menghasilkan akurasi sebesar 94,21% untuk data 1037 dan 85,49% untuk data 31850, sedangkan SVM (Support Vektor Machine) mendapatkan akurasi yang hampir sama dengan DBN. SVM mendapatkan akurasi sebesar 92,57% untuk data 1037 dan 73,74% untuk data 31850. NB (Naive Bayes) Jika dibandingkan dengan metode dua metode sebelumnya hanya memiliki akurasi sebesar 77,53% untuk data 1037 dan 70,49% untuk data 31850.

Analytical sentiment is computational research from sentimental and emotional opinions which is expressed textually (Liu, 2010) and applied to data such as Twitter which is one of the most popular communication devices among internet users (Chirp, 2010). Twitter users send tweets about their products, services, political perspectives, ideology, and interest with 55 million tweets per day (Yarrow, 2010). Deep Belief Network (DBN) is one of the machine learning methods included in the Deep Learning method which is a stack of several algorithms or methods with extraction features that utilize all resources as optimally as possible. This study aims to classify positive, negative, and neutral sentiments against the test data and to determine the accuracy of the classification model by using the Deep Belief Network method when it is applied to the tweet classification to mark the sentiment class of training data tweet in Indonesian language. This study shows the results that the best method on the two input data tweet totaling 1037 and 31850 is DBN. DBN uses the parameter structure of one hideen layer, 1000 features, and 200 epoch at learning rate 0.2, or 0.3. DBN can generate accuracy of 94.21% for 1037 data and 85.49% for 31850 data, while SVM (Support Vektor Machine) get almost the same accuracy with DBN. SVM obtained an accuracy of 92.57% for 1037 data and 73.74% for 31850 data. NB (Naive Bayes) when it is compared with the previous two methods, only has accuracy of 77.53% for 1037 data and 70.49% for 31850 data.

Kata Kunci : Sentimen Analisis, Twitter, Deep Belief Network

  1. S2-2017-371853-abstract.pdf  
  2. S2-2017-371853-bibliography.pdf  
  3. S2-2017-371853-tableofcontent.pdf  
  4. S2-2017-371853-title.pdf