Laporkan Masalah

ANALISIS SENTIMEN BERDASARKAN TOPIK MENGGUNAKAN LATENT DIRICHLET ALLOCATION (LDA) DAN NAIVE BAYES CLASSIFIER (NBC)

SINTA FITRIANINGRUM, Guntur Budi Herwanto, S.Kom, M.Cs

2018 | Skripsi | S1 ILMU KOMPUTER

Perkembangan internet semakin pesat menyebabkan semakin meningkatnya pengguna media sosial. Salah satu media sosial yang populer adalah Twitter. Sebanyak 40% pengguna media sosial Twitter menggunakan media sosial mereka untuk mengakses berita. Tidak hanya membaca berita namun mereka juga bisa menanggapi berita tersebut sesuai opini mereka masing-masing. Dari opini-opini tersebut dapat dicari topik utama atau tren yang sedang dibicarakan serta bagaimana pandangan masyarakat terhadap tren tersebut. Oleh karena itu, dibutuhkan analisis sentimen yang dapat menilai sentimen dari opini yang disampaikan masyarakat. Dibutuhkan juga pemodelan topik untuk melihat tren topik yang sedang dibicarakan. Proses analisis sentimen menggunakan algoritam Naive Bayes, dan proses pemodelan topik akan maenggunakan Latent Dirichlet Allocation. Data yang digunakan adalah data tweet yang di-post dan me-mention akun berita @bbcbrk, @cnnbreaking, dan @nytimes. Data diambil sebanyak 5505 dan diambil mulai 2 April 2018 Hingga 8 April 2018. Pengujian klasifikasi sentimen dilakukan dengan membandingka Multinomial Naive Bayes dan Bernouli Naive Bayes. Pengujian klasifikasi sentimen menggunakan 10-Fold Cross Validation dengan iterasi sebanyak 10 kali. Dari hasil penjuian klasifikasi sentimen didapatkan akurasi terbesar dihasilkan oleh algoritma Bernoulli Naive Bayes dengan rata-rata akurasi sebesar 85,29%. Pengujian pemodelan topik pada parameter passes dilakukan dengan menlihat tren kestabilan preplexity. Pengujian pemodelan topik pada parameter jumlah topik dilakukan dengan menlihat rata-rata preplexity terendah. Hasil pengujian didapatkan tren perplexity mulai stabil pada passes ke 10 dan rata-rata perplexity terendah pada saat jumlah topik sama dengan 35.

As the development of the Internet increasingly rapidly led to the increasing social media users. One of the popular social media is Twitter. 40% of Twitter users use their social media to access news. Not only read the news but they can also respond to the news according to their respective opinions. From these opinions can be searched the main topics or trends being discussed and how people view the trend. Therefore, it takes a sentiment analysis that can assess the sentiments of the opinions conveyed by the community. It also takes topic modeling to see the trending topics being discussed. The process of sentiment analysis uses the Naive Bayes algorithm, and the topic modeling will process using Latent Dirichlet Allocation. The data used are tweet data which is post and mention to news account @ bbcbrk, @cnnbreaking, and @nytimes. Data taken as many as 5505 and taken from 2 April 2018 Until 8 April 2018. Sentimental classification testing is done by multiplying the Multinomial Naive Bayes and Bernouli Naive Bayes. Testing sentiment classification using 10-Fold Cross Validation with iteration 10 times. From the result of classification of sentiments obtained the greatest accuracy produced by Bernoulli Naive Bayes algorithm with average accuracy of 85.29%. Testing of topic modeling on parameter passes is done by looking at stability trends of preplexity. The topic modeling test on the topic number parameter is performed by looking at the lowest preplexity average. The test results showed a trend of perplexity starting to stabilize at the 10th passes and the lowest perplexity average when the number of topics equals 35.

Kata Kunci : analisis sentimen, naive bayes, pemodelan topik, laten dirichlet allocation

  1. S1-2018-364009-abstract.pdf  
  2. S1-2018-364009-bibliography.pdf  
  3. S1-2018-364009-tableofcontent.pdf  
  4. S1-2018-364009-title.pdf