Laporkan Masalah

VISUALISASI INFORMASI UNTUK MEMETAKAN BERITA YANG BERKORELASI DENGAN TWEET MENGGUNAKAN ANALISIS LEKSIKAL DAN NAIVE BAYES

YODI DILA PADILLA, Mardhani Riasetiawan, M.T.

2015 | Skripsi | S1 ILMU KOMPUTER

Internet mengubah setiap bagian yang ada pada media masa juga melahirkan media baru yang bernama media sosial, salah satu diantaranya Twitter, dimana Twitter memiliki sejumlah potensi dan potensi itu mampu dideteksi oleh media massa. Kemudian, potensi tersebut dimanfaatkan oleh media massa dengan cara masuk ke dalam media sosial. Hal ini justru menyebabkan rusaknya alasan media sosial lahir yaitu sebagai media penyeimbang. Media sosial menjadi tempat media massa untuk membuat dan menyebarkan opini publik. Sejauh ini, opini publik yang muncul tentang suatu hal baru sebatas gambaran umum sementara alasan yang menyebabkan opini publik tersebut muncul tidak pernah diketahui. Oleh karena itu, dibutuhkan sebuah sistem yang mampu melihat penyebab opini publik muncul dan pola-pola yang terbentuk yang disebabkan oleh opini publik yang berkorelasi dengan berita yang telah dibuat oleh media massa. Penelitian ini mencoba untuk membuat sistem yang mampu melihat opini publik dalam ukuran yang lebih kecil berdasarkan asumsi bahwa opini publik disebabkan oleh sejumlah berita. Berita yang dikumpulkan merupakan berita yang memicu masyarakat untuk membuat opini di media sosial, dalam kasus ini adalah Twitter. Tweet, satuan data di Twitter, akan diklasifikasikan berdasarkan sentimennya. Kemudian, sistem juga akan memprediksi lokasi berita yang kemudian akan dipetakan berdasarkan lokasinya. Kombinasi sentimen dan lokasi digunakan untuk melihat apakah ada pola yang muncul. Metode yang digunakan dalam penelitian ini untuk mengklasifikasikan Tweet berdasarkan sentimennya menggunakan Multinomial Naive Bayes (MNB), sedangkan metode untuk memprediksi lokasi berita adalah analisis leksikal. Penelitian ini menghasilkan akurasi klasifikasi sentimen sebsar 69,43%. Kemudian, akurasi untuk memprediksi lokasi adalah sebesar 80,1% untuk relaxed accuracy, 90% untuk regular accuracy, dan 71% untuk hard accuracy. Penelitian ini juga melakukan percobaan menggunakan sejumlah kata kunci untuk menunjukan bahwa sistem dapat bekerja dengan cara menunjukan sejumlah hasil secara statistik dan visualisasi.

Internet shifted every part of mass media also triggered the newly born media called social media, such as Twitter, which has a number potential within itself that could be detected by mass media. Then, the potential of Twitter exploited by mass media by infiltrating into social media. This broke one of the reasons why social media born was that people wished that it could become a balancer tool against mass media. Social media turned out to be the place for mass media to create and to spread public opinion. As far as it goes, public opinion that had been emerged was still in general picture while the reasons why it emerged were never been discovered. Therefore, a system is needed to see the causes of the public opinions and patterns that were made based on public opinion which correlated with news that were conducted by mass media. The research is trying to make a system to see public opinion in smaller scope based on assumption as public opinion was triggered by news. News that were collected are news that provoked community to make opinion,especially in social media, which in this case is in Twitter. In regards of case Tweet, denumeration data post of Twitter, is going to be classified based on sentiment. Afterwards, the system is going to predict the location of the news and be spatially mapped. The combination of sentiment and location used for seeing whether any pattern exist. The method used by this reasearch to classify sentiment of Tweet is Multinomial Naive Bayes (MNB), while the method used to predict location of the news is lexical analyisis. This reasearch produces accuracy of sentiment classification for about 69,43%. Then, the accuracy of location prediction are 80,1% , 90%, and 71% for relaxed, regular, and hard accuracy respectively. This research also tests the general system using several keyword in order to show that system can work well by produce several statistic summary and visualization.

Kata Kunci : Informasi Visualisasi, Naive Bayes, NER, Twitter, media massa

  1. S1-2015-300710-abstract.pdf  
  2. S1-2015-300710-bibliography.pdf  
  3. S1-2015-300710-tableofcontent.pdf  
  4. S1-2015-300710-title.pdf