Laporkan Masalah

Klasifikasi dan Visualisasi Data Pada Pemilihan Gubernur DKI Jakarta 2017 Berdasarkan Data Twitter

AMALIA DWI CINTYA, Warsun Najib, S.T., M.Sc;Teguh Bharata Adji, S.T., M.T., M.Eng., Ph.D

2017 | Skripsi | S1 TEKNOLOGI INFORMASI

Dewasa ini, masyarakat memberikan opini terhadap Calon Gubernur tidak lagi melalui media cetak karena dianggap sudah kuno dan tidak praktis sehingga sudah mulai ditinggalkan. Masyarakat lebih cenderung menggunakan media sosial sebagai sarana aspirasi dan memberikan opini salah satunya adalah Twitter. Pada pemilihan Gubernur opini masyarakat terhadap Calon Gubernur dapat diketahui dengan cara melalukan proses data mining pada Twitter. Untuk mengetahui popularitas Calon Gubernur berdasarkan opini masyarakat, pada penelitian ini dibangun sistem klasifikasi data yang terdiri atas beberapa klasifikasi berdasarkan data pada Twitter, sistem ini dibangun dengan menggunakan metode algoritme SVM, selanjutnya klasifikasi data yang dihasilkan disimpan ke dalam Elasticsearch dan divisualisasikan menggunakan Kibana. Hasil akurasi, presisi dan recall yang didapatkan saat pengujian validasi data dengan menggunakan 300 data tweet masing-masing sebesar 97.2%, 90.5% dan 92.6%, sedangkan hasil data yang bersifat near-realtime dengan menggunakan 91.814 tweet menunjukkan bahwa hasil popularitas tertinggi terdapat pada pasangan Ahok-Djarot yaitu sebesar 47.71% sedangkan urutan kedua adalah Agus-Sylvi sebesar 26.68% dan terakhir Anies-Sandi sebesar 18.57%

Nowadays, the society gives their opinion about governor's candidate not from the printed media. It's because printed media are obsolete and unpractical, which why it's now rarely used. Society prefered using the social media as their aspiration's media and for giving opinion about things that happened recently one of social media is Twitter. On general election public opinion about Candidates for Governor can be discovered using data mining technique. To know the popularity of Candidates for Governor by public opinion, in this experiment constructed a data classification system consisting of several categories based on the data on Twitter, in addition SVM algorithm used to facilitate the data's reading and classification. The data classification that produced then saved on Elasticsearch and visualized by using Kibana. The accuracy, precision and recall's result that gathered from the experiment by validating data with 300 "tweets" data are respectively 97,2%, 90,5% and 92,6%, while the near-realtime data with 91.814 "tweets" shows that the highest popularity won by Ahok-Djarot with 47.71%. The second place are Agus-Sylvi with 26.68% and Anies-Sandi at last place with 18.57%.

Kata Kunci : Twitter, classification, Algorithm SVM, Elasticsearch, Kibana