Laporkan Masalah

KLASIFIKASI KONDISI LALU LINTAS MENGGUNAKAN ALGORITME NAIVE BAYES BERBASIS DATA TWITTER

MOHAMMAD AFRIZAL, M. Idham Ananta Timur, ST., M.Kom

2018 | Skripsi | S1 ELEKTRONIKA DAN INSTRUMENTASI

Dewasa ini Twitter banyak digunakan untuk mendeteksi keadaan lalu lintas. Pendekatan menggunakan metode Naive Bayes dilakukan untuk mengklasifikasi tweet apakah mengandung sentimen lalu lintas atau tidak dengan hasil akurasi cukup baik. Namun, metode Naive Bayes belum dikembangkan untuk mengklasifikasi keadaan lalu lintas dari sekumpulan data Twitter. Tujuan dari penelitian ini adalah untuk melihat akurasi dari pengklasifikasian dua keadaan lalu lintas (macet dan tidak macet) berbasis data Twitter menggunakan algoritme Naive Bayes. Implementasi algoritme Naive Bayes dilakukan dalam beberapa tahapan, yaitu pengambilan data, pra pemrosesan, pemilihan ciri, pelatihan data, dan evaluasi. Pengambilan data menghasilkan 4246 tweets yang berasal dari berbagai akun. Setelah dilakukan pra pemrosesan didapatkan 3231 data untuk diproses. Ciri waktu dipilih karena merupakan informasi identik dari setiap tweet. Kemudian dilakukan pelatihan model klasifikasi menggunakan algoritme Naive Bayes. Pelatihan model menghasilkan bobot probabilitas prior dan posterior pada setiap ciri. Hasil pengujian model klasifikasi menggunakan teknik cross validation menghasilkan rata-rata akurasi sebesar 77,5%, presisi 90,0%, recall 79,1%, dan f- score sebesar 82,8%.

Today Twitter is widely used to detect traffic conditions. The approach using the Naive Bayes method is done to classify tweets whether they contain traffic sentiments or not with accurate results. However, the Naive Bayes method has not been developed to classify traffic conditions from a set of Twitter data. The purpose of this study is to see the accuracy of the classification of two traffic conditions (jammed and not jammed) based on Twitter data using the Naive Bayes algorithm. Naive Bayes algorithm implementation is done in several stages, namely data retrieval, pre-processing, feature selection, data training, and evaluation. Data collection generated 4246 tweets from various accounts. After pre- processing obtained 3231 data to be processed. Time characteristic is chosen because it is identical information from each tweet. Then carried out the classification model training using the Naive Bayes algorithm. Model training produces both prior and posterior probability weights on each feature. The result of classification test using cross validation technique resulted in average accuracy of 77,5%, precision 90,0%, recall 79,1%, and f-score equal to 82,8%.

Kata Kunci : Twitter, Naive Bayes, Traffic

  1. S1-2018-364104-abstract.pdf  
  2. S1-2018-364104-bibliography.pdf  
  3. S1-2018-364104-tableofcontent.pdf  
  4. S1-2018-364104-title.pdf