INCREMENTAL LEARNING UNTUK OPINION MINING PADA TWEET BERBAHASA INDONESIA MENGGUNAKAN DATA STREAM TWITTER; INCREMENTAL LEARNING FOR OPINION MINING ON INDONESIAN LANGUAGE TWEET USING TWITTER DATA STREAM
FAJRI WIRYAWAN, Edi Winarko
2014 | Skripsi | PROGRAM STUDI ILMU KOMPUTERTwitter merupakan layanan micro-blogging yang sangat cepat berkembang. Pengguna Twitter sering kali menuliskan opini melalui akun Twitter miliknya. Salah satu metode komputasi yang dapat dilakukan untuk mengekstraksi opini yang terdapat dalam tweet adalah opinion mining. Akurasi merupakan salah satu alat ukur dalam opinion mining. Akurasi pada proses opinion mining dapat ditingkatkan dengan menambahkan jumlah corpus. Pada opinion mining untuk tweet, jumlah corpus dapat ditingkatkan menggunakan data stream Twitter. Salah satu metode pengolahan data stream adalah incremental learning. Pengolahan data stream Twitter menggunakan incremental learning diharapkan dapat meningkatkan akurasi sehingga terjadi self-improvement. Pada penelitian ini, dibandingkan dua metode incremental learning yaitu full concept memory dan full concept memory dengan menggunakan perbandingan akurasi. Pada setiap metode akan digunakan algoritma Multinomial Naive Bayes, Binarized Multinomial Naive Bayes, dan Multi-variate Bernoulli Naive Bayes. Setiap metode akan melakukan pembaruan concept description setelah n data diterima. Pada penelitian ini digunakan n = 1, 25, 50, 75, 100, 250, 500, dan 750. Perbandingan akan dilakukan dengan menggunakan akurasi metode terhadap 250 data pengujian serta waktu pemrosesan 15.000 data stream sebagai alat ukur. Perbandingan metode incremental learning menghasilkan bahwa kedua metode incremental learning yang dibandingkan menghasilkan akurasi yang relatif meningkat. Algoritma Binarized Multinomial Naive Bayes memberikan akurasi terbaik pada setiap metode incremental learning dan setiap nilai n. Nilai akurasi terbaik diperoleh sebesar 80,4% dengan menggunakan algoritma Binarized Multinomial Naive Bayes, metode full concept memory dengan perbandingan akurasi, dan nilai n = 25. Waktu pemrosesan untuk algoritma Multinomial Naive Bayes dan Binarized Multinomial Naive Bayes pada kedua metode incremental learning dan setiap nilai n tidak memberikan perbedaan yang cukup besar kecuali pada n = 1. Algoritma Multi-variate Bernoulli Naive Bayes memberikan waktu pemrosesan yang paling lama untuk setiap metode incremental learning dan setiap nilai n. Waktu pemrosesan paling lama adalah sekitar 36 jam dengan menggunakan algoritma Multi-variate Bernoulli Naive Bayes, metode full concept memory dengan perbandingan algoritma, dan nilai n = 1.
Kata Kunci : Incremental Learning ; Opinion Mining; Tweet Berbahasa indonesia; Data Stream Twitter