ANALISIS SENTIMEN TWITTER DENGAN METODE UNSUPERVISED MENGGUNAKAN RULE-BASED PADA ONLINE TRANSPORTATION DI INDONESIA
SASMITA DEWI WINAHYU, Teguh Bharata Adji, S.T., M.T., M.Eng., Ph.D.; Widyawan, S.T., M.Sc., Ph.D.
2018 | Skripsi | S1 TEKNOLOGI INFORMASIKebutuhan akan transportasi yang layak dan efisien di Indonsia semakin meningkat seiring berjalannya waktu. Salah satu jenis transportasi yang kini kerap digunakan masyarakat adalah transportasi online karena menawarkan kemudahan bagi penggunanya. Banyak pengguna yang membagikan pengalaman atau opini mereka, baik atau buruk, di media sosial khususnya di Twitter. Banyaknya opini tersebut dapat digunakan sebagai sumber informasi untuk menganalisis sentimen masyarakat terhadap transportasi online di Indonesia. Analisis sentimen pada transportasi di Indonesia sebelumnya menggunakan metode supervised yang membutuhkan data latih yang dilabeli secara manual. Metode ini memerlukan waktu yang lama dan tenaga ahli untuk menentukan kelas kalimat. Berdasarkan hal tersebut, pada penelitian ini dilakukan analisis sentimen dengan metode unsupervised yang tidak memerlukan data latih, yaitu dengan menerapkan metode rule-based dengan menerapkan kumpulan sentiment rules. Tahapan metode rule-based adalah preprocessing, polarity identification, dan terakhir polarity classification. Hasil pengujian menunjukkan bawah metode rule-based dapat diterapkan pada analisis sentimen tanpa menggunakan data latih dengan rata-rata akurasi tertinggi sebesar 72,9% pada data non-stemming. Kemampuan memprediksi sentimen paling baik untuk kelas negatif dan positif terjadi pada data non-stemming, dan untuk kelas netral pada data stemming. Metode rule-based memiliki rata-rata akurasi yang lebih tinggi sebesar 13,77% dibandingkan dengan metode SentiStrength.
Indonesia citizen's needs for decent and efficient transportation is increasing over time. One of the transportation which is very popular in the last three years is online transportation, because it offers convenience for its customers. Many users share their experiences or opinions about its services, whether it's good or bad, in social media especially Twitter. Those opinions can be used as a source of information to analyze customer's overall sentiment towards online transportation in Indonesia. One way to obtain those sentimen can be done automatically using technique called sentiment analysis. Previously, sentiment analysis on transportation in Indonesia uses supervised method which require manually labeled data training. This method can take so much time and requires experts to determine sentence classes. Based on those problems, this research proposes rule-based sentiment analysis which uses no training data. The steps of rule-based method are preprocessing, polarity identification, and lastly polarity classification. This method show that it can be applied for unsupervised sentiment analysis with highest average accuracy is 72,90% of the non-stemming data. The best capabilitiy of the system to predict negative and positive classes occurs in non-stemming data. Whilst the best capability to predict neutral classes occurs in stemming data. Rule-based method has average accuracy of 13,7% higher than other unsupervised method, SentiStrength.
Kata Kunci : Sentiment Analysis, Unsupervised, Rule-based, Sentiment Rules, Online Transportation