Perbandingan Kinerja Metode Deep Learning dengan Metode Non-Deep Learning Pada Analisis Sentimen Tweet Berbahasa Indonesia
MUHAMMAD AZMI ARIS, Khabib Mustofa, S.Si., M.Kom., Dr. techn.
2020 | Skripsi | S1 ILMU KOMPUTERAnalisis sentimen merupakan salah satu proses atau teknik yang sangat populer digunakan untuk mengidentifikasi kepuasan pelanggan. Beberapa metode yang dapat digunakan untuk proses analisis sentimen adalah Naive Bayes, Support Vector Machine dan Deep Learning. Metode Naive Bayes dan metode Support Vector Machine yang merupakan metode non-Deep Learning memiliki kelemahan dalam memilih metode ekstraksi fitur dan menemukan fitur yang lebih baik (Su dkk., 2014). Di samping itu metode tersebut juga memiliki kelemahan pada data yang berjumlah besar yang mempengaruhi performa pada akurasi klasifikasi (Nasichuddin dkk., 2018). Deep Learning menunjukkan hasil yang bagus di bidang speech recognition, vision dan sebagainya sehingga banyak digunakan pada analisis sentimen untuk mendapatkan kinerja yang lebih baik (Ouyang dkk., 2015). Pada penelitian ini dilakukan perbandingan metode Deep Learning yakni metode CNN dan metode LSTM dengan metode non-Deep Learning yakni Naive Bayes dari sisi akurasi dan waktu komputasi untuk mengetahui apakah dengan pengorbanan komputasi yang besar akan mendapatkan akurasi yang jauh lebih baik. Pengujian dilakukan dengan menggunakan K-Fold Cross Validation. Jumlah K-Fold yang digunakan adalah sebanyak 10. Data dibagi sebanyak K-1 bagian untuk data latih dan sisa bagian lainnya untuk data uji. Penelitian ini menghasilkan nilai akurasi sebesar 60.92% untuk metode LSTM, 59.29% untuk metode CNN, dan 57.59% untuk metode Naive Bayes. Waktu komputasi rata-rata dalam 1 fold yang didapat oleh ketiga metode tersebut adalah 57 milidetik untuk Naive Bayes, 110 detik 500 milidetik untuk metode CNN, dan 293 detik 730 milidetik untuk metode LSTM. Setelah dilakukan pengujian hipotesis dari sisi akurasi dan waktu komputasi dapat disimpulkan bahwa kinerja metode non-Deep Learning yakni metode Naive Bayes lebih baik daripada metode Deep Learning yakni LSTM dan CNN.
Sentiment analysis is one of the most popular processes or techniques used to identify customer satisfaction. Some methods that can be used for sentiment analysis are Naive Bayes, Support Vector Machine and Deep Learning. The Naive Bayes method and the Support Vector Machine method which are non-Deep Learning methods have weaknesses in choosing the feature extraction method and finding better features. In addition, these methods also have weaknesses in large amounts of data that affect the performance of the classification accuracy (Nasichuddin dkk., 2018). Deep Learning shows good results in the field of speech recognition, vision and so on so that it is widely used in sentiment analysis to get better performance (Ouyang dkk., 2015). In this study a comparison of the Deep Learning method, the CNN method and the LSTM method with the non-Deep Learning method, namely Naive Bayes, in terms of accuracy and computational time to find out whether a large computational sacrifice will get much better accuracy. Testing is done using K-Fold Cross Validation. The number of K-Fold used was 10. The data is divided into K-1 sections for training data and the rest for the test data. This research resulted in an accuracy value of 60.92% for the LSTM method, 59.29% for the CNN method, and 57.59% for the Naive Bayes method. The average computation time in 1 fold obtained by the three methods is 57 milliseconds for Naive Bayes, 110 seconds 500 milliseconds for the CNN method, and 293 seconds 730 milliseconds for the LSTM method. After testing the hypothesis in terms of accuracy and computational time it can be concluded that the performance of the non-Deep Learning method, the Naive Bayes method, is better than the Deep Learning method, namely LSTM and CNN.
Kata Kunci : Analisis Sentimen, Deep Learning