Laporkan Masalah

Classifying customer reviews based on product category using recurrent neural networks (rnns) on amazon product review dataset

MUHAMMAD HAIDER A, Sigit Priyanta, S.Si., M.Kom., Dr

2022 | Skripsi | S1 ILMU KOMPUTER

Banyak situs web e-niaga berisi hampir semua jenis produk yang dicari pelanggan. Kategori produk yang tersedia untuk pelanggan sangat luas dan terus berkembang, banyak kategori produk berisi sub-kategori mereka sendiri. Dari kategori tersebut banyak wawasan yang dapat dikumpulkan dari tinjauan konsumen. Dengan banyaknya ulasan yang dihasilkan tentang produk, ulasan tersebut perlu dikelompokkan ke dalam kategori produk tetapi untuk mengklasifikasikan kategori produk dari ulasan pelanggan adalah sebuah tantangan. Dengan semua itu, pada penelitian ini akan dibangun model klasifikasi teks yang secara otomatis akan mengkategorikan ulasan pelanggan berdasarkan kategori produk. Model akan dilatih menggunakan kumpulan data ulasan produk amazon. Model ini akan menggunakan penyematan kata word2vec untuk mengekstraksi konteks kalimat dengan lebih baik, dan menggunakan arsitektur LSTM untuk melatih model, selain LSTM, jaringan saraf lain seperti CNN dan GRU juga akan diuji. Setelah penelitian ini selesai, saat menguji berbagai jaringan saraf, model LSTM memiliki kinerja terbaik dalam set pengujian. Akurasi yang dicapai model LSTM adalah 86,70%, CNN memiliki akurasi 86,28% dan GRU memiliki akurasi 86,44% pada test set. Pada set validasi, model LSTM juga memiliki akurasi terbaik. Akurasi Model LSTM sebesar 86,84%, CNN memiliki akurasi sebesar 85,96% dan GRU memiliki akurasi sebesar 86,60%.

Many ecommerce websites contain almost any type of product that customers are looking for. The categories of products available for the customer are vast and it's ever-growing, many categories of products contain their very own sub-categories. From those categories many insights can be gathered from consumer review. With the vast amount of reviews generated about products, those reviews need to be grouped into the categories of the product but to classify the product category from customer review is a challenge. With all that being mentioned, in this research, a text classification model will be built which will automatically categorize customer reviews based on the product category. The model will be trained using the amazon product review dataset. The model will use word2vec word embedding to better extract the context of sentences, and use LSTM architecture to train the model, besides LSTM other neural networks such CNN and GRU will also be tested. Upon the completion of this research, while testing out various neural networks, the LSTM model had the best performance in the test set. The accuracy achieved by the LSTM model was 86.70%, CNN had accuracy of 86.28% and GRU had accuracy of 86.44% in the test set. In the validation set, the LSTM model also had the best accuracy. The accuracy Of LSTM model was 86.84%, CNN had accuracy of 85.96% and GRU had accuracy of 86.60%.

Kata Kunci : Text classification, LSTM, GRU, CNN, product category detection, word2vec.