W I R A N T O, Drs. Edi Winarko, M.Sc.,Ph.D

2014 | Disertasi | S3 Ilmu Komputer

Permasalahan utama dalam pengembangan sistem rekomendasi berbasis collaborative filtering adalah akurasi prediksi dan presisi rekomendasi. Penelitian ini berfokus pada pengembangan algoritma prediksi nilai rating dan eksplorasi diversitas pada sistem rekomendasi dokumen berbasis multicriteria collaborative filtering. Pengembangan ini bertujuan untuk memperbaiki akurasi prediksi dan presisi rekomendasi. Pendekatan yang digunakan untuk perbaikan akurasi prediksi adalah dekomposisi matriks multiratings, similaritas pengguna berbasis jarak multidimensi, perhitungan bobot kriteria individual dan prediksi nilai rating untuk kriteria secara keseluruhan dengan pendekatan kombinasi. Sedangkan peningkatan presisi rekomendasi dilakukan dengan cara menerapkan konsep diversitas berbasis konten dokumen dan kriteria dokumen. Hasil dari penelitian ini adalah variasi model sistem rekomendasi dokumen berbasis multicriteria collaborative filtering yang memiliki karakteristik (1) prediksi rating untuk empat kriteria individual dokumen menggunakan algoritma collaborative filtering murni, (2) prediksi rating untuk kriteria secara keseluruhan menggunakan algoritma kombinasi, (3) pengukuran similaritas pengguna dengan pendekatan cosinus dan konsep jarak multidimensi, (4) mengakomodasi aspek diversitas dalam pembangkitan rekomendasi. Pengujian model dilakukan pada tiga kondisi yang ditentukan berdasarkan jumlah pengguna dan dokumen, yakni 50x100, 100x200 dan 200x400 dengan variasi tingkat kekosongan matriks 10%, 20%, 30%, 40%, 50% dan 60%. Metrik yang digunakan untuk mengukur akurasi prediksi adalah Mean Absolute Error (MAE), sedangkan tingkat presisi rekomendasi diukur dengan menggunakan prosentase Top-N. Berdasarkan hasil pengujian yang dilakukan dapat disimpulkan bahwa metode multicriteria collaborative filtering yang dikembangkan memiliki kinerja yang lebih baik dibandingkan dengan metode multicriteria collaborative filtering yang telah dikembangkan para peneliti sebelumnya, yang ditandai dengan semakin kecilnya nilai MAE dan semakin besarnya prosentase Top-N rekomendasi. Kinerja terbaik dicapai model Multicriteria Collaborative Filtering yang menggunakan similaritas berbasis jarak multidimensi. Penerapan konsep diversitas dokumen pada proses pembangkitan rekomendasi terbukti memberikan kontribusi yang signifikan pada peningkatan presisi rekomendasi.

The main problem faced by the collaborative filtering-based recommender systems is the prediction accuracy and precision of recommendation. This research focuses on developing an algorithm of the prediction of ratings and the diversity exploration on a multicriteria collaborative filtering-based document recommender system. The development aims at improving the prediction accuracy and the precision of recommendations. The approaches used to improve the prediction accuracy are multirating matrix decomposition, multidimensional distance-based user similarity, the calculation of individual criteria weights, and the rating prediction for the overall criteria by using a combination approach, while the approach used to improve the precision of recommendation was to apply the concept of content-based and criteria-based diversity. Result of the research was the model of the document recommender system based on multicriteria collaborative filtering with characteristics as follows : (1) the rating prediction for the four individual criteria of documents used the pure algorithm of collaborative filtering, (2) rating prediction for the overall criteria used a combination algorithm, (3) the measurement of user similarity with a cosine approach and the concept of multidimensional distance, (4) the accommodation of diversity in the generation of recommendations. The testing of model was done on three conditions determined based on the number of users and documents, i.e., 50x100, 100x200 and 200x400 with variation in matrix sparsity rate of 10%, 20 %, 30 %, 40 %, 50 % and 60 %. Metric used to measure the prediction accuracy was the Mean Absolute Error (MAE), while the rate of the precision of recommendation was measured by using a percentage of Top-N. Based on the results of testing, it can be concluded that the multicriteria collaborative filtering method developed had much better performance than multicriteria collaborative filtering deceloped by previous researchers, which was characterized by the increasingly smaller values of MAE and a greater percentage of recommendation Top-N. The best performance was achieved by the model of Multicriteria Collaborative Filtering system that used multidimensional distance-based similarity. The application of the concept of document diversity on the generation of recommendation could contribute significantly to the increase of the precision of recommendation.

Kata Kunci : Algoritma, Collaborative, Filtering, Multicriteria, Rekomendasi, Similaritas, Jarak Multidimensi, Dekomposisi, Kombinasi, Prediksi, Akurasi, Presisi, Diversitas

