Analisis Sistem Rekomendasi Collaborative Filtering Pada Data Ternormalisasi
PANDU WICAKSONO, Lukman Heryawan, S.T., M.T
2015 | Skripsi | S1 ILMU KOMPUTERPertumbuhan yang sangat pesat pada volume dan keragaman informasi yang tersedia di web dewasa ini menimbulkan masalah baru bagi user yaitu semakin susahnya mencari konten yang relevan dengan kebutuhan user. Untuk itu dibutuhkan suatu sistem yang dapat merekomendasikan konten yang sekiranya relevan bagi user. Salah satu algoritme pada sistem rekomendasi yang populer adalah Collaborative Filtering (CF). Algoritme CF sering dipilih sebagai algoritme rekomendasi karena hasil rekomendasinya yang lebih personal sehingga dapat memberikan rekomendasi yang berbeda untuk tiap user sesuai dengan selera masing-masing user. Berbagai upaya peningkatan akurasi algoritme CF sering dilakukan, salah satunya adalah dengan normalisasi. Dalam penelitian ini akan diterapkan sistem rekomendasi menggunakan dua algoritme CF yaitu user-based dan item-based CF dengan tiga metode perhitungan similarity yang berbeda yaitu cosine similarity, pearson correlation, dan adjusted cosine. Kemudian variasi algoritme ini diuji dan dibandingkan performanya bila diterapkan pada data sebelum dan sesudah dinormalisasi dengan modified standard score. Dataset yang digunakan adalah dataset MovieLens yang berasal dari situs rekomendasi film movielens.org milik tim riset GroupLens. Hasil penelitian ini menunjukkan bahwa normalisasi data dengan modified standard score meningkatkan akurasi pada seluruh variasi algoritme item-based CF dengan rata-rata peningkatan akurasi terbesar sebesar 3,63% sedangkan pada algoritme user-based CF hanya terjadi peningkatan pada metode adjusted cosine saja. Akurasi tertinggi pada data sebelum dan sesudah dinormalisasi dihasilkan oleh algoritme user-based CF dengan metode adjusted cosine. Terbukti user-based CF mampu menghasilkan akurasi yang lebih tinggi daripada item-based CF.
The rapid growth in volume and variety of information found on the web has its own downside: finding relevant information become somewhat more difficult. This problem has led to the development of recommender systems which filters information to the likings of a certain user. One of the most popular algorithm used for recommendation systems is Collaborative Filtering (CF). CF is widely used because it delivers a more personalized recommendation thus producing different recommendations for different users based on their preference. There are various efforts that can be done to increase CF prediction accuracy, one of them is through data normalization. This research will apply two CF algortihms, user-based and item-based CF with three different similarity measurement method for each algorithm. The similarity measurement methods used are cosine similarity, pearson correlation, and adjusted cosine similarity. These various algorithms performance will then be tested and compared on data both with and without normalization. The normalization method used in this research is modified standard score which will be applied on the MovieLens dataset from the movie recommendation website movielens.org developed by the GroupLens research team. Result shows that data normalization with modified standard score improved the accuracy of all variations of the item-based CF algorithm with the highest improvement of 3,63%, but only managed to improve user-based CF just on the adjusted cosine method. The highest accuracy both before and after data normalization was achieved by user-based CF with the adjusted cosine similarity method. This proves that user-based CF can produce better accuracy than item-based CF.
Kata Kunci : Sistem rekomendasi, Collaborative Filtering, Metode similarity, Normalisasi, Akurasi