Laporkan Masalah

Penggunaan FastText dan Word2Vec untuk Sistem Rekomendasi Kelanjutan Daftar Putar Lagu Otomatis

MUHAMMAD LUTFI F, Dr. Sri Mulyana, M.Kom.

2022 | Skripsi | S1 ILMU KOMPUTER

Musik dan daftar lagu (playlist) merupakan dua hal yang sedang mengalami peningkatan minat. Playlist lagu biasanya terdiri dari dua hal yaitu judul playlist dan daftar lagu di dalamnya. Automatic playlist continuation (APC) merupakan salah satu tugas dari sistem rekomendasi yang bertujuan untuk menambahkan lagu baru dengan karakter sesuai dengan kondisi playlist pada awalnya. Permasalahan dari berbagai sistem APC yang telah dikembangkan sebelumnya adalah pengolahan judul playlist tidak efektif, cold-start problem, dan kompleksitas sistem. Penelitian ini mencoba membangun sistem APC dengan input yang sederhana menggunakan arsitektur FastText dan Word2Vec. Kedua arsitektur ini dapat menghasilkan word embedding dari setiap kata (word) yang dipelajari. Word embedding merupakan cara untuk merepresentasikan bentuk kata yang awalnya berupa teks menjadi bentuk vektor. Dengan menggunakan informasi bentuk vektor dari word ini, setiap dua word dapat dicari nilai kesamaannya atau kedekatannya sehingga dapat dijadikan sebagai dasar rekomendasi. Sistem yang dikembangkan menghasilkan nilai R-Precision sebesar 0,2092, 0,2551, 0,2637, dan 0,2257 dan nilai NDCG sebesar 0,0217, 0,0262, 0,0266, dan 0,0245 untuk kondisi cold-start hanya judul playlist, judul playlist dan 1 track, judul playlist dan 5 track, dan hanya 5 track secara berurutan. Dibandingkan dengan model- model sebelumnya, sistem ini memiliki performa lebih tinggi secara kuantitas yang ditunjukkan oleh nilai R-Precision tetapi lebih rendah secara kualitas pengurutan yang ditunjukkan oleh nilai NDCG.

Music and playlists are two things that are experiencing increasing interest. A song playlist usually consists of two things, namely the title of the playlist and the list of songs in it. Automatic playlist continuation (APC) is a version of a recommendation system whose purpose is to add new songs or songs with suitable characteristics to the original playlist condition. The problem of recent various previously developed APC systems is not efficient at playlist title processing, cold-start problem, and system complexity. This research tried to build an APC system with simple inputs using FastText and Word2Vec architecture. Both of these architectures can produce word embedding of each word that is trained. Word embedding is a way to represent a word that was originally in text form in vector form. By using the vector form information of this word, every two words can be searched for the similarity or proximity values which can be used as the basis for recommendations. The developed system resulted in R-Precision values of 0.2092, 0.2551, 0.2637, and 0.2257 and NDCG values of 0.0217, 0.0262, 0.0266, and 0.0245 for cold-start conditions only title, title and 1 song, title and 5 songs, and only 5 songs consecutively. Compared to other previously developed models, this system has better performance at the quantity shown by its R-Precision value but has lower performance at sorting quality shown by its NDCG value.

Kata Kunci : Sistem Rekomendasi, Musik, Daftar Putar Lagu, Pemrosesan Bahasa Natural, Word Embedding, FastText, Word2Vec