PENENTUAN PRIORITAS PENGADAAN BUKU BERDASARKAN KATA KUNCI DARI MULTI SUMBER DATA MENGGUNAKAN BEST MATCH 25 (BM25)
Christyawan Ridanto Pitoyo, Prof. Ir. Selo, S.T., M.T., M.Sc., Ph.D., IPU, ASEAN Eng.;Dr. Indriana Hidayah, S.T., M.T.
2025 | Tesis | S2 Teknologi Informasi
Perpustakaan memiliki fungsi untuk melayani kebutuhan
masyarakat terkait informasi dan pengetahuan. Dalam menjalankan fungsi
tersebut, perpustakaan menghadapi tantangan tersendiri khususnya dalam
menentukan buku yang sesuai dengan kebutuhan masyarakat. Pengadaan buku
seringkali hanya berdasarkan buku-buku yang belum dimiliki tanpa melihat
komponen lainnya. Perpustakaan menghasilkan dan memiliki banyak data yang berpotensi
untuk digunakan dalam proses pengadaan buku. Pendekatan berbasis data digunakan
untuk melihat preferensi pengguna dan tren yang sedang berkembang. Salah satu
metode yang dapat digunakan dalam memanfaatkan data untuk prioritas pengadaan adalah
BM25.
Penelitian ini menggunakan tiga sumber data, yaitu data
peminjaman, data usulan pemustaka, dan data tren untuk mengidentifikasi kata
kunci populer. Kata kunci diperoleh menggunakan metode n-gram. Selanjutnya,
kata kunci tersebut dicocokkan dengan judul buku dari penerbit menggunakan
metode BM25 dengan lima konfigurasi parameter yang berbeda untuk melihat
konfigurasi parameter yang lebih optimal. Hasil pencocokan menghasilkan daftar
judul buku yang diurutkan berdasarkan skor BM25 tertinggi. Evaluasi dilakukan
dengan membandingkan hasil pencocokan dengan data berupa pasangan kata kunci
dan judul buku yang telah dinilai relevan oleh pustakawan.
Hasil evaluasi menunjukkan bahwa penggunaan konfigurasi
parameter BM25 yang berbeda memberikan variasi dalam efektivitas pencocokan.
Parameter BM25 terbaik ditemukan pada konfigurasi k1 sebesar
1,0 dan b sebesar 1,0 yang menghasilkan kurva Receiver Operating
Characteristic (ROC) dengan nilai Area Under Curve (AUC) sebesar 0,6507, Mean
Average Precision (MAP) sebesar 0,5046 dan Normalized Discounted Cumulative
Gain (NDCG) sebesar 0,6085. Evaluasi ini menunjukkan bahwa pendekatan yang
digunakan efektif dalam menghasilkan prioritas buku yang relevan. Validasi dari
pustakawan juga menunjukkan bahwa pustakawan menilai hasil prioritas buku
menggunakan BM25 relevan untuk mendukung proses pengadaan koleksi buku.
Libraries serve the user needs for information and
knowledge. Libraries have their own difficulties in fulfilling this role,
particularly when it comes to choosing which books to buy based on user needs.
Book procurement is often based on books that are not yet owned without looking
at other components. Libraries create and own a large amount of data that can
be used in the book procurement process. A data-driven strategy is utilized to
investigate consumer preferences and developing trends. BM25 is one approach
for using data to prioritize purchase.
This research uses three data sources, as follow borrowing
data, user suggestion data, and trend data to identify popular keywords. The
keywords are obtained using the n-gram method. In order to determine which
parameter configuration is best, the keywords are then matched with book titles
from publishers using the BM25 approach with five distinct parameter
combinations. A list of book titles arranged by highest BM25 score is generated
from the matching results. Evaluation is carried out by contrasting the
matching results with information in the form of book titles and keyword pairs
that librarians considered relevant.
According to the evaluation results, there are differences
in matching efficacy when alternative BM25 parameter setups are used. The best
BM25 parameters were found in the configuration k1 of 1,0 and
b of 1,0, which resulted in a Receiver Operating Characteristic (ROC)
curve with an Area Under Curve (AUC) value of 0,6507, Mean Average Precision (MAP)
of 0,5046 and Normalized Discounted Cumulative Gain (NDCG) of 0,6085. This
assessment demonstrates that the strategy is successful in producing pertinent
book priority. Validation from librarians also demonstrates that librarians
evaluate the output of book prioritizing using BM25 as relevant to the book
collection purchase process.
Kata Kunci : pengadaan buku, multi sumber data, BM25, natural language processing