Laporkan Masalah

PENENTUAN PRIORITAS PENGADAAN BUKU BERDASARKAN KATA KUNCI DARI MULTI SUMBER DATA MENGGUNAKAN BEST MATCH 25 (BM25)

Christyawan Ridanto Pitoyo, Prof. Ir. Selo, S.T., M.T., M.Sc., Ph.D., IPU, ASEAN Eng.;Dr. Indriana Hidayah, S.T., M.T.

2025 | Tesis | S2 Teknologi Informasi

Perpustakaan memiliki fungsi untuk melayani kebutuhan masyarakat terkait informasi dan pengetahuan. Dalam menjalankan fungsi tersebut, perpustakaan menghadapi tantangan tersendiri khususnya dalam menentukan buku yang sesuai dengan kebutuhan masyarakat. Pengadaan buku seringkali hanya berdasarkan buku-buku yang belum dimiliki tanpa melihat komponen lainnya. Perpustakaan menghasilkan dan memiliki banyak data yang berpotensi untuk digunakan dalam proses pengadaan buku. Pendekatan berbasis data digunakan untuk melihat preferensi pengguna dan tren yang sedang berkembang. Salah satu metode yang dapat digunakan dalam memanfaatkan data untuk prioritas pengadaan adalah BM25.

Penelitian ini menggunakan tiga sumber data, yaitu data peminjaman, data usulan pemustaka, dan data tren untuk mengidentifikasi kata kunci populer. Kata kunci diperoleh menggunakan metode n-gram. Selanjutnya, kata kunci tersebut dicocokkan dengan judul buku dari penerbit menggunakan metode BM25 dengan lima konfigurasi parameter yang berbeda untuk melihat konfigurasi parameter yang lebih optimal. Hasil pencocokan menghasilkan daftar judul buku yang diurutkan berdasarkan skor BM25 tertinggi. Evaluasi dilakukan dengan membandingkan hasil pencocokan dengan data berupa pasangan kata kunci dan judul buku yang telah dinilai relevan oleh pustakawan.

Hasil evaluasi menunjukkan bahwa penggunaan konfigurasi parameter BM25 yang berbeda memberikan variasi dalam efektivitas pencocokan. Parameter BM25 terbaik ditemukan pada konfigurasi k1 sebesar 1,0 dan b sebesar 1,0 yang menghasilkan kurva Receiver Operating Characteristic (ROC) dengan nilai Area Under Curve (AUC) sebesar 0,6507, Mean Average Precision (MAP) sebesar 0,5046 dan Normalized Discounted Cumulative Gain (NDCG) sebesar 0,6085. Evaluasi ini menunjukkan bahwa pendekatan yang digunakan efektif dalam menghasilkan prioritas buku yang relevan. Validasi dari pustakawan juga menunjukkan bahwa pustakawan menilai hasil prioritas buku menggunakan BM25 relevan untuk mendukung proses pengadaan koleksi buku.

Libraries serve the user needs for information and knowledge. Libraries have their own difficulties in fulfilling this role, particularly when it comes to choosing which books to buy based on user needs. Book procurement is often based on books that are not yet owned without looking at other components. Libraries create and own a large amount of data that can be used in the book procurement process. A data-driven strategy is utilized to investigate consumer preferences and developing trends. BM25 is one approach for using data to prioritize purchase.

This research uses three data sources, as follow borrowing data, user suggestion data, and trend data to identify popular keywords. The keywords are obtained using the n-gram method. In order to determine which parameter configuration is best, the keywords are then matched with book titles from publishers using the BM25 approach with five distinct parameter combinations. A list of book titles arranged by highest BM25 score is generated from the matching results. Evaluation is carried out by contrasting the matching results with information in the form of book titles and keyword pairs that librarians considered relevant.

According to the evaluation results, there are differences in matching efficacy when alternative BM25 parameter setups are used. The best BM25 parameters were found in the configuration k1 of 1,0 and b of 1,0, which resulted in a Receiver Operating Characteristic (ROC) curve with an Area Under Curve (AUC) value of 0,6507, Mean Average Precision (MAP) of 0,5046 and Normalized Discounted Cumulative Gain (NDCG) of 0,6085. This assessment demonstrates that the strategy is successful in producing pertinent book priority. Validation from librarians also demonstrates that librarians evaluate the output of book prioritizing using BM25 as relevant to the book collection purchase process.

Kata Kunci : pengadaan buku, multi sumber data, BM25, natural language processing

  1. S2-2025-526351-abstract.pdf  
  2. S2-2025-526351-bibliography.pdf  
  3. S2-2025-526351-tableofcontent.pdf  
  4. S2-2025-526351-title.pdf