Laporkan Masalah

SISTEM TEMU KEMBALI INFORMASI DALAM MESIN PENCARIAN MENGGUNAKAN MODEL RUANG VEKTOR DAN INVERTED INDEX

Fika Hastarita Rachman, Ir. P. Insap Santosa, M.Sc., Ph.D.,

2011 | Tesis | S2 Teknik Elektro

Pertambahan data Naskah Publikasi Tesis S2 Teknik Elektro setiap tahunnya menjadi penyebab semakin dibutuhkannya sarana untuk pencarian data yang lebih cepat dan sesuai dengan keinginan pengguna. Penerapan sistem temu kembali informasi terhadap koleksi dokumen, diharapkan mampu menjawab kebutuhan tersebut. Pencarian yang telah digunakan masih bersifat word maching, berdasarkan kata kunci pada judul ataupun penyusunnya. Hal ini menyebabkan munculnya dokumen yang hanya relevan berdasarkan judulnya atau penyusunnya saja, tetapi tidak berdasarkan isi dari dokumen tersebut. Sehingga banyak dokumen relevan yang tidak terpanggil. Sistem temu kembali informasi memiliki beberapa bagian untuk memperoleh hasil pencarian. Stemming adalah salah satu bagian dari preprocessing. Penelitian ini melakukan kajian penerapan sistem temu kembali informasi dalam mesin pencarian abstrak naskah publikasi tesis dengan menggunakan preprocessing, inverted index, pembobotan tf-idf dan model pencarian ruang vektor. Pada pengujian sistem diperoleh hasil bahwa penggunaan stemming mampu menghasilkan dokumen pencarian dengan tingkat recall lebih besar daripada sistem tanpa menggunakan stemming, yaitu sebesar 84,7%. Hal ini berarti stemming mampu meningkatkan performa pencarian, terutama untuk hal kelengkapan perolehan dokumen yang diinginkan pengguna.

The annual addition of Thesis Publication Paper of Electrical Engineering Post Graduate School has caused the requirement of faster and more reliable searching tools. The application of information retrieval system of each documents, is expected to address such requirement. The searching system currently applied has still been using word matching system based on keywords of the paper’s title or author. This has caused each document found is only relevant to its title or author, but not to its content. Therefore, many other relevant documents can’t be found. The information retrieval system has several parts to obtain results. Stemming is one of the preprocessing parts. This study performed analysis on search engine of information retrieval system for publication paper abstracts using preprocessing, inverted index, quantifying of tf-idf and vector space model. On system testing it’s found that the application of stemming can generate searched documents with recall rate greater then system without using stemming, amount to 84,7%. This means that stemming can improve search performance, especially for the completeness of the acquisition of the documents that the user wants.

Kata Kunci : sistem temu kembali informasi, stemming, recall


    Tidak tersedia file untuk ditampilkan ke publik.