SISTEM TEMU KEMBALI INFORMASI DALAM MESIN PENCARIAN MENGGUNAKAN MODEL RUANG VEKTOR DAN INVERTED INDEX

Penulis

Fika Hastarita Rachman

Pembimbing: Ir. P. Insap Santosa, M.Sc., Ph.D.,


ABSTRACT: The annual addition of Thesis Publication Paper of Electrical Engineering Post Graduate School has caused the requirement of faster and more reliable searching tools. The application of information retrieval system of each documents, is expected to address such requirement. The searching system currently applied has still been using word matching system based on keywords of the paper’s title or author. This has caused each document found is only relevant to its title or author, but not to its content. Therefore, many other relevant documents can’t be found. The information retrieval system has several parts to obtain results. Stemming is one of the preprocessing parts. This study performed analysis on search engine of information retrieval system for publication paper abstracts using preprocessing, inverted index, quantifying of tf-idf and vector space model. On system testing it’s found that the application of stemming can generate searched documents with recall rate greater then system without using stemming, amount to 84,7%. This means that stemming can improve search performance, especially for the completeness of the acquisition of the documents that the user wants.

INTISARI: Pertambahan data Naskah Publikasi Tesis S2 Teknik Elektro setiap tahunnya menjadi penyebab semakin dibutuhkannya sarana untuk pencarian data yang lebih cepat dan sesuai dengan keinginan pengguna. Penerapan sistem temu kembali informasi terhadap koleksi dokumen, diharapkan mampu menjawab kebutuhan tersebut. Pencarian yang telah digunakan masih bersifat word maching, berdasarkan kata kunci pada judul ataupun penyusunnya. Hal ini menyebabkan munculnya dokumen yang hanya relevan berdasarkan judulnya atau penyusunnya saja, tetapi tidak berdasarkan isi dari dokumen tersebut. Sehingga banyak dokumen relevan yang tidak terpanggil. Sistem temu kembali informasi memiliki beberapa bagian untuk memperoleh hasil pencarian. Stemming adalah salah satu bagian dari preprocessing. Penelitian ini melakukan kajian penerapan sistem temu kembali informasi dalam mesin pencarian abstrak naskah publikasi tesis dengan menggunakan preprocessing, inverted index, pembobotan tf-idf dan model pencarian ruang vektor. Pada pengujian sistem diperoleh hasil bahwa penggunaan stemming mampu menghasilkan dokumen pencarian dengan tingkat recall lebih besar daripada sistem tanpa menggunakan stemming, yaitu sebesar 84,7%. Hal ini berarti stemming mampu meningkatkan performa pencarian, terutama untuk hal kelengkapan perolehan dokumen yang diinginkan pengguna.

Kata kunci sistem temu kembali informasi, stemming, recall
Program Studi S2 Teknik Elektro UGM
No Inventaris 2826-H-2011
Deskripsi xiv, 85 p., bibl., ills., 29 cm.
Bahasa Indonesia
Jenis Tesis
Penerbit [Yogyakarta] : Universitas Gadjah Mada, 2011
Lokasi Perpustakaan Pusat UGM
File Tulisan Lengkap dapat Dibaca di Ruang Tesis/Disertasi
  • Anda dapat mengecek ketersediaan versi cetak dari penelitian ini melalui petugas kami dengan mencatat nomor inventaris di atas (apabila ada)
  • Ketentuan Layanan:
    1. Pemustaka diperkenankan mengkopi cover, abstrak, daftar isi, bab pendahuluan, bab penutup/ kesimpulan, daftar pusatak
    2. Tidak diperbolehkan mengkopi Bab Tinjauan Pustaka, Bab Pembahasan dan Lampiran (data perusahaan/ lembaga tempat penelitian)
    3. Mengisi surat pernyataan, menyertakakan FC kartu identitas yang berlaku

<< kembali