Laporkan Masalah

INFORMATION RETRIEVAL PADA DIGITAL LIBRARY MENGGUNAKAN LATENT SEMANTIC INDEXING; INFORMATION RETRIEVAL IN DIGITAL LIBRARY USING LATENT SEMANTIC INDEXING

TATI ADITYANTI, Sigit Priyanta

2012 | Skripsi | PROGRAM STUDI ILMU KOMPUTER

Teknologi yang semakin maju menyebabkan penyimpanan informasi mudah dilakukan. Informasi yang disimpan memerlukan teknik pengambilan yang baik karena informasi tersebut sewaktu-waktu akan diambil kembali dengan harapan hasil pengambilan informasi sesuai dengan kebutuhan. Teknik pengambilan informasi ini disebut information retrieval atau temu-kembali informasi. Information retrieval memiliki tujuan untuk mendapatkan informasi yang relevan dengan kata kunci yang diberikan pengguna. Untuk mendapatkan informasi yang relevan information retrieval memiliki banyak metode yang dapat digunakan. Pada penelitian ini metode information retrieval yang digunakan adalah latent semantic indexing dengan singular value decomposition. Latent semantic indexing memiliki kemampuan untuk mendapatkan dokumen relevan dengan mengaplikasikan perhitungan singular value decomposition dimana dokumen dan kata kunci pengguna diubah menjadi matriks sehingga memiliki nilai vektor yang akan digunakan untuk menghitung kesamaannya. Sistem information retrieval mengolah dokumen dengan membuat indeks kata yang melalui beberapa tahapan yaitu tokenisasi, stemming dan penghilangan stopwords. Proses berikutnya adalah menentukan nilai vektor menggunakan perhitungan singular value decomposition. Kata kunci (query) pengguna juga melalui proses yang sama. Nilai vektor dokumen dan query ini dihitung nilai kesamaannya menggunakan cosine similarity, dan diurutkan berdasarkan relevansinya. Hasil implementasi latent semantic indexing menunjukkan bahwa sistem mampu untuk menemukan dokumen yang relevan dengan kata kunci walaupun dibutuhkan proses yang cukup lama. Kinerja sistem diukur dengan recall dan precision.

Kata Kunci : information retrieval, latent semantic indexing, singular value decomposition


    Tidak tersedia file untuk ditampilkan ke publik.