Laporkan Masalah

Studi komparatif sistem temu kembali informasi dokumen berbahasa Indonesia dengan pengukuran kemiripan menggunakan metode Cosine dan Dice serta stemming berbasis kamus dan Porter Stemmer

MUGIYONO, Arif, Drs. Agus Harjoko, M.Sc., Ph.D

2010 | Tesis | S2 Ilmu Komputer

Saat ini penyimpanan data dalam format digital dalam dunia pendidikan sangat besar. Kebutuhan untuk menemukan kembali informasi yang relevan dalam data digital tersebut sangat penting. Karena itulah diperlukan sebuah mekanisme secara otomatis untuk mencari informasi tersebut secara efektif dan efisien. Pencarian secara manual sudah tidak efektif dan efisien lagi karena banyaknya data yang tersimpan. Vector Space adalah salah satu metode dalam Information Retrieval System untuk mengukur kemiripan sebuah dokumen berdasarkan kata kunci yang diinput oleh user. Pada metode ini, query dan dokumen dianggap sebagai vektorvektor pada ruang n-dimensi, dimana n adalah jumlah dari seluruh term yang ada dalam leksikon. Leksikon adalah daftar semua term yang ada dalam indeks. Dalam penelitian ini kami membandingkan penggunaan stemming berbasis kamus dengan Porter Stemmer For Bahasa Indonesia dengan menggunakan 2 metode pengukuran jarak yaitu Cosine dan Dice. Parameter yang digunakan untuk melakukan evaluasi terhadap sistem temu kembali informasi yang dikembangkan ini adalah Precision, Recall, F-Measure dan NIAP (Non Interpolated Average Precision).

In this time, size of data storage in digital format in the world of education is so big. Need to Retrieve relevant information in digital data is importance. That's why we need a mechanism to look for information effectively and efficient automatically. Search of Information by manual is not effective and efficient again because stored data quantity. Vector Space is the one of method in information retrieval system to measures similarity a document based on keyword of user. In this method, query and document is assumed as vectors in space n-dimension, where n is count of entire lexicon existing. Lexicon is all list of term that existing in index. In this research, we compare use of stemming based on dictionary and Porter Stemmer for Indonesian Language by using two measurement of distance methods that is cosine and Dice. Parameter that used to do evaluation towards Information Retrieval system that developed is Precision, Recall, F-Measure and NIAP (Non Interpolated Average Precision).

Kata Kunci : Vector space,Information ertrieval,Term,Porter Stemmer,Bahasa Indonesia,Cosine,Dice,Precision


    Tidak tersedia file untuk ditampilkan ke publik.