T Mug s

Studi komparatif sistem temu kembali informasi dokumen berbahasa Indonesia dengan pengukuran kemiripan menggunakan metode Cosine dan Dice serta stemming berbasis kamus dan Porter Stemmer

Penulis

Mugiyono, Arif

Pembimbing: Drs. Agus Harjoko, M.Sc., Ph.D


ABSTRACT : A Comparative Study Information Retrieval System Indonesian Language Documents With Similarity Measurement Using Cosine & Dice Method With Dictionary Stemming & Porter Stemmer By Arif Mugiyono 08/275410/PPA/02674 In this time, size of data storage in digital format in the world of education is so big. Need to Retrieve relevant information in digital data is importance. That's why we need a mechanism to look for information effectively and efficient automatically. Search of Information by manual is not effective and efficient again because stored data quantity. Vector Space is the one of method in information retrieval system to measures similarity a document based on keyword of user. In this method, query and document is assumed as vectors in space n-dimension, where n is count of entire lexicon existing. Lexicon is all list of term that existing in index. In this research, we compare use of stemming based on dictionary and Porter Stemmer for Indonesian Language by using two measurement of distance methods that is cosine and Dice. Parameter that used to do evaluation towards Information Retrieval system that developed is Precision, Recall, F-Measure and NIAP (Non Interpolated Average Precision). Keywords : Vector Space, Information Retrieval, Term, Porter Stemmer For Indonesian Language, Cosine, Dice, Precision, Recall, F-Measure dan NIAP (Non Interpolated Average Precision).

INTISARI : Studi Komparatif Sistem Temu Kembali Informasi Dokumen Bahasa Indonesia Dengan Pengukuran Kemiripan Menggunakan Metode Cosine & Dice Serta Stemming Berbasis Kamus & Porter Stemmer Oleh Arif Mugiyono 08/275410/PPA/02674 Saat ini penyimpanan data dalam format digital dalam dunia pendidikan sangat besar. Kebutuhan untuk menemukan kembali informasi yang relevan dalam data digital tersebut sangat penting. Karena itulah diperlukan sebuah mekanisme secara otomatis untuk mencari informasi tersebut secara efektif dan efisien. Pencarian secara manual sudah tidak efektif dan efisien lagi karena banyaknya data yang tersimpan. Vector Space adalah salah satu metode dalam Information Retrieval System untuk mengukur kemiripan sebuah dokumen berdasarkan kata kunci yang diinput oleh user. Pada metode ini, query dan dokumen dianggap sebagai vektorvektor pada ruang n-dimensi, dimana n adalah jumlah dari seluruh term yang ada dalam leksikon. Leksikon adalah daftar semua term yang ada dalam indeks. Dalam penelitian ini kami membandingkan penggunaan stemming berbasis kamus dengan Porter Stemmer For Bahasa Indonesia dengan menggunakan 2 metode pengukuran jarak yaitu Cosine dan Dice. Parameter yang digunakan untuk melakukan evaluasi terhadap sistem temu kembali informasi yang dikembangkan ini adalah Precision, Recall, F-Measure dan NIAP (Non Interpolated Average Precision).

Kata kunci Vector space,Information ertrieval,Term,Porter Stemmer,Bahasa Indonesia,Cosine,Dice,Precision
Program Studi S2 Ilmu Komputer UGM
No Inventaris c.1 (0007-H-2010)
Deskripsi xiv, 88 p., bibl., ills., 29 cm
Bahasa Indonesia
Jenis Tesis
Penerbit [Yogyakarta] : Universitas Gadjah Mada, 2010
Lokasi Perpustakaan Pusat UGM
File Tulisan Lengkap dapat Dibaca di Ruang Tesis/Disertasi
  • Anda dapat mengecek ketersediaan versi cetak dari penelitian ini melalui petugas kami dengan mencatat nomor inventaris di atas (apabila ada)
  • Ketentuan Layanan:
    1. Pemustaka diperkenankan mengkopi cover, abstrak, daftar isi, bab pendahuluan, bab penutup/ kesimpulan, daftar pusatak
    2. Tidak diperbolehkan mengkopi Bab Tinjauan Pustaka, Bab Pembahasan dan Lampiran (data perusahaan/ lembaga tempat penelitian)
    3. Mengisi surat pernyataan, menyertakakan FC kartu identitas yang berlaku

<< kembali