PENERAPAN ALGORITMA RABIN-KARP DALAM MENCARI PERSENTASE KEMIRIPAN (SIMILARITY) ISI DUA DOKUMEN TEKS BERBAHASA INDONESIA
YUNI RIYANTI, Nur Rokhman
2012 | Skripsi | PROGRAM STUDI ILMU KOMPUTERPemeriksaan isi dokumen memerlukan waktu lama dan ketelitian yang tinggi jika dilakukan secara manual. Pemeriksaan secara cepat dan tepat sangat dibutuhkan untuk mendeteksi penduplikatan dokumen. Oleh karena itu, diperlukan suatu sistem yang dapat membandingkan dua dokumen secara terkomputerisasi. Salah satu metode yang digunakan untuk pembuatan sistem tersebut adalah algoritma Rabin-Karp. Tahap awal proses pembandingan dokumen dalam sistem ini adalah preprocessing. Tahap tersebut terdiri dari casefolding, tokenizing, filtering dan stemming. Hasil dari tahap preprocessing adalah sebuah dokumen yang seluruh isinya telah berubah menjadi kata dasar. Kata dasar inilah yang akan diproses menggunakan algoritma Rabin-Karp. Hasil akhir proses pembandingan dokumen ini adalah nilai similarity yang dihitung dari jumlah kata dan jumlah selisih kata kedua dokumen tersebut. Berdasarkan hasil pengujian, sistem mampu melakukan pembandingan dokumen dan melakukan perhitungan persentase kemiripan (similarity) dokumen tersebut.
Kata Kunci : pembandingan dokumen, rabin-karp, similarity