Laporkan Masalah

Rancang bangun sistem pencari kemiripan dokumen untuk pengelolaan basis data jurnal kedokteran berbasis web

UTOMO, Mardi Siswo, Drs. Edi Winarko, M.Sc., Ph.D

2010 | Tesis | S2 Ilmu Komputer

Kemiripan dokumen (Document Similarity) dapat digunakan menjadi acuan pencarian informasi-informasi yang sejenis. Dengan kemampuan pencarian kemiripan diharapkan dapat mengurangi waktu temu-kembali informasi untuk dokumen berikutnya yang sejenis. Kemampuan pencarian kemiripan dokumen biasanya diimplementasikan pada fitur ’artikel terkait”. Kemiripan dokumen dapat diukur dengan cosine, dengan dilakukan preprosesing terlebih dahulu pada dokumen yang akan diukur. Proses pengindekan dan pengukuran membutuhkan waktu eksekusi yang relatif lama. Masalah pada aplikasi berbasis web untuk melakukan proses indek dan pengukuran kemiripan adalah waktu eksekusi yang terbatas, sehingga pemrosesan indek dan pengukuran kemiripan pada aplikasi berbasis web dibutuhkan teknik pemrograman tersendiri. Tujuan dari penelitian ini adalah merancang dan membuat sebuah perangkat lunak aplikasi berbasis web untuk memberikan kemampuan pada aplikasi pengelolaan basis data jurnal kedokteran berbahasa Indonesia untuk mencari dokumen-dokumen lain yang mirip dengan dokumen yang sedang di baca pada saat itu. Hasil dari penelitian ini adalah dengan mekanisme javascript autoreload dan penggunaan cookies dan session dapat memecah proses indek dan pengukuran similaritas menjadi beberapa bagian kecil, sehingga proses dapat dilakukan pada aplikasi berbasis web dan pada jumlah dokumen yang relatif besar. Hasil pengukuran kemiripan dengan cosine pada kasus jurnal kedokteran berbahasa Indonesia Mediamedika Indonesiana mempunyai akurasi yang cukup tinggi yaitu 90%.

Document similarity can be used as a reference for other information searches similar. So as to reduce the time-re-appointment for information following a similar document. Document similarity search capability is usually implemented on the features 'related articles'. Similarity of documents can be measured with a cosine, with preprosesing conducted prior to the document that will be measured. The indexing process and the measurement takes a relatively long excecution time. Problems with a web-based application to conduct the process and measuring the similarity index is a limited execution time, so the processing index and similarity measure in web-based application needs its own programming techniques. Problems with a web-based application to conduct the process and measuring the similarity index is a limited execution time, so the processing index and similarity measure in web-based application needs its own programming techniques. The purpose of this research is to design and create a software that give capability for web-based database management system of medical journals in Indonesian language to find other documents similar to the current document in reading at the time. The results of this research is the mechanism autoreload javascript and session cookies and can break down the process and measurement index similaritas into several small sections, so the process can be performed on web-based applications and the number of relatively large documents. Results with the cosine similarity measure in the case of Indonesian-language medical journal “Media medika Indonesiana” has a fairly high accuracy of 90%.

Kata Kunci : Kemiripan dokumen,Pengukuran cosine,Aplikasi berbasis web, document similarity, cosine measure, web-based application


    Tidak tersedia file untuk ditampilkan ke publik.