Laporkan Masalah

PENGUJIAN SIMILARITAS BERITA MENGGUNAKAN METODE RABIN KARP

RINTO ACHMAD SULCHANANTO, Janoe Hendarto, Drs., M.I.Kom

2017 | Skripsi | S1 ILMU KOMPUTER

Perkembangan peminat berita berbasis online didorong oleh dua hal, yang pertama adalah semakin mudahnya masyarakat Indonesia untuk memperoleh internet terutama secara broadband wireless. Yang kedua adalah peningkatan jumlah pengguna smartphone di Indonesia. Dengan bertambahnya peminat berita online, maka bermunculan situs berita dan informasi yang tidak mempedulikan kualitas isi berita. Sehingga diperlukan sistem yang dapat digunakan tolok ukur untuk menentukan similaritas berita. Metode yang dapat digunakan adalah menggunakan Rabin-Karp. Rabin-Karp unggul dalam pencarian string dengan pola yang panjang. Metode Rabin-Karp dalam sistem ini memiliki langkah-langkah preprosesing, penghitungan k-gram menggunakan proses parsing, hashing serta menghitung similiaritas menggunakan dice coefficient. Dalam preprosesing dilakukan stemming menggunakan Algoritma Nazief-Adriani. Pada sistem ini dilakukan modifikasi yakni ketika dokumen akan di parsing akan dilakukan pengurutan kata terlebih dahulu dan sistem memiliki nilai k-gram awal 4. Hasil yang didapatkan dari penelitian ini adalah, sistem dapat menentukan tingkat similaritas berita dengan rata-rata tingkat kesalahan 6,13%.

The development of online-based news enthusiasts is driven by two things, the first is the easier the Indonesia people to obtain internet especially using broadband wireless. The second is the increasing number of smartphone users in Indonesia. The presence of smartphones make it easier for users to get news information anywhere. With the addition of online news enthusiasts, the emergence of news and information sites that do not care about the quality of news content. Many news sites often just copy pastes from other sites. So we need a system that can be used benchmarks to determine the news similarity. The method that can be used is using Rabin-Karp. Rabin-Karp excels in the search string with a long pattern. The Rabin-Karp method in this system has preprocessing, hashing and calculating similiarity steps using dice coeficient. In preprocessing is done with stemming using Nazief-Adriani Algorithm. There is modifications in this system parsing process, there are words sorting and the system has an initial k-gram value 4. The results obtained from this research is, the system can determine the level of news similarity with the average error rate of 6,13%.

Kata Kunci : algoritma Rabin-Karp, similaritas berita, stemming, dice coefficient

  1. S1-2017-283670-abstract.pdf  
  2. S1-2017-283670-bibliography.pdf  
  3. S1-2017-283670-tableofcontent.pdf  
  4. S1-2017-283670-title.pdf