Laporkan Masalah

APLIKASI PENGELOMPOKAN HASIL PENCARIAN DOKUMEN BERITA MENGGUNAKAN ALGORITMA BISECTING K-MEANS

ERRIC ALFAJRI, Anny Kartika Sari, S.Si., M.Sc., Ph.D

2016 | Skripsi | S1 ILMU KOMPUTER

Penelusuran dokumen berita merupakan aktivitas umum yang dilakukan oleh pengguna internet. Dalam mendapatkan informasi, pengguna dapat menggunakan search engine yang dapat mengembalikan hasil pencarian berdasarkan sebuah kata kunci. Pencarian informasi dapat menjadi sebuah permasalahan karena terdapat beberapa subtopik dari kata kunci dicampur bersama-sama dalam satu daftar panjang. Fitur clustering dapat diimplementasikan terhadap hasil pencarian untuk mempersempit pilihan pencarian melalui teknik penyajian per-cluster. Pada penelitian ini, telah dibuat aplikasi search engine dokumen berita. Aplikasi dilengkapi dengan fitur pengelompokan hasil pencarian. Terdapat beberapa pilihan sumber situs berita yang dijadikan sumber pencarian dokumen. Google Custom Search dimanfaatkan untuk mendapatkan dokumen sesuai kriteria pencarian, setelah itu dimplementasikan clustering terhadap hasil pencarian menggunakan algoritma bisecting k-means dengan library yang disediakan oleh carrot2. Hasil dari penelitian ini adalah sebuah aplikasi search engine dokumen berita secara online yang dapat menyajikan hasil pencarian berdasarkan kelompok-kelompok. Setiap kelompok diwakili oleh label kelompok. Evaluasi dilakukan terhadap hasil clustering, didapatkan precision 0,57 dan cluster label quality 0,78.

Search for news document is common activity of internet users. To reach the information, user can use internet search engines, which can return search results depends on the keyword. Finding the information needed on the search results can be a problem, because several of subtopic are mix together in a long list of search results. Clustering feature can be implemented in search engine to present the search results in several clusters. In this research, a search engine application of news document is build. A search result clustering feature is added to the search engines. There are news sites which are used as sources for searching news documents. Google Custom Search is used for searching documents, then clustering is implemented on the search results using bisecting k-means algorithm with a library supplied by carrot2. This research produces a search engine application of news documents which can present search results based on clusters. Each cluster is represented by a label cluster. The evaluation was done on the clustering results, found that the precision is 0.57 and the cluster label quality is 0.78.

Kata Kunci : clustering, bisecting k-means, carrot2, google custom search

  1. S1-2016-316655-abstract.pdf  
  2. S1-2016-316655-bibliography.pdf  
  3. S1-2016-316655-tableofcontent.pdf  
  4. S1-2016-316655-title.pdf