APLIKASI PENGELOMPOKAN HASIL PENCARIAN DOKUMEN BERITA MENGGUNAKAN ALGORITMA BISECTING K-MEANS

Penulis

Erric Alfajri

Pembimbing: Anny Kartika Sari, S.Si., M.Sc., Ph.D


ABSTRACT: Search for news document is common activity of internet users. To reach the information, user can use internet search engines, which can return search results depends on the keyword. Finding the information needed on the search results can be a problem, because several of subtopic are mix together in a long list of search results. Clustering feature can be implemented in search engine to present the search results in several clusters. In this research, a search engine application of news document is build. A search result clustering feature is added to the search engines. There are news sites which are used as sources for searching news documents. Google Custom Search is used for searching documents, then clustering is implemented on the search results using bisecting k-means algorithm with a library supplied by carrot2. This research produces a search engine application of news documents which can present search results based on clusters. Each cluster is represented by a label cluster. The evaluation was done on the clustering results, found that the precision is 0.57 and the cluster label quality is 0.78.

INTISARI: Penelusuran dokumen berita merupakan aktivitas umum yang dilakukan oleh pengguna internet. Dalam mendapatkan informasi, pengguna dapat menggunakan search engine yang dapat mengembalikan hasil pencarian berdasarkan sebuah kata kunci. Pencarian informasi dapat menjadi sebuah permasalahan karena terdapat beberapa subtopik dari kata kunci dicampur bersama-sama dalam satu daftar panjang. Fitur clustering dapat diimplementasikan terhadap hasil pencarian untuk mempersempit pilihan pencarian melalui teknik penyajian per-cluster. Pada penelitian ini, telah dibuat aplikasi search engine dokumen berita. Aplikasi dilengkapi dengan fitur pengelompokan hasil pencarian. Terdapat beberapa pilihan sumber situs berita yang dijadikan sumber pencarian dokumen. Google Custom Search dimanfaatkan untuk mendapatkan dokumen sesuai kriteria pencarian, setelah itu dimplementasikan clustering terhadap hasil pencarian menggunakan algoritma bisecting k-means dengan library yang disediakan oleh carrot2. Hasil dari penelitian ini adalah sebuah aplikasi search engine dokumen berita secara online yang dapat menyajikan hasil pencarian berdasarkan kelompok-kelompok. Setiap kelompok diwakili oleh label kelompok. Evaluasi dilakukan terhadap hasil clustering, didapatkan precision 0,57 dan cluster label quality 0,78.

Kata kunci clustering, bisecting k-means, carrot2, google custom search
Program Studi S1 ILMU KOMPUTER UGM
No Inventaris
Deskripsi
Bahasa Indonesia
Jenis Skripsi
Penerbit [Yogyakarta] : Universitas Gadjah Mada, 2016
Lokasi Perpustakaan Pusat UGM
File Tulisan Lengkap dapat Dibaca di Ruang Tesis/Disertasi
  • Anda dapat mengecek ketersediaan versi cetak dari penelitian ini melalui petugas kami dengan mencatat nomor inventaris di atas (apabila ada)
  • Ketentuan Layanan:
    1. Pemustaka diperkenankan mengkopi cover, abstrak, daftar isi, bab pendahuluan, bab penutup/ kesimpulan, daftar pusatak
    2. Tidak diperbolehkan mengkopi Bab Tinjauan Pustaka, Bab Pembahasan dan Lampiran (data perusahaan/ lembaga tempat penelitian)
    3. Mengisi surat pernyataan, menyertakakan FC kartu identitas yang berlaku

<< kembali