Laporkan Masalah

APLIKASI PENCARIAN BERITA UNTUK MEDIA MONITORING DENGAN MENGGUNAKAN WEB CRAWLER DAN GOOGLE CUSTOM SEARCH API

ZYGA NUR MUSLIMAH, I Gede Mujiyatna, S. Kom., M. Kom.

2015 | Skripsi | S1 ILMU KOMPUTER

Perusahaan melakukan media monitoring untuk mengetahui seperti apa reaksi publik terhadap produk yang mereka keluarkan. Umumnya, sebuah perusahaan memiliki pemonitor media yang bertugas untuk mencari berita-berita di media online publik dan membuat rangkuman dari berita-berita yang telah dikumpulkan. Diperlukan suatu alat bantu pencarian yang dapat mengecek secara langsung apakah berita memuat konten yang dimaksud atau tidak. Aplikasi yang dibuat pada penelitian ini adalah aplikasi yang akan mencari berita mengenai produk teknologi informasi pada beberapa situs media online Indonesia dengan menggunakan web crawler Google Non-API dan Google Custom Search API. Berita-berita yang didapat dari hasil pencarian ini akan dibuka dan dibaca menggunakan regular expressions oleh sistem kemudian akan diambil kesimpulan apakah berita tersebut memuat kata kunci pencarian produk atau tidak. Pada penelitian ini juga akan dibandingkan beberapa aspek yang dimiliki oleh web crawler Google Non-API dan Google Custom Search API yaitu kecepatan pencarian berita, ketepatan hasil pencarian berita, dan berita hasil pencarian sistem pencarian berita. Hasil pengujian pencarian berita dengan menggunakan web crawler Google Non-API dan Google Custom Search API menunjukkan bahwa pencarian berita dengan Google Custom Search API lebih cepat dibandingkan dengan web crawler Google Non-API. Pencarian berita menggunakan web crawler Google Non-API berpeluang diblokir oleh Google, namun tidak pada Google Custom Search API.

In order to identify how public reacts on their products, media monitoring is being applied by companies. Generally, a company executes media monitoring by assigning someone as media monitor who is being tasked to find and summarize news that are found on public online medias. Therefore, a searching tool that can check directly whether the news contains correlated contents or not is needed. The main purpose of this research is to create an application that retrieve IT products related news from various Indonesian online media by using web crawler Google Non-API and Google Custom Search API. By using regular expressions, this application detect whether the retrieved news contain correlated keywords or not. This research also serves its purpose as a comparator between web crawler Google Non-API and Google Custom Search API which compare few aspects such as running time, accuracy, and the search results. The test results of news searching using web crawler Google Non-API and Google Custom Search API show that news searching using Google Custom Search API is faster than using web crawler Google Non-API. News searching using web crawler Google Non-API has a chance to be blocked by Google, but not for Google Custom Search API.

Kata Kunci : Media monitoring, Web crawler, Google Custom Search API

  1. S1-2015-305315-abstract.pdf  
  2. S1-2015-305315-bibliography.pdf  
  3. S1-2015-305315-tableofcontent.pdf  
  4. S1-2015-305315-title.pdf