Pencarian Frequent Itemset Berbasis MapReduce Pada Platform Cascading

Penulis

Amelia Nursanti

Pembimbing: Nur Rokhman, S.Si., M.Kom., Dr.


ABSTRACT: Implementation of an algorithm that runs in parallel and distributed has become an interest research object in recent decades. It is used to handle large scale data. One of programming model that used for handling big data is MapReduce using Hadoop Framework Frequent itemsets are items that most frequently appear in the dataset. Frequent itemset finding process requires massive computing and become inefficient. Implementation of finding frequent itemset becomes problematic if it is implemented on a large scale data. In this research, process of finding frequent itemset based on MapReduce using Cascading has been implemented. Source code is written in Java programming languange using Cascading API that runs on top of Hadoop Framework. Cascading is used to simplify the complexity of MapReduce. Dataset that used in this research is Amazon product co-purchasing network metadata. The result from research showed that implementation of finding frequent itemset based on MapReduce is faster than non MapReduce method for finding frequent itemset on big data.

INTISARI: Implementasi suatu algoritma yang berjalan secara paralel dan terdistribusi telah menjadi objek penelitian yang sangat diminati pada dekade terakhir ini. Hal ini dilakukan untuk menangani data berskala besar. Salah satu model pemrograman yang digunakan dalam penanganan data besar adalah MapReduce menggunakan Hadoop framework. Frequent itemset merupakan item yang paling sering muncul di dalam dataset. Proses pencarian frequent itemset memerlukan komputasi yang besar sehingga tidak efisien. Pencarian frequent itemset menjadi bermasalah jika diimplementasikan pada data berskala besar. Dalam penelitian ini diimplementasikan pencarian frequent itemset berbasis MapReduce pada platform Cascading. Penulisan kode program menggunakan bahasa pemrograman Java menggunakan Cascading API yang berjalan diatas kerangka kerja Hadoop. Cascading digunakan untuk menyederhanakan kompleksitas pemrograman MapReduce. Penelitian ini menggunakan dataset Amazon product co-purchasing network metadata. Hasil dari penelitian menujukkan bahwa pencarian frequent itemset berbasis MapReduce lebih cepat dibandingkan dengan pencarian frequent itemset menggunakan metode non MapReduce pada data berskala besar.

Kata kunci Frequent Itemset, MapReduce, Cascading, Hadoop, Amazon product co-purchasing network metadata
Program Studi S1 ILMU KOMPUTER UGM
No Inventaris
Deskripsi
Bahasa Indonesia
Jenis Skripsi
Penerbit [Yogyakarta] : Universitas Gadjah Mada, 2017
Lokasi Perpustakaan Pusat UGM
File Tulisan Lengkap dapat Dibaca di Ruang Tesis/Disertasi
  • Anda dapat mengecek ketersediaan versi cetak dari penelitian ini melalui petugas kami dengan mencatat nomor inventaris di atas (apabila ada)
  • Ketentuan Layanan:
    1. Pemustaka diperkenankan mengkopi cover, abstrak, daftar isi, bab pendahuluan, bab penutup/ kesimpulan, daftar pusatak
    2. Tidak diperbolehkan mengkopi Bab Tinjauan Pustaka, Bab Pembahasan dan Lampiran (data perusahaan/ lembaga tempat penelitian)
    3. Mengisi surat pernyataan, menyertakakan FC kartu identitas yang berlaku

<< kembali