Laporkan Masalah

Pencarian Frequent Itemset Berbasis MapReduce Pada Platform Cascading

AMELIA NURSANTI, Nur Rokhman, S.Si., M.Kom., Dr.

2017 | Skripsi | S1 ILMU KOMPUTER

Implementasi suatu algoritma yang berjalan secara paralel dan terdistribusi telah menjadi objek penelitian yang sangat diminati pada dekade terakhir ini. Hal ini dilakukan untuk menangani data berskala besar. Salah satu model pemrograman yang digunakan dalam penanganan data besar adalah MapReduce menggunakan Hadoop framework. Frequent itemset merupakan item yang paling sering muncul di dalam dataset. Proses pencarian frequent itemset memerlukan komputasi yang besar sehingga tidak efisien. Pencarian frequent itemset menjadi bermasalah jika diimplementasikan pada data berskala besar. Dalam penelitian ini diimplementasikan pencarian frequent itemset berbasis MapReduce pada platform Cascading. Penulisan kode program menggunakan bahasa pemrograman Java menggunakan Cascading API yang berjalan diatas kerangka kerja Hadoop. Cascading digunakan untuk menyederhanakan kompleksitas pemrograman MapReduce. Penelitian ini menggunakan dataset Amazon product co-purchasing network metadata. Hasil dari penelitian menujukkan bahwa pencarian frequent itemset berbasis MapReduce lebih cepat dibandingkan dengan pencarian frequent itemset menggunakan metode non MapReduce pada data berskala besar.

Implementation of an algorithm that runs in parallel and distributed has become an interest research object in recent decades. It is used to handle large scale data. One of programming model that used for handling big data is MapReduce using Hadoop Framework Frequent itemsets are items that most frequently appear in the dataset. Frequent itemset finding process requires massive computing and become inefficient. Implementation of finding frequent itemset becomes problematic if it is implemented on a large scale data. In this research, process of finding frequent itemset based on MapReduce using Cascading has been implemented. Source code is written in Java programming languange using Cascading API that runs on top of Hadoop Framework. Cascading is used to simplify the complexity of MapReduce. Dataset that used in this research is Amazon product co-purchasing network metadata. The result from research showed that implementation of finding frequent itemset based on MapReduce is faster than non MapReduce method for finding frequent itemset on big data.

Kata Kunci : Frequent Itemset, MapReduce, Cascading, Hadoop, Amazon product co-purchasing network metadata