Laporkan Masalah

Pengembangan Workflow Big Data dengan Pendekatan Time Series Menggunakan Spark-SQL Dalam Studi Kasus Data Transaksi Bus Rapid Transit di Jakarta

YOSEF BRIAN YUDHALAKSANA, Noor Akhmad Setiawan, S.T., M.T., Ph.D. ; Dani Adhipta, S.Si, M.T.

2017 | Skripsi | S1 TEKNOLOGI INFORMASI

Pada era digital ini, kebutuhan akan pengolahan big data di berbagai bidang semakin meningkat. Salah satu perusahaan penyedia layanan transportasi publik Bus Rapid Transit (BRT) di Jakarta harus mengolah data transaksi yang sangat besar setiap harinya. Akibat tools yang digunakan masih konvensional, kebutuhan mereka untuk menampilkan data tersebut ke dalam bentuk time series menjadi terkendala. Untuk menampilkan data transaksi BRT tersebut ke dalam bentuk time series dengan cepat, penerapan konsep big data dapat menjadi solusi. Perlu dibuat suatu workflow yang mampu melakukan aggregasi data dan menampilkan data dalam bentuk time series dengan cepat. Saat ini, banyak teknologi yang dapat digunakan untuk mengembangkan workflow tersebut, salah satunya adalah Spark-SQL. Spark-SQL dirancang untuk melakukan komputasi secara paralel dengan cepat. Hasil pengembangan menggunakan Spark-SQL yang didapatkan menunjukkan bahwa workflow yang dikembangkan mampu melakukan pengelompokan dan agregasi data transaksi BRT berdasarkan kurun waktu.

In this digital era, the need for big data processing in various fields is increasing. One of the public transportation service provider Bus Rapid Transit (BRT) in Jakarta must process a very large transaction data every day. Due to the tools used are still conventional, their need to display the data into the form of time series becomes constrained. To display BRT transaction data in the form of time series, application of big data concept can be a solution. It is necessary to create a workflow that can aggregate data and display data in the form of time series quickly. Currently, many technologies can be used to develop such workflows, one of which is Spark-SQL. Spark-SQL is designed to compute in parallel quickly. The development results show that the developed workflow are able to group and aggregate BRT transaction data based on transaction time.

Kata Kunci : Big data, Apache Spark, Spark-SQL, BRT

  1. S1-2017-348204-abstract.pdf  
  2. S1-2017-348204-bibliography.pdf  
  3. S1-2017-348204-tableofcontent.pdf  
  4. S1-2017-348204-title.pdf