Laporkan Masalah

A Comparative Cost-Performance Analysis of OLAP Data Architectures for Supply Chain Performance Monitoring: Cloud versus On-Premise Deployment

Adzkia Khansa Meara, Dr.Eng. Silmi Fauziati, S.T., M.T.; Ir. Azkario Rizky Pratama, S.T., M.Eng., Ph.D.

2025 | Skripsi | TEKNOLOGI INFORMASI

Perkembangan teknologi digital dalam industri manufaktur mendorong kebutuhan akan sistem pemrosesan data yang efisien, khususnya dalam konteks produksi Engineer-to-Order (ETO). Tantangan utama yang dihadapi adalah pemilihan arsitektur data yang tepat antara sistem cloud dan on-premise, terutama dalam menangani proses transformasi data analitikal. Dalam hal ini, pengaruh arsitektur terhadap kecepatan eksekusi dan efisiensi biaya menjadi aspek krusial bagi perusahaan dalam menghadapi transformasi digital. Penelitian ini bertujuan untuk membandingkan performa dan biaya dari dua arsitektur data analitik, yakni cloud-native yang menggunakan layanan Amazon Web Services, serta sistem on-premise berbasis ekosistem Hadoop. Metode yang digunakan mencakup implementasi pipeline ETL yang terdiri atas beberapa tahap pemrosesan data (ingestion, cleaning, dicing, groupby, roll up, summary, sorting, dan output), evaluasi performa berdasarkan metrik waktu eksekusi dan throughput, serta analisis statistik menggunakan uji Wilcoxon Sign Ranked guna memvalidasi perbedaan performa secara signifikan. Hasil pengujian menunjukkan bahwa platform on-premise menyelesaikan proses cleaning hingga 31,6% lebih cepat dan dicing hingga 30,8% lebih cepat dibandingkan cloud. Sebaliknya, cloud menunjukkan keunggulan dalam tahap sorting dengan waktu eksekusi 22,2% lebih cepat. Dari sisi biaya, arsitektur cloud memerlukan total biaya bulanan sebesar Rp11,60 juta, lebih tinggi dibandingkan on-premise yang hanya memerlukan Rp7,78 juta. Temuan ini menunjukkan bahwa pemilihan arsitektur data perlu mempertimbangkan karakteristik beban kerja serta kebutuhan organisasi terhadap efisiensi operasional.

The rise of digital transformation in manufacturing has created a growing need for efficient data processing systems, especially in Engineer-to-Order (ETO) production.

One of the main challenges is selecting the right data architecture, cloud or on-premise, for managing analytical workloads. In this context, performance and cost efficiency become key considerations for organizations aiming to modernize their infrastructure. This study compares the performance and monthly operational costs of two data architectures: a cloud-native platform using Amazon Web Services (AWS), and an on-premise solution based on the Hadoop ecosystem. The ETL pipeline implemented in both platforms consists of several stages: ingestion, cleaning, dicing, grouping, rollup, summary, sorting, and output. Each platform was evaluated using two performance metrics, execution time and throughput. Statistical testing using the Wilcoxon Signed-Ranked Test was also conducted to validate the significance of the performance gap. The results reveal that the on-premise platform performed better in CPU- and memory-intensive stages, completing cleaning up to 31.6?ster and dicing up to 30.8?ster than the cloud. Meanwhile, the cloud architecture showed superior performance in I/O-intensive stages, with sorting executed 22.2?ster than on-premise. In terms of cost, the cloud infrastructure incurred a higher monthly expense of IDR 11.60 million, while the on-premise alternative cost only IDR 7.78 million. These findings suggest that the decision to adopt cloud or on-premise solutions should consider workload characteristics and long-term strategic goals for operational efficiency.

Kata Kunci : Arsitektur Data, ETL, Komputasi Awan, Analisis Biaya, Evaluasi Per- forma, Manufaktur

  1. S1-2025-473474-abstract.pdf  
  2. S1-2025-473474-bibliography.pdf  
  3. S1-2025-473474-tableofcontent.pdf  
  4. S1-2025-473474-title.pdf