Laporkan Masalah

PENGEMBANGAN ALGORITMA PRA PEMROSESAN UNTUK MENDUKUNG DETEKSI ANOMALI BERBASIS K-MEANS PADA AKTIVITAS TRANSAKSI PAYMENT AGGREGATOR

Reka Alamsyah, Dr. Nur Rokhman, S.Si., M.Kom

2025 | Tesis | S2 Ilmu Komputer

Sistem agregator pembayaran dengan fitur single settlement meningkatkan efisiensi transaksi. Namun, sistem ini juga memperkenalkan risiko serangan siber dan kegagalan sistem, yang dapat menyebabkan kejadian tidak normal atau anomali. Layanan middleware mencatat aktivitas transaksi dalam bentuk log. Log-log ini dapat dianalisis untuk mendeteksi anomali yang diakibatkan oleh serangan siber atau kesalahan sistem. K-Means clustering sering kali tidak efektif untuk deteksi anomali dalam data log karena formatnya yang tidak terstruktur, struktur yang tidak konsisten, dan skala fitur yang bervariasi. Studi ini mengembangkan algoritma preprocessing untuk meningkatkan kualitas data sebelum dilakukan clustering. Data log transaksi dari Juli hingga Desember 2023 digunakan, dengan langkah preprocessing meliputi normalization, standardization, dan Principal Component Analysis (PCA). K-Means clustering diterapkan menggunakan inisialisasi K-Means++, dan jumlah klaster ditentukan menggunakan algoritma kneedle. Hasil menunjukkan bahwa standardization tanpa PCA meningkatkan segmentasi, dengan rata-rata Davies-Bouldin Index (DBI) sebesar 0,2 dan efektivitas deteksi anomali dengan rata-rata recall sebesar 98%.

The payment aggregator system with a single settlement feature improves transaction efficiency. However, it also introduces risks of cyberattacks and system failures, which may lead to abnormal events or anomalies. Middleware services record transaction activities in the form of logs. These logs can be analyzed to detect anomalies resulting from cyberattacks or system errors. K-Means clustering is often ineffective for anomaly detection in log data due to its unstructured format, inconsistent structure, and varying feature scales. This study develops a preprocessing algorithm to improve data quality prior to clustering. Transaction log data from July to December 2023 was used, with preprocessing steps including normalization, standardization, and Principal Component Analysis (PCA). K-Means clustering was applied using K-Means++ initialization, and the number of clusters was determined using the kneedle algorithm. The results show that standardization without PCA enhances segmentation, achieving an average Davies-Bouldin Index (DBI) of 0.2 and anomaly detection effectiveness with an average recall of 98%.

Kata Kunci : Data Preprocessing, K-Means, Anomaly Detection, Middleware Logs, Kneedle Algorithm

  1. S2-2025-509199-abstract.pdf  
  2. S2-2025-509199-bibliography.pdf  
  3. S2-2025-509199-tableofcontent.pdf  
  4. S2-2025-509199-title.pdf