Perbandingan K-Means dan Fuzzy C-Means dalam Segmentasi Pelanggan untuk Penerapan Aturan Asosiasi Menggunakan Algoritma Apriori
Novendra Muchtar Arsada, Prof. Dr. Abdurakhman, S.Si., M.Si.
2025 | Skripsi | STATISTIKAPerkembangan industri e-commerce menghasilkan data transaksi pelanggan dalam jumlah besar, yang dapat dimanfaatkan untuk meningkatkan efektivitas strategi pemasaran. Segmentasi pelanggan diperlukan untuk memahami karakteristik perilaku belanja. Penelitian ini bertujuan untuk membandingkan performa metode K-Means dan Fuzzy C-Means dalam segmentasi pelanggan berbasis metode Recency, Frequency, Monetary (RFM), serta mengevaluasi pengaruh segmentasi pelanggan terhadap aturan asosiasi yang dihasilkan oleh algoritma Apriori. Penelitian ini menggunkan dataset online retail dengan penerapan metode K-Means dan Fuzzy C-Means untuk segmentasi pelanggan, serta validasi klaster menggunakan Silhouette Coefficient, Davies-Bouldin Index, dan Calinski-Harabasz Index yang menghasilkan jumlah klaster optimal sejumlah tiga klaster untuk K-Means dan Fuzzy C-Means. Algoritma Apriori diterapkan pada tiap klaster untuk memperoleh aturan asosiasi produk berdasarkan metrik support, confidence, dan lift. Hasil penelitian menunjukkan bahwa segmentasi menggunakan Fuzzy C-Means menghasilkan aturan asosiasi dengan metrik yang lebih tinggi dibandingkan K-Means, khususnya pada metrik weighted average confidence dan lift. Hasil penelitian menunjukkan bahwa pendekatan keanggotaan fuzzy lebih adaptif dalam menangkap variasi perilaku pelanggan. Dengan demikian Fuzzy C-Means lebih efektif digunakan dalam segmentasi pelanggan sebagai dasar penerapan algoritma Apriori.
The growth of the e-commerce industry has generated large volumes of customer transaction data, which can be utilized to improve the effectiveness of marketing strategies. Customer segmentation is necessary to understand the characteristics of shopping behavior. This research aims to compare the performance of the K-Means and Fuzzy C-Means methods in customer segmentation based on the Recency, Frequency, and Monetary (RFM) approach, as well as to evaluate the impact of customer segmentation on the association rules generated by the Apriori algorithm. This research uses the Online Retail dataset with the implementation of K-Means and Fuzzy C-Means for customer segmentation, and cluster validation is performed using the Silhouette Coefficient, Davies–Bouldin Index, and Calinski–Harabasz Index, resulting in an optimal number of three clusters for both K-Means and Fuzzy C-Means. Apriori algorithm is applied to each cluster to obtain product association rules based on support, confidence, and lift metrics. The results show that segmentation using Fuzzy C-Means produces association rules with higher metrics compared to K-Means, particularly in terms of the weighted average confidence and lift metrics. These results indicate that the fuzzy membership approach is more adaptive in capturing variations in customer behavior. Therefore, Fuzzy C-Means is more effective for customer segmentation as a basis for the application of the Apriori algorithm.
Kata Kunci : K-Means, Fuzzy C-Means, RFM, Apriori, segmentasi pelanggan