Metode Ensemble QROCK dan K-Modes untuk Segmentasi Pasar dengan Data Campuran
Novalia Ramadhani, Dr. Drs. Gunardi, M.Si.
2023 | Skripsi | STATISTIKA
Segmentasi pasar merupakan sebuah solusi yang dapat digunakan untuk mengelompokkan konsumen yang heterogen ke dalam beberapa kelompok dengan karakteristik yang serupa. Seringkali data informasi mengenai konsumen disajikan dalam bentuk data campuran numerik dan kategorik sehingga pengelompokan data jenis ini dapat dilakukan dengan menggunakan metode pendekatan ensemble ataupun baseline. Metode pendekatan ensemble dilakukan dengan mengelompokkan ulang label hasil pengelompokan data numerik dan kategoriknya untuk mendapatkan hasil analisis akhir. Pada penelitian ini metode ensemble QROCK diketahui memberikan hasil analisis yang lebih baik dibanding k-modes karena rasio SW dan SB yang dihasilkan dalam mengelompokkan data segmentasi pasar diketahui jauh lebih kecil. Adapun metode pendekatan baseline merupakan algoritma yang berisi gabungan dari algoritma pengelompokan data numerik dan kategorik. Sebagai tambahan, dengan menggunakan data simulasi diketahui bahwa metode KAMILA memberikan hasil analisis yang lebih baik dibanding ensemble QROCK karena nilai ARI yang dihasilkan lebih mendekati 1. Meskipun begitu, nilai prediction strength dari hasil pengelompokan data segmentasi pasar dengan algoritma KAMILA diketahui kurang dari 0,8 sehingga dapat dikatakan bahwa hasil pengelompokan belum begitu baik. Secara umum dapat disimpulkan bahwa kedua metode pendekatan bisa digunakan untuk mengelompokkan data campuran.
Market segmentation is defined as the activity of clustering consumers into several groups based on their similar characteristics. Often times, consumers data is provided in the form of a mixture of numerical and categorical data. Ensemble and baseline are two types approach methods that can be used to cluster this type of data. It is concluded that the QROCK ensemble method provides better clustering results than k-modes because the former method produces much smaller SW and SB ratios. It is also concluded that the baseline approach method KAMILA provides better clustering results than the QROCK ensemble because the former method produced bigger ARI value. However, the prediction strength value from the results of clustering market segmentation data with the KAMILA algorithm is less than 0,8 so it can be concluded that the clustering results are not good enough. In general, it can be concluded that both approach methods can be used to cluster data with mixture of numerical and categorical variables.
Kata Kunci : segmentasi pasar, clustering, data campuran, DBSCAN, QROCK, k-modes, KAMILA