Laporkan Masalah

METODE DUA LANGKAH DALAM PENGELOMPOKKAN DATA UNTUK PENGELOMPOKAN DATA CAMPURAN BERJENIS KATEGORIK DAN NUMERIK

NAUFAL IBNU AMZANI, Dr. Herni Utami, S.Si, M.Si.

2018 | Skripsi | S1 STATISTIKA

Data dengan jenis atribut campuran numerik dan kategorik semakin sering kita temukan dalam kehidupan sehari-hari. Sementara itu, algoritma analisis pengelompokkan data yang sering dipakai dalam kehidupan sehari-hari kebanyakan hanya mampu menganalisis data yang berjenis kategorik saja atau berjenis numerik saja. Metode dua langkah dalam pengelompokkan data untuk pengelompokkan data campuran berjenis kategorik dan numerik ini merupakan salah satu metode pengelompokkan data berjenis campuran tersebut dengan menggunakan co-occurrence sebagai dasar untuk memberikan nilai numerik pada atribut kategorik. Penggunaan co-occurrence dimaksudkan untuk menemukan kesamaan hubungan antar masing-masing atribut kategorik. Sehingga, semua data berjenis kategorik akan memiliki nilai numerik. Kemudian, metode ini menggunakan dua langkah pengelompokkan data. Pertama metode ini mengaplikasikan analisis cluster hirarki aglomeratif yang kemudian hasilny diintegrasikan dengan jumlahan item kategorik sebagai item tambahan. Metode ini menggunakan analisis cluster k-means sebagai algoritma pengelompokkan data terakhir. Kemudian, cluster yang terbentuk kemudian dianalisis kualitasnya menggunakan entropi. Metode ini menghasilkan hasil yang baik sebagai analisis cluster dengan data berjenis campuran.

Data with mixed attributes of numerical and categorical types are increasingly common in real life. Meanwhile, clustering analysis algorithm that is often used in mostly only able to analyze data with pure categorical and numeric only. Clustering mixed categorical and numeric data with two-step method of clustering is one of the methods of clustering mixed data by using co-occurrence as a basis for assigning numerical values into categorical attributes. The use of co-occurrence is intended to find similarity of relationships between each categorical attributes. Thus, all categorical data will have numeric values. Then, this method uses two-step of clustering. First, this method applied hierarchial agglomerative clustering which is then the results integrated with the sum of categorical items as additional items. This methods then uses k-means clustering analysis as the final clustering algorithm. Then, the formed clusters will be tested for its quality with entropy. This method produced good results as cluster analysis for mixed data.

Kata Kunci : clustering analysis, k-means clustering, hierarchial aggomerative clustering, mixed atrributes, co-occurrence, entropy

  1. S1-2018-336539-abstract.pdf  
  2. S1-2018-336539-bibliography.pdf  
  3. S1-2018-336539-tableofcontent.pdf  
  4. S1-2018-336539-title.pdf