Penerapan Algoritma Clustering K-Means, K-Medoid dan gath-Geva untuk penjurusan siswa SMA :: Studi kasus Penjurusan siswa SMAK Marsudi Luhur Yogyakarta

GIYANTO, Heribertus

GIYANTO, Heribertus, Prof.Drs. Subanar, Ph.D

2008 | Tesis | S2 Ilmu Komputer

Abstrak
File Pdf

Pada jenjang pendidikan Sekolah Menengah Atas diadakan penjurusan siswa diakhir semester dua untuk masuk pada jurusan IPA, IPS atau Bahasa pada semester selanjutnya. Salah satu pertimbangan untuk penjurusan itu adalah hasil pencapaian prestasi siswa dalam bentuk nilai raport semester satu dan dua. Nilai raport adalah berupa angka antara 5 sampai dengan 10 dengan ketelitian dua desiamal, sehingga bila dilakukan pengelompokan secara manual akan mengalami kesulitan, terlebih untuk sekolah yang kemampuan siswannya kurang menyebar. Penelitian ini akan mencoba menerapkan algoritma clustering K-Means, K-Medoid dan Gath-Geva untuk kasus penjurusan siswa SMA ini. Untuk menentukan baik tidaknya hasil suatu algoritma clustering akan digunakan beberapa metode validasi yang bisa mengukur kepadatan (compactness) cluster maupun keterpisahan (separated) antar cluster. Untuk mengukur keterpisahan digunakan metode validasi Partition Coefficient (PC). Untuk mengukur kepadatan cluster sekaligus keterpisahan antar cluster digunakan metode validasi Partition Index (SC), Dunn,s Index (DI), Xie Benni (XB). Untuk visualisasinya digambarkan pada grafik dua dimensi dengan bantuan metode Principal Components Analysis (PCA). PCA akan mereduksi multi dimensi menjadi dua dimensi saja. Dari hasil percobaan didapatkan algoritma K-Means dan K-Medoid memberikan keterpisahan (separated) cluster yang lebih baik dari pada algoritma Gath-Geva. Algoritma Gath-Geva memberikan tingkat kepadatan (compactness) yang paling baik, berikutnya algoritma K-Means dan terakhir algoritma K-Medoid. Pada algoritma K-Means dan K-medoid menghasilkan jumlah anggota cluster yang berimbang, sedangkan algoritma Gath-Geva pada percobaannya sangat jarang menghasilkan jumlah anggota tiap cluster yang berimbang bahkan bisa hanya tekumpul pada satu cluster saja.

At the end of the second semester in Senior High School level students are selected to enter Natural Science, Social Science, or Language Department. One of the considerations for this selection is studentsâ€™ achievement in semester one and two in the form of scores. The scores are between 5 and 10 with the accuracy of 2 decimals, which are difficult to classify manually especially in the school whose studentsâ€™ achievement does not spread widely. This research was trying to apply clustering algorithm of K-means, K-Medoid, and Gath-Vega in this studentsâ€™ selection. To determine whether the clustering algorithm was good enough or not some validation methods were used to measure cluster compactness and cluster separatedness. To measure separatedness, Partition Coefficient (PC) method was used. To measure cluster compactness as well as cluster separatedness, the methods of Partition Index (SC), Dunn,s Index (DI), Xie Benni (XB) were used. The visualization was illustrated with a graphic with 2 dimensions using Principal Components Analysis (PCA) method. PCA will reduce the multi dimensions become to 2 dimensions only. The experiment showed that the clustering algorithm of K-means, K-Medoid gave better separatedness than that of Gath-Geva. However the algorithm of Gath-Geva gave the best compactness, followed by that of K-means and K-Medoid. K-means and K-Medoid algorithm resulted balanced results of clustering members. Gath-Geva algorithm in the experiment rarely resulted balanced number of cluster members, even the members could gather in one cluster only.

Kata Kunci : Algoritma Clustering,K Means, K Medoid dan Gath Geva,Penjurusan Siswa,clustering, K-Means, K-Medoid, Gath-Geva, validation, PCA

Tidak tersedia file untuk ditampilkan ke publik.

LAYANAN

E-Resources

Quick Access