Laporkan Masalah

PENENTUAN REKOMENDASI PELATIHAN PENGEMBANGAN DIRI BAGI PEGAWAI NEGERI SIPIL MENGGUNAKAN ALGORITMA C4.5 DENGAN PRINCIPAL COMPONENT ANALYSIS DAN DISKRITISASI

HANIF RAHMAWAN, Dr. Azhari SN., M.T.

2017 | Tesis | S2 Ilmu Komputer

Setiap institusi memiliki kebutuhan untuk terus meningkatkan pelayanan dan melakukan inovasi yang perlu mendapatkan dukungan dari SDM yang berkualitas. Pelatihan menjadi salah satu cara untuk mewujudkan SDM yang berkualitas. Namun terkadang penentuan pelatihan yang sesuai untuk seorang pegawai tidak mudah dan berpeluang menimbulkan ketidakkonsistenan. Masalah tersebut dapat diatasi dengan melakukan data mining terhadap data pemetaan pegawai yang sudah ada sehingga didapatkan aturan-aturan untuk penentuan rekomendasi pelatihan pengembangan diri. Data pemetaan terdiri dari nilai aspek psikologis pegawai dan rekomendasi pelatihan yang diberikan oleh assessor. Data tersebut kemudian dipecah menjadi 6 data pelatihan karena ada 6 jenis pelatihan yang digunakan. Pada penelitian ini digunakan tiga metode, yaitu algoritma C4.5, kombinasi PCA, dan C4.5, serta kombinasi PCA, diskritisasi, dan C4.5 untuk melakukan penambangan pada data. Diskritisasi yang digunakan adalah diskritisasi berbasis entropi dengan dua macam kriteria pemberhentian yaitu berdasar jumlah interval dan MDLP. Pada tahap pra-pemrosesan digunakan teknik over-sampling SMOTE untuk menangani 4 data pelatihan yang mengalami ketidakseimbangan kelas. Pada penerapan kombinasi algoritma PCA, diskritisasi, dan C4.5 dilakukan ekstraksi fitur dengan menggunakan algoritma PCA setelah proses over-sampling dilakukan. Data hasil reduksi didiskritisasi kemudian diklasifikasi dengan algoritma C4.5. Hasil pengujian menunjukkan bahwa kombinasi PCA, diskritisasi, dan C4.5 memberikan performa yang lebih baik daripada kedua metode yang lain. Keenam jenis pelatihan menunjukan performa terbaik ketika diproses dengan metode ini. Metode ini dapat menjadi cara alternatif untuk melakukan pruning terhadap pohon keputusan. Penentuan rekomendasi pelatihan pengembangan diri bagi pegawai dapat dilakukan dengan metode ini dengan rerata nilai akurasi 86,61% dan rerata nilai F-measure 82,23%.

The need to continuously improve service and innovation becomes the need of every institution that needs to get support from qualified human resources. Training becomes one way to realize qualified human resources. But sometimes determining appropriate training for an employee is not easy. The problem can be solved by performing data mining on existing employee mapping data so that the rules for determining training recommendations are obtained. Mapping data consists of the psychological aspects of the employee and the training recommendations provided by the assessor. The data is then divided into 6 training data as there are 6 types of training used. There are three methods used in this thesis to perform data mining, namely C4.5 algorithm, combination of PCA, and C4.5, and combination of PCA, discretization, and C4.5. The discretization used is entropy-based discretization with two kinds of stopping criteria based on the number of intervals and MDLP. SMOTE over-sampling technique is used to handle 4 training data that encountered problems of class imbalance at the pre-processing step. In the application of PCA, discrete, and C4.5 methods, features of data are extracted using PCA algorithm after over-sampling is done. The extraction result is discretized and then classified by C4.5 algorithm. Test results show that PCA, discretization, and C4.5 methods provide better performance than the other two methods. The six types of training shows the best performance when processed with the method. This method can be an alternative way to pruning decision trees. The determination of self-development training recommendations for employees can be done with this method with an average accuracy of 86,61% and an average F-measure of 82,23%.

Kata Kunci : pohon keputusan c4.5, pelatihan pengembangan diri, principal component analysis, diskritisasi berbasis entropi

  1. S2-2017-388476-abstract.pdf  
  2. S2-2017-388476-bibliography.pdf  
  3. S2-2017-388476-tableofcontent.pdf  
  4. S2-2017-388476-title.pdf