Laporkan Masalah

Peningkatan Kinerja dan Efisiensi Waktu Klasifikasi Coronary Artery Disease (CAD) dengan Metode SVM-RFE pada Kombinasi Metode SMOTE dan SVM

Faris Ramadhan, Dr. techn. Khabib Mustofa, M.Kom ; Dyah Aruming Tyas, S.Si., Dr.

2023 | Skripsi | ILMU KOMPUTER

Telah dilakukan beberapa penelitian sebelumnya terkait machine learning untuk memprediksi CAD. Salah satu dataset yang umum digunakan adalah dataset Z-Alizadeh Sani. Pada penelitian sebelumnya, telah dilakukan upaya untuk meningkatkan kinerja model klasifikasi SVM dalam memprediksi CAD dengan dataset Z-Alizadeh Sani. Salah satu metode yang diterapkan yaitu teknik resampling SMOTE untuk mengatasi ketidakseimbangan data. Meskipun kinerja model yang dihasilkan dari penelitian tersebut relatif cukup baik, namun upaya meningkatkan kinerja dan efisiensi waktu komputasi model masih dapat dilakukan dengan menerapkan teknik seleksi fitur.

Dalam penelitian ini diterapkan metode serupa yang telah diterapkan pada penelitian sebelumnya, yaitu metode kombinasi dari teknik resampling SMOTE dan model klasifikasi SVM. Namun, pada penelitian ini dilakukan penambahan metode teknik seleksi fitur SVM-RFE. Selain itu, pada penelitian ini juga diterapkan tiga skenario pembagian data yang berbeda untuk data pelatihan dan data uji.

Hasil penelitian menunjukkan bahwa metode teknik seleksi fitur SVM-RFE dapat meningkatkan kinerja secara keseluruhan dibandingkan dengan metode dari penelitian sebelumnya. Metode yang diusulkan menghasilkan kinerja terbaik yang diperoleh pada skenario pembagian data pelatihan 90?n data uji 10%, yaitu akurasi sebesar 96,77%, presisi 95,83%, sensitivitas 100%, dan skor f1 97,87%. Sedangkan, waktu komputasi dari kinerja terbaik tersebut adalah 0,0051 detik untuk waktu pelatihan dan 0,002 detik untuk waktu prediksi

Several previous studies have been conducted on machine learning to predict CAD. One commonly used dataset is the Z-Alizadeh Sani dataset. In previous research, efforts have been made to improve the performance of SVM classification models in predicting CAD using the Z-Alizadeh Sani dataset. One applied method is the SMOTE resampling technique to address data imbalance. Although the model’s performance resulting from that research was relatively good, further efforts to enhance model performance and computational efficiency can still be made by applying feature selection techniques.

In this study, a similar method applied in previous research is employed, combining the SMOTE resampling technique with an SVM classification model. However, an additional feature selection method, SVM-RFE, is introduced in this study. Additionally, three different scenarios for dividing the data into training and test sets are implemented.

The research results indicate that the SVM-RFE feature selection method can improve overall performance compared to methods used in previous research. The best performance is achieved in the scenario where 90% of the data is used for training and 10% for testing, resulting in an accuracy of 96.77%, precision of 95.83%, sensitivity of 100%, and an F1 score of 97.87%. Meanwhile, the computing time for the best performance is 0.0051 seconds for the training time and 0.002 seconds for the prediction time.

Kata Kunci : CAD, SMOTE, SVM-RFE, SVM, machine learning

  1. S1-2023-445638-abstract.pdf  
  2. S1-2023-445638-bibliography.pdf  
  3. S1-2023-445638-tableofcontent.pdf  
  4. S1-2023-445638-title.pdf