Laporkan Masalah


Elvira Sukma Wahyuni, Noor Akhmad Setiawan, S.T., M.T., Ph.D.

2014 | Tesis | S2 Teknik Elektro

Diagnosis kanker payudara merupakan salah satu topik yang banyak diimplementasikan dalam machine learning. Namun dalam analisis data medis khususnya kanker payudara, sering kali dihadapkan pada dimensi fitur yang besar. Dimensi fitur yang besar terkadang mengandung fitur yang tidak relevan dengan proses pengklasifikasian. Seleksi fitur merupakan metode yang digunakan untuk menghilangkan fitur yang tidak relevan untuk meningkatkan performa diagnosis. Tujuan penelitian ini adalah membangun sebuah metode seleksi fitur untuk mendiagnosis kanker payudara berbasis kombinasi F-score dan rough set. Metode kombinasi seleksi fitur F-score dan rough set akan diterapkan untuk mencari fitur yang paling optimal yang selanjutnya akan digunakan pada tahap klasifikasi dengan menggunakan metode SVM. kemampuan kombinasi seleksi fitur diujicobakan pada Wisconsin Breast Cancer Dataset (WBCD). Metode seleksi fitur F-score dan rough set dikombinasikan secara berurut dengan menerapkan metode seleksi fitur rough set terlebih dahulu, kemudian subset fitur hasil reduksi rough set akan diseleksi dengan metode seleksi fitur F-score. Peningkatan performa diagnosis akan dievaluasi berdasarkan rata-rata sensitivitas, ROC AUC, akurasi dan running time dari 100 kali percobaan, kemudian akan dibandingkan performa metode seleksi fitur ketika diterapkan secara individu dan ketika diterapkan dengan pengombinasian. Hasil menunjukkan metode kombinasi seleksi fitur F-score dan rough set mendapatkan jumlah fitur optimal yang lebih kecil dan performa yang lebih unggul dibandingkan metode F-score dan rough set ketika diterapkan secara individual, dengan perolehan sensitivitas sebesar 0,9714, ROC AUC sebesar 0,9700, akurasi sebesar 97,05%, dan rata-rata running time 0,0722 s. Kata kunci: Seleksi Fitur, Rough set, F-score, Klasifikasi SVM, Diagnosis Kanker Payudara

of breast cancer has been widely implemented using machine learning. However, in medical data analysis, breast cancer diagnosis is usually faced with high dimensional features. The high dimensional features sometimes contain irrelevant features toward the classification process. Feature selection is a method to eliminate irrelevant features. It can improve the performance of diagnosis. The objective of this research is to develop a feature selection method for breast cancer diagnosis based on rough set and F-score combination. Performance of combination features selection was applied in Wisconsin Breast Cancer Dataset (WBCD). F-score feature selection method and Rough set are combined subsequently by applied Rough set firstly. Than the result of reduced subset feature by Rough set will be selected with F-score feature selection method. Improvement the performance of diagnosis would be evaluated based on the average of sensitivity, ROC AUC, accuracy, and running time with 100 times experiment. Furthermore, the results would be compared with the performance of feature selection method when it is applied individually and simultaneously. The result shows that the combination of F-score feature selection method and rough set achieves the optimal feature and superior performance compared with F-score and Rough set when applied individually. The obtained of sensitivity 0.9714, ROC AUC 0.9700, accuracy 97.05%, and the running time 0.0722 s. Keywords : Feature selection, Rough set, F-score, SVM classification, Breast cancer diagnosis

Kata Kunci : Seleksi Fitur, Rough set, F-score, Klasifikasi SVM, Diagnosis Kanker Payudara

    Tidak tersedia file untuk ditampilkan ke publik.