Laporkan Masalah

Seleksi Fitur Menggunakan Algoritma Genetika untuk Klasifikasi Penyakit Anemia Dengan SVM

AFFIFAH MUTIARA PERTIWI, Afiahayati, S.Kom., M.Cs., Ph.D.

2024 | Tesis | S2 Ilmu Komputer

Hasil Riskesdas Kementerian Kesehatan Republik Indonesia menyampaikan bahwa pada tahun 2018 prevalensi kasus anemia di kalangan remaja Indonesia sebesar 32%. Persentase tersebut sangat besar sehingga diperlukan perhatian khusus dengan diagnosis dini pada penyakit anemia. Data pemeriksaan darah rutin mungkin untuk digunakan sebagai solusi skrining dini anemia karena dapat dilakukan di laboratorium patologi klinik yang mudah ditemui di sekitar masyarakat. Terdapat banyak jumlah parameter hasil pemeriksaan darah rutin. Namun fitur-fitur tersebut kurang signifikan dalam menunjukkan diagnosis anemia tertentu. Oleh karena itu diperlukan suatu seleksi fitur untuk mendapatkan fitur-fitur yang memiliki pengaruh signifikan saat digunakan dalam pengklasifikasian penyakit anemia.

Pada penelitian ini dilakukan seleksi fitur menggunakan algoritma genetika dan support vector machine (SVM) sebagai classifier. Hasil pemeriksaan darah rutin penyakit anemia diklasifikasikan dalam beberapa kelas, yaitu DB, BTT, HbE, dan mix. Fitur-fitur yang diseleksi adalah indeks-indeks hematologi pada hasil pemeriksaan darah turin lengkap menggunakan hematology analyzer. Data tersebut telah diolah dan diekstraksi oleh Dr. dr. Tri Ratnaningsih, M.Kes., Sp.PK(K) dari pemeriksaan darah di Rumah Sakit Umum Pusat (RSUP) Dr. Sardjito.

Seleksi fitur dilakukan dalam 3 eksperimen dengan nilai Pc berbeda. Proses seleksi fitur diulangi sebanyak 10 percobaan. Hasil eksperimen terbaik fitness akurasi adalah eksperimen 3 pada percobaan 9 dengan akurasi 86,2%. Sedangkan fitness F1-score hasil terbaik adalah eksperimen 1 pada percobaan 7 dengan skor 81,78%. Implementasi seleksi fitur berhasil meningkatkan akurasi sebesar 4,4?n sama skornya dengan hasil F1-score dibandingkan dengan klasifikasi tanpa seleksi fitur sebesar 81,78%. Terpilih 9 fitur berdasarkan fitness akurasi yaitu RBC, MCV, CHCM, CH, Retic %, CHr, RBC % Hypo, RBC % Micro, dan RBC Fragment. Berdasarkan fitness F1-score terpilih 10 fitur yaitu RBC, HGB, MCV, MCH, MCHC, RDW, Retic %, Retic % Hypo, RBC % Micro dan RBC Fragment.

The results of Riskesdas Ministry of Health of the Republic of Indonesia stated that in 2018 the prevalence of anemia cases among Indonesian teenagers was 32%. This percentage is very large  and special attention is needed with early diagnosis of anemia. Routine blood examination data may be used as an early screening solution for anemia, which can be done in clinical pathology laboratories which are easily found in the community. There are many parameters for routine blood test results. However, these features are less significant in indicating specific diagnosis of anemia. Therefore, feature selection is needed to obtain features that have significant influence when used in classifying anemia.

In this research, feature selection was carried out using genetic algorithm and support vector machine (SVM) as classifier. The results of routine blood tests for anemia are classified into several classes DB, BTT, HbE, and mix. The features selected are hematological indicies in the results of complete routine blood examination using hematology analyzer. The data has been processed and extracted by Dr. dr. Tri Ratnaningsih, M.Kes., Sp.PK(K) from blood test at the Centra General Hospital (RSUP) Dr. Sardjito.

Feature selection was carried out in 3 experiments with different Pc values. The feature selection process was repeated for 10 repetitions. The best experimental results for fitness accuracy were experiment 3 in repetition 9 with accuracy score 86.2%. Meanwhile, best fitness F1-score result was experiment 1 in repetition 7 with score 81.78%. Implementation of feature selection succeeded in increasing accuracy by 4.4%, and the score was same as F1-score compared based on fitness without feature selection of 81.78%. Nine features were selected based on fitness accuracy RBC, MCV, CHCM, CH, Retic %, Retic % Hypo, Retic % Micro, and RBC Fragment. Based on fitness F1-score, 10 features were selected, RBC, HGB, MCV, MCH, MCHC, RDW, Retic %, Retic % Hypo, Retic % Micro, and RBC Fragment.

Kata Kunci : Algoritma Genetika, Anemia, Seleksi Fitur, Support Vector Machine, Genetic Algorithm, Feature Selection, Anemia, Support Vector Machine

  1. S2-2024-466391-abstract.pdf  
  2. S2-2024-466391-bibliography.pdf  
  3. S2-2024-466391-tableofcontent.pdf  
  4. S2-2024-466391-title.pdf