Laporkan Masalah

Pemilihan Fitur Berbasis Komputer untuk Diagnosis Penyakit Tuberkulosis

MUKHAMAD HASIM ISWANTO, Adhista Erna Permanasari, S.T., M.T., Ph.d. ; Hanung Adi Nugroho, S.T., M.E., Ph.D.

2017 | Tesis | S2 Teknik Elektro

Intisari Diantara penyakit paru, penyakit yang paling menular dan berbahaya adalah Tuberkulosis Paru. Tuberkulosis (TBC) merupakan penyakit menular yang umum dan dalam banyak kasus bersifat mematikan. Penyakit ini disebabkan oleh Mycobacterium tuberculosis. Metode gold standard yang menjadi rujukan para dokter untuk mendiagnosis penyakit TBC adalah Uji Tuberkolin dan pemeriksaan dahak. Namun metode ini invasive, mempunyai risiko dan waktu yang lama. Tujuan dari penelitian ini adalah memilih fitur dan mengevaluasi beberapa metode berbasis komputer yang digunakan mendeteksi lebih dini keberadaan penyakit tuberkulosis dan sebagai pemeriksaan awal sebelum dilakukan uji tuberkulin pada balita dan bakteriologi pada orang dewasa. Pada penelitian ini metode pemilihan fitur berbasis pakar medis (MFS) juga digunakan. Diagnosis penyakit TBC berbasis komputer dilakukan dengan pemilihan fitur dan melakukan klasifikasi dataset rekam medik rumah sakit PKU Muhammadiyah Gombong dengan jumlah data 260 dan 31 atribut. Pada penelitian ini, metode pemilihan fitur berbasis komputer yang digunakan adalah metode pemilihan fitur berbasis komputer dengan correlation based feature selection (CFS) dan pemiihan fitur berbasis teory rough set (RST) dan kombinasi RST dan CFS yang dinamakan dengan RSTCFS. Penggabungan metode pemilihan fitur berbasis pakar medis dan komputer juga dilakukan untuk menghidari terhapusnya fitur-fitur yang dianggap penting oleh pakar medis. Classifier yang digunakan adalah Naive Bayes, K-Star, AdaboostM1, J.48 dan PART. Pada akhirnya RSTCFS dengan Naive Bayes sebagai classifier menjadi skema yang terbaik untuk mendiagnosis penyakit TBC memiliki area under curve of ROC (AUC) terbaik dibandingkan skema yang lainnya yaitu sebesar 0.9866. Dalam penggabungan pemilihan fitur berbasis komputer dan pakar medis performa nilai akurasi tertinggi adalah MFS+CFS+Naive Bayes sebesar 98,0769 %.

Abstract Among pulmonary diseases, the most dangerous and infectious disease is the Tuberculosis (Tb lungs). Tuberculosis (TB) is an infectious disease that is common, and in many cases lethal. The disease is caused by various strainmikobakteria, usually Mycobacterium tuberculosis. Gold standard method which became a reference for doctors to diagnose TB disease is Test Tuberkolin and sputum examination. However, this method is invasive, risky, expensive and it has a long time. The purpose of this study was to choose the features and evaluate some of the computer-based methods, which were used to detect early the presence of tuberculosis and as an initial screening prior to the tuberculin test in infants and bacteriology in adults. In this research-based feature selection method of motivated feature selection (MFS) is also used. Diagnosis of Tuberculosis disease was done by selecting a computer-based features and doing classification dataset of PKU Muhammadiyah Gombong hospital records with the data amount as many as 260 and 31 attributes. In this study, a computer-based feature selection method was the method of feature selection based computer with correlation-based feature selection (CFS) and feature selection based on rough sets Theory (RST) and the combination of RST and CFS called the RSTCFS. Merging feature selection methods and computer-based medical experts also are carried out to avoid the elimination of features considered important by medical experts. Classifier used were Naive Bayes, K-Star, AdaboostM1, J.48 and PART. Among several methods to compare, RSTCFS with Naive Bayes classifier was the best scheme for diagnosing tuberculosis have of ROC area under the curve (AUC) were the best compared to other schemes that was equal to 0.9866. Furthermore, the combination computer-based feature selection and performance of medical experts of the highest accuracy grades are MFS + CFS + Naive Bayes amounted to 98.0769%.

Kata Kunci : Penyakit Tuberkulosis, data rekam medik, uji tuberkulin, pemeriksaan dahak, klasifikasi, pemilihan fitur