SELEKSI RULE MENGGUNAKAN TEORI ROUGH SET PADA DIAGNOSIS PENYAKIT JANTUNG KORONER
ALFIAH FAJRIANI, Noor Akhmad Setiawan, S.T., M.T., Ph.D ; Teguh Bharata Adji, S.T., M.T., M.Eng., Ph.D
2018 | Tesis | S2 Teknik ElektroINTISARI Diagnosis penyakit jantung koroner ditingkatkan dengan menerapkan teknik machine learning dengan memanfaatkan metode data mining. Salah satu cara metode data mining yang dilakukan adalah diagnosis berbasis rules. Hasil ekstraksi biasanya menghasilkan rules dengan jumlah yang sangat besar. Metode RST (Rough Set Theory) digunakan untuk mencari rules yang penting dari jumlah rules yang sangat besar untuk meningkatkan performa sistem agar semakin akurat dan cepat dalam pengambilan keputusan. Pada penelitian sebelumnya penggunaan metode RST yang menghasilkan rules terpilih belum dilakukan pengujian pada unseen data atau data baru dan juga belum dilakukannya perbandingan nilai akurasi menggunakan metode lain, mana yang lebih baik dalam pemilihan rules. Pada penelitian ini dilakukan seleksi rule menggunakan RST pada data Cleveland penyakit jantung koroner. Seleksi aturan dilakukan dengan mereduksi atribut yang akan menghasilkan rules. Rules yang didapatkan kemudian direkonstruksi menjadi decision table baru. Decision table baru selanjutnya direduksi menggunakan RST dengan konsep reduksi atribut, yang dimana hasilnya merupakan rules terpilih. Selanjutnya, rules terpilih tersebut diuji menggunakan unseen data. Kemudian dilakukan juga pengujian menggunakan rules terpilih yang didapatkan dari metode pemilihan atribut yang lain. Tujuan dari penelitian ini dilakukan untuk melihat peningkatan nilai akurasi pada unseen data atau data baru menggunakan rules terpilih. Juga untuk melihat hasil perbandingan nilai akurasi menggunakan metode lain, mana yang lebih baik dalam pemilihan rules. Hasil penelitian menunjukkan bahwa RST mampu menghasilkan sejumlah rules yang lebih sedikit yaitu 21 rules dengan tingkat akurasi klasifikasi pada data testing sebesar 0,8595 dari nilai akurasi semula menggunakan 2733 rules sebesar 0,7934. Untuk nilai akurasi klasifikasi pada unseen data mengalami penurunan yaitu 0,7705 dari nilai akurasi semula menggunakan 2733 rules sebesar 0,8197. Sedangkan nilai akurasi menggunakan metode yang lain masih dibawah nilai akurasi dari metode RST yang berarti nilai akurasi menggunakan metode RST masih lebih baik dibanding 3 metode seleksi atribut lainnya.
The diagnosing techniques of coronary heart disease were improved by applying the learning machine technique and data mining method. One of data mining methods utilized was rule-based. The extraction results generally produced rules in a large quantity. RST (Rough Set Theory) method was employed to find important rules out of those available rules. These important rules were targeted to be able to increase system performances in order to be more accurate and quicker in conclusion drawing. In the previous research, the use of RST method that produced selected rules has not been tested on unseen data or new data and comparison of accuracy value using other method also has not been done, to know which one is better in the election of rules. This research work conducted rule selections by the means of RST in Cleveland data of coronary heart disease. Rule selection was performed by reducing attributes that were supposed to produce rules. Then, rules produced were reconstruced to be a new decision table. Next, the new decision table was reduced by hiring RST as well with the attribute reduction concep. Results of this process were in forms of the chosen rules. The chosen rules were examined using the unseen data. Then, the chosen rules produced by selecting other attributes were also examined. This research aims to observe the improvement of accuracy value of unseen data or new data by using the chosen rules and to observe results of accuracy value comparison with other methods in order to find out the best method in rule selection. The results of research show that RST is able to produce less rules as much as 21 rules with the level of classification accuracy in the testing data as much as 0,8595 while the initial accuracy value was as much as 0,7934 (using 2733 rules). The classification accuracy value in unseen data decreased as much as 0,7705 from the initial accuracy value as much as 0,8197 by using 2733 rules. The accuracy values produced by other methods was under the accuracy value by RST method. It means that accuracy value using RST method is still better than other three attribute selection methods.
Kata Kunci : penyakit jantung koroner, rough set theory, cleveland, rule