Prediksi lokasi penyebaran penyakit menggunakan klasifikasi pada spatial data mining
INDRIHASTUTI, Nur, Ir. Surjono, M.Phil
2008 | Tesis | S2 Teknik ElektroSpatial Database Systems (SDBS) merupakan sistem basis data yang digunakan untuk memanajemen data spasial. Jumlah dan ukuran aplikasi basis data spasial berkembang secara cepat dan ini menyebabkan tumpukan data spasial yang berasal dari satelit, kamera video, peralatan kesehatan dan sebagainya. Perkembangan ini jauh dari kemampuan manusia untuk menganalisa basis data spasial seperti menemukan pola-pola yang tersembunyi. Data mining dalam basis data spasial atau yang sering disebut spatial data mining (SDM) adalah mengekstrak knowledge yang tersembunyi dan menemukan hubungan antara data spasial dan bukan spasial serta pola menarik lainnya yang jelas tidak tersimpan dalam basis data spasial. Algoritma yang digunakan untuk menyelesaikan permasalahan memprediksi lokasi terkena penyakit tuberkulosis adalah algoritma Decision Tree dan Naïve Bayes. Algoritma tersebut adalah algoritma untuk teknik klasifikasi serta merupakan metode untuk predictive spatial data mining. Sebelum data digunakan sebagai masukan proses mining, maka data terlebih dahulu diklasifikasikan. Teknik klasifikasi pada spatial data mining dapat digunakan untuk memprediksi tingkat dahak yang dimiliki oleh pasien dan untuk pengujian keakuratan hasil proses mining menggunakan confusion matrix. Hasil dari penelitian diharapkan mengetahui daerah mana saja yang diprediksi mempunyai kemungkinan terkena penyakit tuberkulosis, sehingga dapat diadakan penyuluhan untuk pencegahan supaya dapat meminimalkan jumlah penderita TB.
The Spatial Database System (SDBS) is a database system used to manage spatial data. The number and size of the spatial database application are rapidly growing and it caused large database obtained from satellites, video cameras, health equipments, and so on. The growth is actually beyond the human capacity of analyzing the spatial database such as of finding hidden patterns. Data mining in the spatial database, or frequently referred as the spatial data mining (SDM), is to extract the hidden knowledge and to find out relations between the spatial and the non-spatial data as well as other interesting patterns obviously not stored in the spatial database. Algorithms used to solve a problem of how predict locations tuberculosis disease spread are the Decision Tree and Naïve Bayes algorithms. Both are algorithms for classification, which is a predictive spatial data mining method. The data are classified before used for processing the data mining. The classification technique can be used on spatial data mining to predict the levels of sputum suffered by patients and to examine the accuracy of outputs in the mining process using the confusion matrix. It is expected that results of the study can be made as a consideration of finding out which regions are with high possibility of suffering the spread tuberculosis disease, so that health consultations can be hold for preventing the number of TB patients.
Kata Kunci : Basis data spasial,Naive bayes,Decision tree,Data mining, Spatial Database, Naïve Bayes, Decision Tree, Data Mining