Pemanfaatan Data Mining dengan Algoritma K-Means Clustering dan C4.5 Decision Tree Classification untuk Analisis Kesehatan Maternal di Puskesmas Sleman
Tarissa Junita Briliani, Marko Ferdian Salim, S.K.M., M.P.H.
2023 | Tugas Akhir | D4 MANAJEMEN INFORMASI KESEHATAN
Latar Belakang: Sektor kesehatan mengalami pertumbuhan akumulasi data yang semakin berkembang pesat di era teknologi informasi dan digitalisasi. Data-data yang terakumulasi tersebut berpotensi untuk menghasilkan informasi yang mampu mengubah perspektif dan penyampaian layanan informasi kesehatan. Implementasi teknik data mining pada kasus maternal morbidity dengan skala data yang besar dapat digunakan untuk mengidentifikasi faktor risiko yang berimplikasi pada masalah kesehatan ibu hamil dan janinnya.
Tujuan: Menganalisis faktor risiko maternal morbidity melalui implementasi teknik data mining berupa K-Means Clustering dan C4.5 Decision Tree Classification pada data Entry Antenatal Care (ANC) periode tahun 2018 – 2022.
Metode: Penelitian ini mengimplementasikan metode kuantitatif dengan pendekatan deskriptif untuk mendeskripsikan gambaran penelitian. Desain studi yang digunakan adalah cross-sectional dengan menggunakan data sekunder. Populasi dalam penelitian ini adalah ibu hamil yang melakukan kunjungan Antenatal Care dan diambil sampel penelitian berupa ibu hamil yang melakukan pemeriksaan Haemoglobin, mendapatkan tablet Fe, dan dilakukan pengukuran LILA untuk deteksi risiko Anemia dan KEK. Penelitian dilaksanakan di Poliklinik Kesehatan Ibu dan Anak Puskesmas Sleman pada bulan Maret – Juni tahun 2023.
Hasil: Dari 1.066 entry data kunjungan antenatal care (ANC) di Puskesmas Sleman tahun 2018 – 2022, diperoleh 3 cluster yang menunjukkan hasil clustering berdasarkan hasil pemeriksaan kadar Haemoglobin pada darah. Representasi hasil dari cluster_0 risiko tinggi Anemia dengan kelompok status kesehatan ibu hamil dengan hasil pemeriksaan Anemia rendah lebih banyak dibandingkan hasil pemeriksaan yang normal, cluster_1 risiko rendah dengan kelompok ibu hamil yang memiliki hasil pemeriksaan normal, dan cluster_2 risiko sedang di mana hasil pemeriksaan ibu hamil mengalami Anemia ringan lebih sedikit dibandingkan yang hasil pemeriksaannya normal. Klasifikasi dengan algoritma C4.5 Decision Tree Classification juga berhasil diterapkan dengan luaran berupa diagram pohon identifikasi status gizi ibu hamil risiko KEK dan menghasilkan 12 rules klasifikasi dengan tingkat akurasi 69,34%.
Kesimpulan: Dari hasil analisis teknik data mining yang dilakukan, faktor-faktor risiko yang berkaitan dengan maternal morbidity berupa risiko Anemia dan KEK pada ibu hamil di Puskesmas Sleman berhasil dilakukan. Hasil analisis dapat digunakan sebagai pedoman peningkatan taraf kesehatan ibu dan anak melalui program edukasi, sosialisasi, dan kebijakan publik peningkatan kesehatan ibu dan anak di Kabupaten Sleman.
Background: The healthcare sector has experienced rapid growth in the accumulation of data in the era of information technology and digitalization. The accumulated data has the potential to generate information that can transform the perspective and delivery of healthcare information services. The implementation of data mining techniques in the case of maternal morbidity with extensive data sets can be used to identify risk factors implicated in the health issues of pregnant women and their fetuses.
Objective: Analyzing the risk factors of maternal morbidity through the implementation of data mining techniques such as K-Means Clustering and C4.5 Decision Tree Classification on Antenatal Care (ANC) entry data for the period of 2018 – 2022.
Method: This study employed a quantitative approach with a descriptive method to depict the research framework. The study design was cross-sectional, utilizing secondary data through purposive sampling for sample selection within the population. The population in this research comprised pregnant women attending ANC visits and the research sample consisted of pregnant women who underwent Hb testing, received Fe tablets, and had Mid-Upper Arm Circumference (MUAC) measurements to detect the risk of Anemia and Protein-Energi Malnutrition (PEM). The data obtained were extracted from secondary records of the ANC at Poliklinik Kesehatan Ibu dan Anak Puskesmas Sleman in March – June 2023.
Output: Out of 1,066 Antenatal Care (ANC) visit data entries at Puskesmas Sleman from 2018 – 2022, three clusters were identified based on examining Hb levels in the blood. The representation of these clusters showed that cluster_0 for the high risk, cluster_1 for the low risk, and cluster_2 for the moderate risk. Additionally, the C4.5 Decision Tree classification algorithm was successfully applied, resulting in a tree diagram that identified the nutritional status of pregnant women at risk of Protein-Energi Malnutrition (PEM) with an accuracy level of 69.34%.
Conclusion: Based on the analysis of data mining techniques conducted, the risks associated with maternal morbidity, namely Anemia and Protein-Energy Malnutrition (PEM), in pregnant women at Puskesmas Sleman were successfully identified. The analysis results can serve as a guide for improving the health status of mothers and children through educational programs—awareness campaigns, and public policies aimed at enhancing maternal and child health in society.
Kata Kunci : Classification, Clustering, Data Mining, Maternal Health