EVALUASI PERFORMA MACHINE LEARNING UNTUK ANALISIS LEUKOSIT ABNORMAL DARAH TEPI PADA PENDERITA ACUTE LYMPHOBLASTIC LEUKEMIA
YUSUF MAULANA, 4. Dr. Eng. Herianto, S.T., M. Eng ; Dr. dr. Usi Sukorini, M.Kes., Sp.PK(K).
2022 | Tesis | MAGISTER TEKNIK BIOMEDISAcute Lymphoblastic Leukemia (ALL) merupakan salah satu keganasan hematologi yang ditandai dengan proliferasi abnormal limfoblas di sumsum tulang yang sering menyerang anak-anak. Penyakit ini dapat didiagnosis dengan menemukan dan menghitung jumlah limfoblas dalam darah tepi. Identifikasi sel darah dalam apusan darah tepi dilakukan oleh ahli hematologi menggunakan mikroskop. Limfoblas kadang sulit dikenali dan dibedakan dengan leukosit lain, terutama limfosit. Pemeriksaan membutuhkan fokus dan pengalaman subjektif, sehingga memungkinkan untuk kesalahan. Pemeriksaan dengan bantuan machine learning dapat membantu dalam meningkatkan kinerja ahli hematologi. Penelitian ini bertujuan untuk mengklasifikasikan jenis leukosit sebagai metode bantu ahli hematologi dalam melakukan skrining dengan menggunakan metode yang terbaik pada pasien yang didiagnosis acute lymphoblastic leukemia. Citra leukosit diambil menggunakan mikroskop, kemudian citra tersebut dilabeli oleh ahli hematologi. Citra yang sudah dilabeli akan dilakukan ekstraksi fitur dan diproses menggunakan machine learning untuk dilakukan proses klasifikasi. Metode machine learning yang digunakan pada penelitian ini menggunakan random forest dan support vector machines (SVMs). Dataset pada penelitian ini terbagi menjadi dua dataset, yakni 80% data digunakan untuk pelatihan dan 20% digunakan untuk pengujian. Pada proses klasifikasi diterapkan teknik oversampling dan optimasi parameter untuk mendapatkan nilai performa yang lebih baik. Support Vector Machines memiliki nilai performa yang lebih baik daripada random forest untuk setiap jenis leukosit selain jenis limfosit. Proses pelatihan dan pengujian pada metode tersebut menghasilkan waktu 4 kali lebih cepat daripada penggunaan metode Random Forest. Metode support vector machines memiliki nilai f-1 score pada jenis limfoblas lebih tinggi daripada metode random forest yakni sebesar 88,44% dengan nilai parameter C sebesar 128.
Acute Lymphoblastic Leukemia (ALL) is a haematological malignancy characterized by abnormal proliferation of lymphoblasts in the bone marrow, which often affects children. This disease can be diagnosed by finding and counting the number of lymphoblasts in the peripheral blood. Identification of blood cells in a peripheral blood smear is performed by a hematologist using a microscope. Lymphoblasts sometimes struggle to recognize and distinguish from other leukocytes, especially lymphocytes. The examination requires focus and subjective experience, thus allowing for error. Examination with the help of machine learning can help in improving the performance of the hematologist. This study aims to classify the types of leukocytes as a method to assist hematologists in screening using the best method in patients diagnosed with acute lymphoblastic leukemia. The leukocyte image is taken using a microscope, and then the image is labelled by a hematologist. The labelled image will be feature extracted and processed using machine learning for the classification process. The machine learning method used in this study uses random forest and support vector machines (SVMs). The dataset in this study is divided into two datasets, 80% of the data is used for training, and 20% is used for testing. In classification, oversampling techniques and parameter optimization are applied to get better performance values. Support Vector Machines have a better performance value than random forest for each type of leukocyte other than the type of lymphocyte. This method's training and the testing process were four times faster than the random forest method. The support vector machines method has a higher f-1 score for lymphoblasts than the random forest method, which is 88.44% with a C parameter value of 128.
Kata Kunci : ALL, Limfoblas, Machine Learning, SVMs, Random Forest