Laporkan Masalah

Klasifikasi Jenis Sel Darah Putih dengan Metode Random Forest

NOOR IZZA FITRIANI, Nopriadi, S.T., M.Sc., Ph.D. , Ir. Agus Arif, M.T.

2018 | Skripsi | S1 TEKNIK FISIKA

Klasfikasi jenis sel darah putih merupakan suatu objek yang butuh untuk dikembangkan karena dengan dilakukannya klasifikasi atau perhitungan mengenai sel darah putih dapat membantu diagnosis awal suatu penyakit pada seseorang. Alat yang digunakan untuk mengklasifikasikan jenis sel darah putih pada kenyataannya telah diciptakan yaitu hematology blood analyzer, akan tetapi alat tersebut terbatas dan tidak terdapat di seluruh lab atau rumah sakit dikarenakan harganya yang mahal. Salah satu bidang teknologi berupa machine learning menyajikan suatu metode yang dapat digunakan untuk melakukan klasifikasi jenis sel darah putih. Salah satu algoritma yang dapat untuk digunakan mengklasifikasi adalah random forest. Pada peneltian ini dilakukan klasifikasi jenis sel darah putih dengan metode random forest dalam RStudio. Jumlah fitur yang digunakan dalam pengkalsifikasian ini adalah 29 fitur, yang terdiri dari 169 data. Dari 169 data citra tersebut, terdapat 123 data latih dan 46 data uji. Dilakukan variasi jumlah mtry dan ntree untuk melakukan optimalisasi akurasi. Hasil dari penelitian ini adalah didapatkannya nilai akurasi sebsesar 91.3%. Tingkat akurasi pengklasifikasian jenis sel darah putih mencapai angka 91.3% pada 6 titik percobaan mtry, yaitu pada penggunaan mtry = 2, 6, 11, 13, 15, dan 26 dengan ntree (jumlah pohon) 425. Eror OOB terkecil yang didapatkan adalah pada penggunaan mtry= 26, yaitu 8.13%.

Classification of white blood cells needs to be developed because the calculation or analysis of white blood cells can be used to diagnose a disease. Classification of types of white blood cells can be done by using hematology blood analyzer, but the tool can not be found in every lab or hospital because it is too expensive. One field of technology such as machine learning can be used to classify the types of white blood cells, and it can be used to help the blood analyst to relieve the human error. One of algorithms that can be used to classify is random forest. In this research, the classification of white blood cells using random forest method in RStudio is carried out. The number of features used in this classification are 29 features consisting of 169 data. In the data, there are 123 training data and 46 testing data. Variations in the number of mtry and the number of trees (ntree) are used to do the accuracy optimization.The result of this research is that the accuracy reachs 91.3% at 6 points, and these are when mtry equals to 2, 6, 11, 13, 15, and 26 and when the number of trees (ntree) equals to 425 . The smallest OOB error obtained is the use when mtry equals to 26 which is 8.13%.

Kata Kunci : Random forest, machine learning, eror OOB, mtry, ntree.

  1. S1-2018-363534-abstract.pdf  
  2. S1-2018-363534-bibliography.pdf  
  3. S1-2018-363534-tableofcontent.pdf  
  4. S1-2018-363534-title.pdf