Laporkan Masalah

Perbandingan Metode Klasifikasi Rotation Forest dan Random Forest pada Data Tanah Longsor

Reta Salma Adhani, Dr. Nanang Susyanto, S.Si., M.Sc., M.Act.Sc.

2023 | Skripsi | STATISTIKA

Pada studi machine learning, analisis klasifikasi bertujuan untuk meminimalkan kesalahan klasifikasi dan juga memaksimalkan hasil akurasi prediksi. Klasifikasi adalah pembelajaran penting untuk pengenalan pola (karakteristik pada data). Studi ini menganalisis dan membandingkan model kerentanan tanah longsor menggunakan algoritma Random Forest (RF), dan Rotation Forest (RoF). Penelitian ini dilakukan pada set data tertentu, di Italia tengah yang terdiri dari total 7.360 unit lereng yang mencakup area 4095 km2. Unit-unit lereng diklasifikasikan menjadi unit-unit dengan atau tanpa longsor. Selain itu, setiap unit lereng juga telah diberi 26 atribut yang digunakan sebagai variabel independen.

Random Forest merupakan algoritma machine learning dengan membentuk lebih dari satu pohon keputusan sehingga seperti hutan (forest) dan klasifikasi dengan metode ini menggunakan suara keputusan terbanyak (majority vote). Sedangkan Rotation Forest merupakan pengembangan dari Random Forest dengan menggunakan PCA untuk membentuk matriks rotasi yang bertujuan mentransformasikan himpunan data awal yang akan disusun ulang menjadi data untuk membangun pohon keputusan yang saling bebas satu sama lain. Akan dibandingkan performa dari model klasifikasi metode random Forest dan Rotation Forest dengan Confusion Matrix dan Receiver Operating Characteristic (ROC). Hasil penelitian menunjukkan bahwa Rotation Forest memiliki performa yang lebih baik dibandingkan dengan Random Forest.

In machine learning studies, classification analysis aims to minimize classification error and also maximize prediction accuracy results. Classification is an important learning for pattern recognition (characteristics in data). This study analyzes and compares landslide susceptibility models using Random Forest (RF), and Rotation Forest (RoF) algorithms. The study was conducted on a specific dataset, in central Italy consisting of a total of 7.360 slope units covering an area of 4.095 km2. The slope units were classified into units with or without landslides. In addition, each slope unit has also been assigned 26 attributes that are used as independent variables.

Random Forest is a machine learning algorithm by forming more than one decision tree so that it is like a forest and classification with this method uses the majo rity vote. While Rotation Forest is the development of Random Forest by using PCA to form a rotation matrix that aims to transform the initial data set which will be rearranged into data to build decision trees that are independent of each other. The performance of the classification model of the Random Forest and Rotation Forest methods will be compared with the Confusion Matrix and Receiver Operating Characteristic (ROC). The results showed that Rotation Forest has better performance than Random Forest.

Kata Kunci : Machine Learning, Klasifikasi, Rotation Forest, Random Forest

  1. S1-2023-442606-abstract.pdf  
  2. S1-2023-442606-bibliography.pdf  
  3. S1-2023-442606-tableofcontent.pdf  
  4. S1-2023-442606-title.pdf