Laporkan Masalah

POHON REGRESI DENGAN PENDEKATAN GENERALIZED UNBIASED INTERACTION DETECTION ESTIMATION (GUIDE) UNTUK DATA MULTIRESPON

MUHAMMAD ILHAM MUBAROK, Drs. Danardono, M.PH., Ph.D.

2018 | Skripsi | S1 STATISTIKA

Pohon regresi dapat digunakan untuk memprediksi objek atau sampel berdasarkan beberapa variabel prediktor. Pohon regresi merupakan salah satu teknik decision tree yang dibentuk melalui algoritma penyekatan secara rekursif. Perbedaannya dengan regresi klasik adalah pada metode pohon regresi pengaruh variabel bebas serta pendugaan responnya dilakukan pada kelompok-kelompok pengamatan yang ditentukan berdasarkan variabel-variabel bebas, sehingga interpretasi hasil dari metode ini lebih mudah. CART merupakan algoritma yang paling umum dalam membentuk pohon regresi. Namun algoritma ini memiliki kelemahan yaitu adanya bias dalam seleksi variabel. Bias dalam seleksi variabel ini dapat menghasilkan struktur pohon yang terlalu besar atau terlalu kecil serta dapat mengaburkan pentingnya variabel. GUIDE merupakan algoritma yang berusaha menangani bias dalam seleksi variabel dengan mengganti metode satu langkah CART menjadi dua langkah yaitu pemilihan variabel kemudian menemukan titik split dari variabel yang terpilih. GUIDE dapat juga diterapkan pada data multirespon. Pada studi kasus digunakan data tentang energy performance of building (EPB) yang akan digunakan untuk membentuk pohon regresi multirespon. Diperoleh pohon regresi multirespon dengan 15 simpul dan 8 simpul terminal serta variabel bebas yang membentuk pohon adalah Overall Height, Glazing Area, Wall Area, dan Relative Compactness.

Regression trees can be used to predict objects or samples based on several predictor variables. The regression tree is one of the decision tree techniques that is formed through recursive reconciling algorithms. The difference with the classical regression is the regression tree method of the influence of independent variables and the estimation of the response is done to the observation groups determined based on the independent variables, so interpretation of the results of this method is easier. CART is the most common algorithm in forming regression trees. But this algorithm has a weakness that is the bias in the selection of variables. Bias in this variable selection can result the tree structures that are too large or too small and may obscure the importance of variables. GUIDE is an algorithm that tries to handle bias in variable selection by substituting one step CART method into two steps ie variable selection then find split point of selected variable. GUIDE can also be applied to multirespon data. In the case study, we use data on energy performance of building (EPB) to form multirespon regression tree. So that, provided multirespon regression tree with 15 node and 8 terminal nodes and predictor variables that make up the tree are Overall Height, Glazing Area, Wall Area, and Relative Compactness.

Kata Kunci : Pohon Keputusan, Pohon Regresi, GUIDE, Uji Chi-square, Multirespon


    Tidak tersedia file untuk ditampilkan ke publik.