PENERAPAN METODE CHI-SQUARE AUTOMATIC INTERACTION DETECTOR (CHAID) PADA ANALISIS REGRESI LOGISTIK UNTUK MENINGKATKAN AKURASI PADA DATA LOYALITAS PEMEGANG POLIS ASURANSI KENDARAAN
MAYANG PUSPITASARI, Dr. Gunardi, M.Si.
2019 | Skripsi | S1 STATISTIKAAnalisis regresi merupakan ilmu yang mempelajari tentang suatu hubungan fungsional antara variabel-variabel yang dinyatakan dalam bentuk persamaan matematika. Pada analisis regresi, variabel tersebut dibedakan dalam dua jenis variabel yaitu variabel respon (Y) dan variabel prediktor (X). Namun untuk beberapa kasus variabel responnya tidak bersifat berkuantitatif melainkan kualitatif yang bersifat biner misalnya dalam mengukur loyalitas pemegang polis (lanjut atau tidak) oleh sebab itulah perlu menggunakan analisis regresi logistik. Dalam pengambilan keputusan tentunya mengharapkan akurasi yang terbaik. Apabila menggunakan regresi logistik maka ada kemungkinan terdapat heterogenitas akurasi klasifikasi antar segmen sehingga dapat membentuk model yang sama untuk semua pengamatan yang berakibat ukuran akurasi kurang baik. Hal ini dapat terjadi jika kinerja klassifier bervariasi secara signifikan diberbagai segmen pengamatan. Oleh sebab itu kita perlu membagi sampel menjadi beberapa kelompok homogen dan membangun model terpisah untuk masing-masing segmen menggunakan variabel dummy yang dapat dillakukan dengan metode Chi-Square Automatic Interaction Detector (CHAID). Dalam skripsi ini, metode Chi-Square Automatic Interaction Detector (CHAID) diaplikasikan untuk memodelkan faktor-faktor yang mempengaruhi keputusan pemegang polis asuransi kendaraan. Diperoleh akurasi model yang terbentuk meningkat.
Regression analysis is the study of relationship between variables expressed in the form of mathematical equations. In regression analysis, these variables are divided into two types of variables, the response variable (Y) and prediktor variable (X). But for some cases the response variable is not quantitative but qualitative which is binary for example in making decision (yes or no) because of that we use logistik regression analysis. In making decisions, we want have the best accuracy. If using logistik regression, there is a possibility that there is heterogeneity in classification accuracy between segments so that it can form the same model for all observations so the accuracy isn�t good. This can be done if the classifier's performance varies significantly in the various observation segments. Therefore we need to divide the sample into several homogeneous groups and build separate models for each segment using dummy variables that can be done using the Chi-Square Automatic Interaction Detector (CHAID) method. In this thesis, the Chi-Square Automatic Interaction Detector (CHAID) method was applied to model the factors that influence the decisions of vehicle insurance policyholders.
Kata Kunci : Regresi Logistik, Peningkatan akurasi, Maksimum Likelihood, CHAID.