Laporkan Masalah

ALGORITMA FORWARD DAN BACKWARD BERDASARKAN ENTROPI SEBAGAI ALTERNATIF UNTUK ALGORITMA SEGMENTASI CHAID (Chi-squared Automatic Interaction Detection)

SITI NURUL HASANA, Prof. Drs. Suryo Guritno, M.Stats, Ph.D.

2013 | Tesis | S2 Matematika

CHAID (Chi-squared Automatic Interaction Detection), yang diperkenalkan oleh Kass pada tahun 1980, adalah sebuah algoritma untuk mendeteksi secara otomatis interaksi antara dua atau lebih prediktor serta perannya dalam menjelaskan variabel dependen. Akan tetapi hal ini tidaklah selalu benar, terutama ketika muncul fenomena Paradoks Simpson. Hal ini dikarenakan adanya fakta bahwa CHAID adalah suatu algoritma seleksi maju yang didasarkan pada perhitungan marginal dan bukan pertimbangan independensi bersyarat. Dengan kata lain, CHAID menggunakan informasi marginal dengan menguji tabel total marginal yang dibentuk dengan menjumlahkan faktor-faktor lainnya, akan tetapi telah diketahui bahwa pelipatan tabel (collapsibility) tidak selalu sah untuk dilakukan. Disini akan dipaparkan algoritma alternatif lain, yaitu algoritma Forward dan algoritma Backward berdasarkan entropi. Algoritma Forward disusun dengan prosedur yang sama dengan prosedur CHAID klasik, kecuali pada penggunaan rasio likelihood untuk menguji independensi serta penggunaan entropi untuk mengevaluasi perubahannya. Sedangkan algoritma Backward merupakan algoritma eliminasi yang diawali dengan mengikutsertakan seluruh prediktor yang ada, selanjutnya akan dilakukan eliminasi prediktor-prediktor tersebut secara bertahap. Prosedur eliminasi ini didasarkan pada independensi bersyarat dan menggunakan konsep entropi dalam pengujiannya. Dari kedua laternatif tersebut, algoritma Backward inilah yang lebih disarankan sebagai alternatif untuk algoritma segmentasi CHAID, karena pada algoritma ini dimungkinkan tidak lagi memunculkan fenomena Paradoks Simpson.

CHAID (Chi-squared Automatic Interaction Detection), proposed by Kass in 1980, is an algorithm to detect, in automatic way, the interaction between two or more predictors and its role in the expla paradox is present. This is due to the fact that CHAID is a forward selection algorithm based on the marginal counts rather than in considering the conditional independent. In other words, CHAID uses marginal information by examination of the table of marginal totals formed by summing over the remaining factors, but it is well known that collapsibility is not always licit. This paper will propose alternative algorithms, they are Forward and Backward algorithms based on entropy. The Forward algorithm is generated by procedure in which is similar to the classic CHAID procedure, except that it uses the likelihood ratio to test for independence and entropy to evaluate the changes. The Backward algorithm is started with the full set of predictors and then continued with eliminating the predictors progressively. The elimination procedure is based on conditional independence and the use of entropy to test it. From both algorithms, the Backward is the suggested algorithm as alternative for CHAID segmentation algorithm

Kata Kunci : CHAID, Paradoks Simpson, Pelipatan Tabel (Collapsibility), Entropi, Algoritma Forward, Algoritma Backward; Collapsibility, Entropy, Forward and Backward algorithms


    Tidak tersedia file untuk ditampilkan ke publik.