Laporkan Masalah

Aplikasi Distribusi dan Regresi Bell dalam Penanganan Overdispersi pada Respon Data Cacah

HANDOKO PRASETYO, Prof. Dr.rer.nat. Dedi Rosadi, S.Si., M.Sc.Eng.Math

2024 | Skripsi | STATISTIKA

Regresi Poisson sebagai regresi yang umum digunakan untuk memodelkan data dengan variabel respon berupa data cacah, seringkali terkendala karena tidak terpenuhinya asumsi ekuidispersi yang menyebabkan hasil estimasi mengandung bias. Hal tersebut mengharuskan ditemukannya alternatif regresi lain yang dapat menangani masalah overdispersi pada data cacah. Salah satu alternatif yang dapat digunakan adalah model regresi Bell. Model ini merupakan pengembangan daripada regresi Poisson yang dipadukan dengan ekspansi bilangan Bell. Adapun metode yang digunakan untuk mengestimasi model ini adalah metode Maximum Likelihood Estimator menggunakan algoritma BFGS.

Dalam penelitian ini akan dibandingkan performa regresi Bell dan regresi Binomial Negatif dalam menangani overdispersi pada respon data cacah. Pada penelitian ini akan digunakan empat dataset yakni data jumlah kunjungan wisatawan mancanegara ke Indonesia tahun 2000-2022, data jumlah pengangguran terbuka di Indonesia tahun 2002-2023, data jumlah kematian bayi per kecamatan di Jawa Barat tahun 2020, dan data jumlah kematian ibu melahirkan per kecamatan di Jawa Barat tahun 2020. Berdasarkan hasil pengujian, diketahui bahwa performa regresi Bell dalam memodelkan lebih unggul dibandingkan regresi Binomial Negatif pada tiga dataset, sedangkan satu dataset sisa menunjukkan performa regresi Binomial Negatif lebih unggul. Proses pembandingan menggunakan ukuran kebaikan model berupa nilai Akaike Information Criterion (AIC) dan nilai loglikelihood.

Poisson regression, which is commonly used to model data with count response variables, often encounters issues due to the unmet assumption of equidispersion, resulting in biased estimation outcomes. This necessitates the exploration of alternative regression models that can handle overdispersion in count data. One such alternative is the Bell regression model. This model is an extension of the Poisson regression, incorporating Bell number expansion. The method used to estimate this model is the Maximum Likelihood Estimator using the BFGS algorithm.

This study compares the performance of Bell regression and Negative Binomial regression in addressing overdispersion in count data response. Four datasets are used in this research: the number of international tourist visits to Indonesia from 2000-2022, the number of open unemployment in Indonesia from 2002-2023, the number of infant deaths per district in West Java in 2020, and the number of maternal deaths per district in West Java in 2020. Based on the test results, it is found that the performance of Bell regression is superior to Negative Binomial regression in three datasets, while the remaining dataset shows better performance with Negative Binomial regression. The comparison process uses model goodness criteria such as the Akaike Information Criterion (AIC) value and the loglikelihood value.

Kata Kunci : Overdispersi, AIC, Bell, Binomial Negatif, Poisson

  1. S1-2024-462314-abstract.pdf  
  2. S1-2024-462314-bibliography.pdf  
  3. S1-2024-462314-tableofcontent.pdf  
  4. S1-2024-462314-title.pdf