Laporkan Masalah

DISTRIBUSI BINOMIAL NEGATIF-ERLANG PADA KASUS OVERDISPERSI

Sukamto, Dr. Adhitya Ronnie Effendie, M.Sc.

2024 | Skripsi | STATISTIKA

    Pengolahan data cacah biasanya menggunakan distribusi Poisson yang mengasumsikan nilai mean dan variansi sama (ekuidispersi). Namun, sering ditemui kondisi overdispersi dan underdispersi yang disebabkan oleh nilai nol berlebih. Distribusi Binomial Negatif, campuran distribusi Poisson dan Gamma, digunakan sebagai alternatif untuk overdispersi, tetapi tidak efisien untuk data dengan banyak angka nol. Sebagai solusi, penelitian ini memperkenalkan distribusi Binomial Negatif-Erlang, campuran distribusi Binomial Negatif dan Erlang, untuk menangani overdispersi dengan excess zeros. Parameter diestimasi menggunakan metode maksimum likelihood (MLE) dengan metode iterasi Newton Raphson. Distribusi Binomial Negatif-Erlang diaplikasikan pada data kecelakaan kendaraan tunggal pada tikungan horizontal dua jalur di daerah pedesaan Texas antara tahun 2003 sampai 2008. Selain itu, distribusi ini juga diaplikasikan pada data klaim asuransi. Model terbaik dipilih dengan membandingkan distribusi Poisson, Binomial Negatif, dan Binomial Negatif-Erlang menggunakan kriteria AIC dan SBC.

    Count data processing typically uses the Poisson distribution, which assumes the mean and variance are equal (equidispersion). However, conditions of overdispersion and underdispersion, caused by excess zeros, are often encountered. The Negative Binomial distribution, a mixture of the Poisson and Gamma distributions, is used as an alternative for overdispersion but is inefficient for data with many zeros. As a solution, this study introduces the Negative Binomial-Erlang distribution, a mixture of the Negative Binomial and Erlang distributions, to handle overdispersion with excess zeros. Parameters are estimated using the maximum likelihood method (MLE) with the Newton-Raphson iteration method. The Negative Binomial-Erlang distribution is applied to single-vehicle roadway departure crash data on rural two-lane horizontal curves in Texas between 2003 and 2008. Additionally, this distribution is also applied to insurance claim data. The best model is selected by comparing the Poisson, Negative Binomial, and Negative Binomial-Erlang distributions using the AIC and SBC criteria.

Kata Kunci : data cacah, excess zeros, overdispersi, distribusi campuran binomial negatif.

  1. S1-2024-412750-abstract.pdf  
  2. S1-2024-412750-bibliography.pdf  
  3. S1-2024-412750-tableofcontent.pdf  
  4. S1-2024-412750-title.pdf