Implementasi Sebaran Tweedie Dengan Power Parameter Yang Disesuaikan Dalam Model Linear Tergeneralisasi Untuk Memodelkan Kadar Hemoglobin Dalam Darah
NENGSI SAPUTRA, Drs. Danardono, MPH., Ph.D.
2025 | Skripsi | STATISTIKA
Model Linear Tergeneralisasi (GLM) merupakan perluasan dari regresi linear klasik yang memungkinkan variabel respons mengikuti distribusi dari keluarga eksponensial, serta menghubungkan nilai harapan respons dengan variabel prediktor melalui fungsi link tertentu. Penelitian ini mengimplementasikan distribusi Tweedie dalam kerangka GLM untuk memodelkan kadar hemoglobin berdasarkan data dari Australian Institute of Sport (AIS). Distribusi Tweedie dipilih karena fleksibilitasnya dalam menangani data kontinu positif serta kemampuan untuk menyesuaikan parameter daya p, sehingga model dapat beradaptasi dengan karakteristik distribusi data yang sesungguhnya. Kajian teoritis mengenai distribusi Tweedie dan aplikasinya dalam GLM dilakukan diikuti dengan estimasi parameter menggunakan metode maksimum likelihood. Evaluasi model dilakukan dengan kriteria informasi seperti AIC, BIC, nilai likelihood, dan analisis deviance. Selain itu, penelitian ini mengidentifikasi faktor-faktor signifikan yang memengaruhi kadar hemoglobin dalam darah. Pada penelitian ini, digunakan distribusi dengan paramater daya hasil estimasi dan dibandingkan dengan salah satu kasus khusus distribusi Tweedie, yaitu saat nilai parameter daya sebesar 3. Berdasarkan analisis yang telah dilakukan, diperoleh enam model yang kemudian dibandingkan untuk mendapatkan model terbaik. Hasil penelitian menunjukkan bahwa GLM dengan parameter daya hasil estimasi memberikan hasil yang lebih baik dalam memodelkan kadar hemoglobin dalam darah. Hal ini didukung juga dengan hasil uji diagnostik model yang terpenuhi pada semua kriteria.
Generalized Linear Model (GLM) is an extension of classical linear regression that allows the response variable to follow a distribution from the exponential family, and links the expected value of the response to predictor variables through a specific link function. This study implements the Tweedie distribution within the GLM framework to model hemoglobin levels based on data from the Australian Institute of Sport (AIS). The Tweedie distribution is chosen for its flexibility in handling positive continuous data and its ability to adjust the power parameter p, enabling the model to adapt to the actual data distribution characteristics. A theoretical review of the Tweedie distribution and its application in GLM is conducted, followed by parameter estimation using the maximum likelihood method. Model evaluation is performed using information criteria such as AIC, BIC, likelihood values, and deviance analysis. Furthermore, this study identifies significant factors influencing hemoglobin levels in the blood. In this research, models with the power parameter estimated from the data are compared to one special case of the Tweedie distribution where the power parameter equals 3. Based on the analysis, six models were developed and compared to determine the best model. The results indicate that the GLM with the estimated power parameter provides better performance in modeling hemoglobin levels. This conclusion is supported by diagnostic tests, all of which meet the required criteria.
Kata Kunci : Model Linear Tergenaralisasi, Tweedie, parameter daya, fungsi link. / Generalized Linear Model, Tweedie, power parameter, link function.