Model Regresi Logistik Terboboti Geografis Berkorelasi Temporal Berbasis Copula
Pepi Novianti, Dr. Drs. Gunardi, M.Si.;Prof. Dr.rer.nat. Dedi Rosadi, M.Sc.
2024 | Disertasi | S3 Matematika
Regresi Terboboti Geografis (RTG) telah mendapatkan perhatian besar dalam analisis spasial karena memungkinkan estimasi parameter setiap lokasi dan penyajian dalam bentuk pemetaan. Pada data biner dengan efek spasial, model regresi yang dapat digunakan adalah Regresi Logistik Terboboti Geografis (RLTG). Banyak variabel menarik dalam geosains yang diamati tidak hanya lintas ruang, tetapi juga dipengaruhi efek waktu. Oleh karena itu, pengembangan model dengan informasi spasial dan temporal terus dikembangkan, di antaranya Regresi Terboboti Geografis dan Temporal (RTGT) dan Regresi Logistik Terboboti Geografis Berkorelasi Temporal (RLTGKT).
RLTGKT mengintegrasikan model RLTG dan pendekatan estimasi dua langkah pada data longitudinal. Untuk menghubungkan korelasi antara data spasiotemporal dengan struktur autokorelasi AR(1), RLTGKT mengadopsi konsep korelasi tetrachoric. RLTGKT mampu mengestimasi koefisien di setiap lokasi dan seluruh periode waktu, serta memvisualisasikan nilai dan pengaruh yang bervariasi secara spasial dan temporal. Namun, algoritma yang digunakan relatif besar dan membutuhkan waktu komputasi yang relatif lama. Selain itu dengan asumsi model marjinal berdistribusi Bernoulli, RLTGKT digunakan untuk memodelkan data spasiotemporal Binomial dan pembobot geografis dilakukan dengan pendekatan model Regresi Poisson Terboboti Geografis (RPTG).
Distribusi Binomial dan Poisson memiliki variabel acak yang berbeda, sehingga pemilihan bandwidth optimum dengan RPTG kurang sesuai untuk model RLTGKT. Oleh karena itu perlu digunakan model RLTG dengan asumsi data Binomial dalam penentuan bandwidth optimum. Untuk pengaruh temporal, korelasi tetrachoric digunakan untuk menentukan probabilitas gabungan dari dua variabel dependen bersifat biner dengan menggunakan probabiltas marjinal berupa probabilitas logistik. Selain korelasi tetrachoric, model copula juga dapat digunakan untuk menentukan probabilitas gabungan dari dua variabel dan mampu bersaing dengan metode probabilitas gabungan lainnya. Metode copula memiliki beberapa kelebihan yaitu memiliki interpretasi yang lebih jelas dan lebih mudah untuk dikembangkan untuk respon bivariat dengan tiga atau lebih kategori.
Dengan mengasumsikan data spasiotemporal berupa data Binomial, model RLTGKT dapat dikembangkan pada model RLTGKT data Binomial. Keterbaruan dari model RLTGKT berbasis copula pada data Binomial ini adalah menerapkan model RLTGB untuk menentukan pembobot geografis dan menggunakan pendekatan berbasis copula dengan model Regresi Logistik Rantai Markov Berbasis Copula (RLRMBC) untuk korelasi waktu. Dengan demikian model RLTGKT yang diusulkan dalam penelitian ini adalah model RLTGKT berbasis copula pada data Binomial. Tujuan penelitian ini adalah menentukan bandwidth spasial mengunakan model RLTG data Binomial, menentukan korelasi waktu dengan dependensi copula dan menentukan estimasi parameter model RLTGKT berbasis copula pada data Binomial dan mengaplikasikannya pada data nyata.
Model RLTG data Binomial (RLTGB) dan estimasi koefisien parameter dapat menggambarkan keragaman hubungan spasial yang berkaitan dengan variabel independen dan variabel dependen. Berdasarkan hasil simulasi estimasi parameter RLTGB diperoleh hasil konsistensi yang relatif tinggi pada nilai parameter bangkitan dan parameter dugaan dengan korelasi Pearson untuk Beta_1 adalah 0.989 (p < 0>
Model RLTGKT berbasis copula diaplikasikan pada data kasus Covid-19 di 34 provinsi di Indonesia pada periode waktu 1 Juli - 30 September 2021. Berdasarkan model RLTGKT berbasis copula diperoleh nilai R2 sebesar 90.92%, KTG sebesar 180,762 dan MAPE sebesar 63.10%. Dengan menggunakan Copula Clayton, Model RLTGKT dapat menangkap pengaruh spasial dan temporal yang berbeda-beda pada variabel faktor cuaca terhadap penyebaran Covid-19 di Indonesia.
Geographically Weighted Regression (GWR) has received
great attention in spatial analysis because it allows the estimation of
parameters for each location and presentation in the form of maps. In binary
data with spatial effects, the regression model that can be used is
Geographically Weighted Logistic Regression (GWLR). Many interesting variables
in geoscience are observed not only across space but also affect the effects of
time. Therefore, extended models with spatial and temporal information continue
to be developed, including Geographically and Temporal Weighted Regression
(GWTR) and Geographically Weighted Temporally Correlated Logistic Regression
(GWTCLR).
GWTCLR integrates the GWLR model and two-step
estimation on longitudinal data. To relate the correlation between the
spatiotemporal data and the AR(1) autocorrelation structure, GWTCLR adopts the
concept of tetrachoric correlation. GWTCLR is able to estimate coefficients at
each location and across time periods, and visualise the values and effects
that vary temporally and spatially in a transparent and comprehensive way.
However, the algorithm used is relatively large and requires a relatively long
computation time. In addition, with the assumption that the marginal model has
a Bernoulli distribution, GWTCLR is used to model Binomial spatiotemporal data
and geographically weighted is carried out using a Geographically Weighted
Poisson Regression (GWPR) model approach.
The Binomial and Poisson distributions are different
random variables, accordingly choosing the optimal bandwidth with GWPR is not
suitable. Therefore it is necessary to use the RLTG model with the assumption
of Binomial data in determining the optimum bandwidth. For temporal effects,
tetrachoric correlation is used to determine the joint probability of the two
dependent variables which are binary by using marginal in the form of logistic
probabilities. In addition to tetrachoric correlation, the copula model can
also be used to determine the joint probabilities of two variables and is able
to compete with other combined probability methods. The copula method has
several advantages, namely having a clearer interpretation and easier to
develop for bivariate responses with three or more categories.
By assuming the spatiotemporal data is in the form of
Binomial data, the GWTCLR model can be developed on the GWTCLR Binomial data
model. The novelty of the copula-based GWTCLR model is to apply the GWLR model
to determine geographically weighted and to use a copula-based approach with
the Copula-based Markov Chain logistic regression (CBMCLR) model for time
correlation. Therefore, the GWTCLR model proposed in this study is the
copula-based GWTCLR model on Binomial data. The aims of this study are to
determine the spatial bandwidth using the Binomial data GWLR model, to
determine the time correlation with copula dependencies and to determine
copula-based GWTCLR model parameter estimates on Binomial data and to apply the
model to real data.
The GWLR model for Binomial data (GWLBR) and parameter coefficient estimation can describe the diversity of spatial relationships associated with the independent and dependent variables. Based on the GWLBR parameter estimation simulation results, relatively high consistency results were obtained for the generated parameter values and estimated parameters with the Pearson correlation for Beta_1 being 0.989 (p < 0>
This copula-based GWTCLR model can also capture
spatial and temporal influences on Binomial data. The copula-based GWTCLR is
applied to data on Covid-19 cases in 34 provinces in Indonesia with the time
period 1 July - 30 September 2021. Based on the copula-based RLTGKT model, the
R2 value is 90.92%, KTG is 180.762 and MAPE is 63.10%. By using Clayton Copula,
the GWTCLR Model can capture the different spatial and temporal influences of
weather variable factors on the spread Covid-19 in Indonesia.
Kata Kunci : Regresi Logistik, Distribusi Binomial, Spasial, Regresi Terboboti Geografis, Temporal, Dependensi Waktu, Copula Clayton, Copula Gumbel, Copula Frank