Laporkan Masalah

Pemodelan Data Runtun Waktu Nonlinier Menggunakan Pendekatan Algoritma Regresi Spline Adaptif Multivariat

QUDHROTUL ZAHRO KH, Drs. Zulaela, Dipl.Med.Stats., M.Si

2019 | Skripsi | S1 STATISTIKA

Regresi spline adaptif multivariat atau multivariate adaptive regression splines (MARS) adalah salah satu algoritma yang merupakan perbaikan dari algoritma recursive partitioning dengan mengganti fungsi langkah oleh fungsi spline terpotong. Algoritma MARS digunakan untuk memodelkan hubungan antara variabel respon dan prediktor dengan cara nonparametrik. Cara nonparametrik digunakan pada data yang mempunyai dimensi tinggi, yaitu data dengan variabel prediktor lebih dari 3 dan jumlah sampel lebih dari 50. Dalam pemodelan data runtun waktu, algoritma MARS digunakan untuk memodelkan data runtun waktu nonlinier sebagai perbaikan dari pemodelan Threshold Autoregressive (TAR) dengan tujuan untuk menghasilkan model yang bersifat kontinu pada batas subregion. Salah satu alasan dilakukan pemodelan nonlinier adalah jika terdapat data pencilan dalam periode data runtun waktu. Model terbaik diperoleh dari kriteria pemilihan model dengan membandingkan nilai GCV* (modifikasi Generalized Cross Validation) berdasarkan jumlah minimum observasi (MO) dan maksimum interaksi (MI) yang digunakan dalam mengestimasi model. Pada studi kasus, dilakukan pemodelan data runtun waktu pada data inflasi Indonesia periode Januari 2005 hingga Oktober 2018. Setelah dilakukan analisis, diperoleh model nonlinier terbaik dengan jumlah MO sebanyak 2 dan jumlah MI sebanyak 3 dengan nilai GCV* sebesar 0,1734099.

Multivariate adaptive regression splines (MARS) is one algorithm that is an improvement of the recursive partitioning algorithm by replacing the step function by truncated spline functions. MARS algorithm is used to model the relationship between response and predictors variables in nonparametric method. Nonparametric method are used in data that has high dimensions, which has the number of predictor variables is more than 3 and the number of samples is more than 50. In time series data modeling, the MARS algorithm is used to model nonlinear time series data as an improvement of the Threshold Autoregressive (TAR) model with the goal is to produce a model that is continuous at the subregion boundary. One reason for nonlinear modeling is if there are outlier data in the time series data period. The best model is obtained of the model selection criteria by comparing the value of GCV* (modified Generalized Cross Validation) based on the number of minimum observation (MO) and maximum interaction (MI) used in estimating the model. In the case study, time series data modeling was carried out on Indonesian inflation data for the period January 2005 to October 2018. After analysis, the best nonlinear model is obtained with the number of MO is 2 and the number of MI is 3 with a value of GCV* is 0.1734099.

Kata Kunci : Data Runtun Waktu, MARS untuk model runtun waktu, modifikasi Generalized Cross Validation (GCV*), Data Pencilan

  1. S1-2019-368562-abstract.pdf  
  2. S1-2019-368562-bibliography.pdf  
  3. S1-2019-368562-tableofcontent.pdf  
  4. S1-2019-368562-title.pdf