PERAMALAN DATA COMPOSITIONAL TIME SERIES DENGAN METODE RUNTUN WAKTU MULTIVARIAT MODEL VECTOR AUTOREGRESSIVE (VAR) (Studi Kasus: Penerapan pada Peramalan Distribusi Populasi Penduduk Amerika Serikat Berdasarkan Rentang Usia)
HERDIAN DENI PRAYOGA, Prof. Dr.rer.nat. Dedi Rosadi, M.Sc.
2018 | Skripsi | S1 STATISTIKAAitchison (1986) mengatakan bahwa kebanyakan metode statistika standar mengasumsikan data yang dianalisis berada di ruang riil dengan struktur geometri Euclidean, sedangkan ruang sampel natural dari data komposisional adalah simpleks. Berdasarkan hal tersebut, salah satu jenis dari data komposisional yaitu data Compositional Time Series (CTS) juga memiliki ruang sampel simpleks. Hal tersebut menyebabkan penggunaan metode peramalan data runtun waktu multivariat standar misalkan peramalan dengan model Vector Autoregressive (VAR) tidak sesuai digunakan pada data CTS. Akan tetapi, metode tersebut sebenarnya masih tetap dapat digunakan pada data CTS dengan catatan yang pertama yaitu harus dilakukan transformasi terlebih dahulu pada sampel data CTS menggunakan transformasi isometric log-ratio (ilr) berdasarkan dari Kynclova dkk. (2015), sehingga sampel data CTS tersebut berada dalam ruang riil berstruktur Euclidean dan setelah itu data hasil transformasi pada setiap variabel yang terbentuk harus stasioner. Sampel data hasil transformasi tersebut yang digunakan dalam pemodelan VAR, yang mana model VAR tersebut digunakan untuk meramalkan data yang berada di dalam ruang riil. Data hasil ramalan yang masih berada di dalam ruang riil tersebut, ditransformasikan kembali ke dalam ruang simpleks menggunakan transformasi invers ilr. Studi kasus peramalan data CTS dengan metode runtun waktu multivariat model VAR diterapkan pada data distribusi penduduk Amerika Serikat per tahun berdasarkan rentang usia. Jika data hasil peramalan yang dibangkitkan dengan model VAR mendekati data aktualnya, maka penggunaan metode tersebut dapat dikatakan sesuai, sehingga model VAR dapat digunakan untuk melakukan peramalan data CTS berdasarkan studi kasus peramalan distribusi penduduk Amerika Serikat berdasarkan rentang usia.
Aitchison (1986) said that the most standard statistical methods assume the analyzed data are in a real space with Euclidean geometric structures, whereas the natural sample space of the compositional data is a simplex space. Based on this case, one of the compositional data types is the Compositional Time Series (CTS) data which is also have a simplex sample space. That the matter causes the use of a standard multivariate time series forecasting method such as forecasting with Vector Autoregressive (VAR) model is not appropriate for the CTS data. However, the method is proper to be used for the CTS data under some conditions. Firstly, the CTS sample data must be transformed using isometric log-ratio (ilr) transformation based on Kynclova et al. (2015), so the CTS sample data are in a real space with a Euclidean structure, and after that the transformed sample data on each variable must be stationary. The transformed sample data are used for VAR modeling, which are used to forecast data in a real space. The forecast data in the real space, are transformed back into the simplex space using inverse ilr transformation. The case study for CTS data forecasting with the multivariate time series method under VAR model, are applied to the population distribution data of United States of America per year by age group. If the forecast data, which are generated with the VAR model, approach the actual data, then the use of the method can be said to be appropriate, so that the VAR model can be used to forecast the CTS data based on case studies of the population distribution forecasting of United States of America by age group.
Kata Kunci : Data Komposisional, Compositional Time Series, isometric log-ratio, stasioner, Vector Autoregressive.