Pemodelan Wavelet Neural Network dengan Algoritma Genetika
BUDI WARSITO, Prof. Drs. Subanar, PhD.; Dr. Abdurakhman, M.Si
2016 | Disertasi | S3 MatematikaNeural Network (NN) merupakan salah satu model nonlinear yang banyak dikembangkan dalam pemodelan statistika terutama pada analisis data time series. Banyak penelitian yang telah dilakukan menunjukkan keunggulan model ini dibandingkan model-model yang lain. Namun demikian masih terdapat beberapa permasalahan dalam pemodelan NN untuk time series, diantaranya adalah penanganan pre-processing data input, inkonsistensi hasil estimasi serta pemilihan arsitektur jaringan optimal. Untuk penanganan permasalahan pre-processing data input dilakukan melalui pemisahan data berdasarkan komponen asli dan noise menggunakan dekomposisi wavelet. Koefisien wavelet hasil dekomposisi ini yang selanjutnya menjadi input bagi model NN. Transformasi wavelet yang digunakan untuk data time series adalah Maximal Overlap Discrete Wavelet Transform (MODWT) karena dalam setiap level dekomposisi terdapat koefisien wavelet dan skala sebanyak panjang data. Kelebihan ini mereduksi kelemahan pemfilteran dengan Discrete Wavelet Transform (DWT) yang tidak dapat dilakukan pada sebarang ukuran sampel. Permasalahan yang kemudian muncul adalah bagaimana menentukan level dekomposisi dan banyak koefisien pada setiap level. Pada penelitian ini kriteria Maximal Relevance Minimum Redundancy (mRMR) diterapkan pada transformasi MODWT untuk mendapatkan input optimal. Kriteria yang didasarkan pada nilai Mutual Information (MI) ini dipilih karena selain nilainya yang didasarkan pada relevansi antara variabel input dengan nilai target juga mempertimbangkan redundansi antar variabel input itu sendiri. Input optimal yang diperoleh dari proses dekomposisi wavelet selanjutnya dijadikan sebagai input pada model NN. Model hybrid yang terbentuk dinamakan sebagai model Wavelet Neural Network (WNN). Penentuan banyak unit tersembunyi pada lapisan NN lebih mengedepankan aspek komputasi melalui seleksi beberapa arsitektur sederhana sampai yang lebih kompleks dan selanjutnya dipilih yang terbaik. Pada permasalahan yang berkaitan dengan inkonsistensi hasil estimasi parameter (bobot) yang sering hanya mencapai optimum lokal dilakukan melalui penggunaan algoritma genetika. Hasil analisis menunjukkan bahwa penambahan individu super akan membuat algoritma genetika konvergen ke nilai optimum global. Ada dua kontribusi utama dari penelitian. Kontribusi pertama adalah pembentukan prosedur penentuan arsitektur optimal model WNN melalui pemilihan input koefisien wavelet hasil dekomposisi MODWT dengan kriteria mRMR. Kontribusi kedua adalah analisis konvergensi dari algoritma genetika pada pemodelan WNN. Selanjutnya model yang terbentuk diaplikasikan pada data time series, baik melalui pembangkitan secara random dengan model tertentu maupun data riil pada bidang finansial. Hasil kajian secara empiris menunjukkan bahwa algoritma genetika bekerja secara baik untuk mengestimasi parameter model WNN. Eksperimen yang dilakukan menunjukkan bahwa secara umum kestabilan dari hasil prediksi dengan optimasi algoritma genetika lebih baik dari metode konvensional, terutama pada data simulasi yang dibangkitkan dari model AR(2), GARCH dan model nonlinear. Analisis pada data riil bidang finansial juga menunjukkan kestabilan prediksi dengan algoritma genetika terutama untuk data training.
Neural Network (NN) is one of the non-linear model which has been developed a lot in statistical modeling, especially in time series analysis. Many researches have shown the advantages of this model compared to the others. However, there are still some problems in NN modeling for time series, including the handling of the input preprocessing, inconsistency of the estimation results and the selection of optimal architecture. The handling of the input preprocessing problem is carried out through the separation of data based on the original components and the noise using wavelet decomposition. Wavelet coefficients resulting from the decomposition are then become the inputs of NN model. Wavelet transformation which is regarded more appropriate for time series data is Maximal Overlap Discrete Wavelet Transform (MODWT), because each level of the decomposition contained wavelet coefficients and scaling coefficients as many as the length of the data. This advantage reduces the weaknesses of filtering by Discrete Wavelet Transform (DWT) which can not be performed on any sample size. The next problems arising is how to determine the level of decomposition and the number of coefficients in each level. In this study, the Maximal Relevance Minimum Redundancy (mRMR) criteria is applied in MODWT decomposition to obtain the optimal input. The criteria based on the Mutual Information (MI) value has been selected due to consider the redundancy between the input variable itself, as well as its value is based on the relevance of input variables with the target. The optimal input obtained from the wavelet decomposition, then used as input of NN model. The hybrid model formed is named Wavelet Neural Network (WNN) model. Determination of the number of units in the hidden layer emphasizes aspects of computing, through the selection of multiple architectures from simple to more complex and then choose the best one. On the issues relating to the inconsistency of the parameters (weights) estimation which often reach only a local optimum is done through the use of genetic algorithms. The analysis showed that the addition of a super individual would make a genetic algorithm converges to a global optimum. There are two main contributions of this research. The first is the establishment procedure of determining the optimal architecture of WNN model through the input selection of wavelet coefficients resulting from MODWT decomposition with mRMR criterion. The second contribution is the analysis of convergence of genetic algorithm in time series modeling. Furthermore, the model formed was applied in time series data, either by generating data from a certain model randomly and the real data in financial fields. The experimental results showed that, in general, the stability of the predicted results with the genetic algorithm is better than the conventional methods, especially in the simulation data generated from AR(2), GARCH and nonlinear models. Analysis in real data at the financial fields also shows the stability of predictions resulting from genetic algorithm, especially for the training data.
Kata Kunci : Time series, MODWT, WNN, mRMR, genetic algorithm