Laporkan Masalah

PERBANDINGAN PERFORMA MODEL TIME SERIES UNTUK MENINGKATKAN AKURASI PERAMALAN PAJAK

Desy Jayanti, Prof. Ir. Selo, S.T., M.T., M.Sc., Ph.D., IPU, ASEAN Eng., Prof. Ir. P. Insap Santosa, M.Sc., Ph.D., IPU.

2025 | Tesis | S2 Teknologi Informasi

Peramalan penerimaan pajak disusun setiap bulan agar penerimaan negara dapat tercapai dengan optimal. Di Direktorat Jenderal Pajak (DJP), peramalan penerimaan pajak masih dilakukan secara konvensional, dengan metode rata-rata pertumbuhan, metode ekstraprolasi atau metode simulasi tunggal. Peramalan yang dilakukan belum menggunakan suatu metode yang spesifik. Padahal peramalan penerimaan pajak yang akurat sangat penting bagi pemerintah. Karena hal itu mempengaruhi berbagai strategi dalam kebijakan fiskal, alokasi sumber daya dan manajemen keuangan pemerintah. Penelitian tentang peramalan penerimaan pajak telah dilakukan menggunakan berbagai metode seperti Autoregressive Integrated Moving Average (ARIMA), Support Vector Regression (SVR), Exponential Smoothing (ETS), Trigonometric Seasonality Box-Cox Transformation ARIMA error Trends Seasonal (TBATS), neural networks, regresi berganda dan metode gabungan. Namun penelitian sebelumnya banyak yang hanya fokus pada pajak tidak langsung, seperti pajak pertambahan nilai (PPN), pajak penjualan atas barang dan jasa, dan pajak daerah. Untuk itu penelitian ini bertujuan untuk membandingkan performa model time series dalam peramalan pajak dengan berbagai jenis data sehingga memperoleh hasil peramalan pajak yang lebih komprehensif. Data yang digunakan dalam penelitian ini meliputi data pajak langsung, pajak tidak langsung, dan total pajak. Penelitian ini juga menggunakan empat jenis transformasi agar data lebih stasioner, yaitu transformasi Box Cox, transformasi Log Diferensiasi, transformasi Box Cox Diferensiasi dan Musiman, serta transformasi Log Diferensiasi dan Musiman. Model terbaik untuk data PPN ialah ARIMA-TBATS dengan transformasi Log Diferensiasi. Model ini memiliki performa lebih baik daripada penelitian sebelumnya dengan nilai MSE dan RMSE sebesar 1,93 dan 1,39. ARIMA-TBATS dengan Log Diferensiasi juga menunjukan performa terbaiknya pada data PPh 21 dengan MSE dan RMSE sebesar 0,619 dan 0,787. Sementara ARIMA dengan transformasi Log Diferensiasi dan Musiman unggul pada data Bea Meterai dengan MSE dan RMSE sebesar 0,225 dan 0,474. TBATS dengan transformasi Log Diferensiasi menunjukan performa paling unggul untuk data PPh 23, PPh 25 dan Total Pajak. Nilai MSE dan RMSE sebesar 0,44 dan 0,66 untuk PPh 23, 0,98 dan 099 untuk PPh 25, serta 1,02 dan 1,01 pada Total Pajak. TBATS dengan transformasi Log Diferensiasi dan Musiman unggul pada data PPh Final dengan MSE dan RMSE sebesar 0,21 dan 0,46. Penelitian ini juga dilakukan dengan membuat rancangan sistem peramalan pajak. Sistem ini memiliki efisiensi dalam pemeliharaan karena lebih hemat waktu dan biaya. Nilai deviasi peramalan yang dilakukan KPP dan sistem relatif berimbang. Dengan demikian, sistem ini dapat dijadikan sebagai salah satu pertimbangan dalam meramalkan penerimaan pajak di DJP. Penelitian selanjutnya dapat dilakukan dengan menambah variabel eksternal yang mempengaruhi penerimaan, seperti kondisi ekonomi, program insentif pajak, produk domestik bruto, dan jumlah wajib pajak aktif. Penambahan variabel eksternal ini dapat dilakukan pada model ARIMA dan LSTM dengan multivariabel.

Tax revenue forecasting is conducted on a monthly basis to ensure that national revenue targets can be optimally achieved. At the Directorate General of Taxes (DGT), tax forecasting is still performed using conventional methods, including average growth rate, extrapolation techniques, or single simulation models. These forecasts are not based on a specific standardized method. However, accurate forecasting of tax revenue is critically important for the government, as it directly affects various strategies in fiscal policy, resource allocation, and financial management. Previous research on tax revenue forecasting has employed various methods such as Autoregressive Integrated Moving Average (ARIMA), Support Vector Regression (SVR), Exponential Smoothing (ETS), Trigonometric Seasonality Box-Cox Transformation ARIMA error Trends Seasonal (TBATS), neural networks, multiple linear regression, and hybrid modeling approaches. However, many of these studies have primarily focused on indirect taxes, such as value-added tax (VAT), sales taxes, and local taxes. This study aims to compare the performance of various time series models for tax forecasting across different tax types, in order to produce more comprehensive forecasting results. The dataset used in this research includes direct taxes, indirect taxes, and total tax revenue. Four types of data transformations are applied to ensure stationarity: Box-Cox transformation, log-differencing, Box-Cox with seasonal differencing, and log transformation with seasonal differencing. The best-performing model for VAT is the ARIMA-TBATS model with log-differencing transformation, achieving superior performance compared to prior studies, with a mean squared error (MSE) of 1.93 and root mean square error (RMSE) of 1.39. The same ARIMA-TBATS model with log-differencing also showed the best performance for PPh 21, with MSE and RMSE values of 0.619 and 0.787, respectively. Meanwhile, the ARIMA model with log and seasonal differencing yielded the best results for stamp duty, with MSE and RMSE of 0.225 and 0.474. The TBATS model with log-differencing transformation demonstrated the highest accuracy for income tax article 23, income tax article 25, and total tax revenues. It achieved MSE and RMSE values of 0.44 and 0.66 for income tax article 23, 0.98 and 0.99 for income tax article 25, and 1.02 and 1.01 for total tax revenue, respectively. The TBATS model with log and seasonal differencing outperformed other models for final income tax, achieving MSE and RMSE of 0.21 and 0.46. This study also involves the design and implementation of a tax forecasting system. The system is efficient in terms of both time and cost for maintenance. The deviation between forecasts generated by the system and those issued by the tax office is relatively balanced. Thus, this system may serve as a viable alternative to support tax forecasting at the DGT. Future research may consider integrating external variables that influence tax revenue, such as macroeconomic conditions, tax incentive programs, gross domestic product (GDP), and the number of active taxpayers. These variables can be incorporated into ARIMA and LSTM models through multivariate modeling approaches.

Kata Kunci : Time series, Peramalan penerimaan pajak, ARIMA, SVR, TBATS, NNAR, LSTM.

  1. S2-2025-527355-abstract.pdf  
  2. S2-2025-527355-bibliography.pdf  
  3. S2-2025-527355-tableofcontent.pdf  
  4. S2-2025-527355-title.pdf