Laporkan Masalah

Optimalisasi Portofolio Saham LQ45: Komparasi Metode Markowitz Mean-Variance Optimization dan Deep Reinforcement Learning dengan Algoritma Deep Deterministic Policy Gradient Dengan Algoritma Deep Deterministic Policy Gradient

Tristan Raphael Widiputra Harsono, Dr. Nanang Susyanto, S.Si., M.Sc., M.Act.Sc.

2025 | Skripsi | S1 ILMU AKTUARIA

Meningkatnya jumlah investor di pasar modal Indonesia mendorong pentingnya strategi pengelolaan portofolio yang efektif, terutama dalam menghadapi volatilitas pasar yang tinggi. Oleh karena itu, diperlukan suatu pendekatan yang mampu mengoptimalkan portofolio dengan mempertimbangkan manajemen risiko secara adaptif. Penelitian ini membandingkan dua metode dalam mengoptimalkan bobot portofolio saham LQ45, yaitu Mean-Variance Optimization (MVO) sebagai metode tradisional dan Deep Reinforcement Learning (DRL) dengan algoritma Deep Deterministic Policy Gradient (DDPG) sebagai metode modern. Data yang digunakan mencakup periode in-sample dari 10 Juli 2023 hingga 30 Desember 2024 untuk dipelajari model dan periode out-of-sample dari 2 Januari 2025 hingga 2 Juni 2025 untuk melihat hasil. Evaluasi dilakukan berdasarkan indikator performa seperti return, volatility, Sharpe Ratio, Value at Risk (VaR), dan Conditional Value at Risk (CVaR). Hasil menunjukkan bahwa DDPG menghasilkan return lebih tinggi dan volatility lebih rendah dibandingkan MVO, serta lebih responsif terhadap perubahan pasar melalui pembaruan bobot secara dinamis. Hyperparameter DDPG dioptimalkan menggunakan Bayesian Optimization untuk meningkatkan kinerja model. Temuan ini menunjukkan bahwa pendekatan berbasis machine learning, khususnya DRL, berpotensi menjadi solusi yang lebih adaptif dan efisien dalam manajemen portofolio saham.

The increasing number of investors in the Indonesian capital market highlights the importance of effective portfolio management strategies, especially in facing high market volatility. This study compares two methods for optimizing LQ45 stock portfolio weights, the traditional Mean-Variance Optimization (MVO) and the modern Deep Reinforcement Learning (DRL) approach using the Deep Deterministic Policy Gradient (DDPG) algorithm. The data covers the in-sample period from July 10, 2023 to December 30, 2024 for model to learn and the out-of-sample period from January 2, 2025 to June 2, 2025 for testing. Performance is evaluated using indicators such as return, volatility, Sharpe Ratio, Value at Risk (VaR), and Conditional Value at Risk (CVaR). The results show that DDPG achieves higher returns and lower volatility compared to MVO, and is more responsive to market changes through dynamic portfolio weight updates. DDPG hyperparameters are optimized using Bayesian Optimization to improve model performance. These findings suggest that Machine learning-based approaches, particularly DRL, have strong potential as a more adaptive and efficient solution for stock portfolio management.

Kata Kunci : Deep Reinforcement Learning, DDPG, Mean-Variance Optimization, Optimalisasi Portofolio, LQ45

  1. S1-2025-483128-abstract.pdf  
  2. S1-2025-483128-bibliography.pdf  
  3. S1-2025-483128-tableofcontent.pdf  
  4. S1-2025-483128-title.pdf