A Hybrid Protein-Protein Docking Framework by Integrating Diffusion Generative Models (DGM) Pose Generation and FFT-Based Scoring Function
Afra Majida Hariono, Dr.Eng. Ir. Igi Ardiyanto, S.T., M.Eng., IPM., SMIEEE.; Syukron Abu Ishaq Alfarozi, S.T., Ph.D.
2025 | Skripsi | S1 TEKNIK BIOMEDIS
Penemuan obat modern menghadapi tantangan besar berupa lamanya waktu, biaya tinggi, serta rendahnya tingkat keberhasilan. Bioinformatika dan komputasi genomik menawarkan solusi melalui pendekatan in silico, salah satunya protein--protein docking untuk memprediksi interaksi molekuler secara tiga dimensi. Penelitian ini bertujuan mengembangkan kerangka kerja hibrida protein-protein docking yang mengintegrasikan Diffusion Generative Model (DGM) untuk pose generation dan Fast Fourier Transform (FFT)-based untuk scoring function, sehingga diperoleh sistem yang efisien dari segi waktu, namun tetap akurat untuk mendukung penemuan obat berbasis bioinformatika. Metodologi penelitian meliputi analisis literatur, penggunaan dataset DIPS-Plus (52 kompleks protein), pengembangan modul DGM dengan 250 langkah difusi, integrasi dengan fungsi skor berbasis FFT, serta evaluasi menggunakan metrik RMSD, efisiensi waktu, dan konsumsi sumber daya. Hasil penelitian menunjukkan bahwa metode hibrida ini mencapai median C-RMSD sebesar 10.15 Å, I-RMSD sebesar 10.18 Å, serta L-RMSD dalam kisaran yang dapat diterima. Dari sisi efisiensi, metode ini mencatat rata-rata runtime 40.55 detik per kompleks, dengan waktu minimum 8 detik dan maksimum 102 detik. Kesimpulan dari penelitian ini adalah kerangka kerja hibrida mampu berperan sebagai first-pass screening tool yang efisien untuk docking berskala besar, dengan implikasi pada percepatan proses penemuan obat. Penelitian dapat diperluas dengan menambahkan fleksibilitas struktur protein, pipeline end-to-end, serta integrasi simulasi dinamika molekuler untuk meningkatkan presisi.
Modern drug discovery faces significant challenges due to high costs, long development times, and low success rates. Bioinformatics and genomic computing provide solutions through in silico approaches, particularly protein--protein docking, which enables three-dimensional prediction of molecular interactions. This study aims to develop a hybrid protein--protein docking framework that integrates the Diffusion Generative Model (DGM) for pose generation and the Fast Fourier Transform (FFT)-based scoring function, thus obtaining a time-efficient yet accurate system to support bioinformatics-based drug discovery. The methodology involved literature analysis, utilization of the DIPS-Plus dataset (52 protein complexes), development of a DGM module with 250 diffusion steps, integration with an FFT-based scoring function, and evaluation using RMSD metrics, runtime efficiency, and resource consumption. Results show that the hybrid framework achieved a median C-RMSD of 10.15 Å, I-RMSD of 10.18 Å, and ligand RMSD within acceptable ranges. Runtime analysis demonstrated an average of 40.55 seconds per complex, with a minimum of 8 seconds and a maximum of 102 seconds. The study concludes that the proposed framework can serve as an efficient first-pass screening tool for large-scale docking applications, with significant implications for accelerating drug discovery. Future work includes extending the framework to flexible protein--protein docking, implementing a full end-to-end pipeline, and incorporating molecular dynamics simulations for refinement.
Kata Kunci : bioinformatics, protein-protein docking, diffusion generative model, FFT scoring, drug discovery