Laporkan Masalah

Resolusi Super dengan Generative Adversarial Networks Menggunakan Feature Map DenseNet dan InceptionNet untuk Content Loss

Jonathan Edmund, Wahyono, S.Kom., Ph.D.

2024 | Skripsi | ILMU KOMPUTER

Super Resolution (SR) atau Resolusi Super adalah teknik penting dalam pemrosesan citra yang bertujuan untuk meningkatkan resolusi gambar beresolusi rendah sehingga menghasilkan detail gambar berkualitas tinggi. Metode tradisional, seperti Interpolasi Bicubic, sering kali gagal menangkap detail tekstur dan informasi spasial secara akurat. Kehadiran Generative Adversarial Networks (GANs) telah membawa kemajuan signifikan dalam menghasilkan gambar yang lebih tajam dan realistis. Namun, masih terdapat tantangan dalam menangkap tekstur kompleks, terutama pada gambar-gambar struktural seperti bangunan dan teks, akibat keterbatasan model content loss yang digunakan pada model Super Resolution Generative Adversarial Networks (SRGAN).

Penelitian ini mengeksplorasi feature map alternatif dalam perhitungan content loss pada SRGAN, dengan menggantikan model Visual Geometry Group (VGG) dengan DenseNet dan InceptionNet. Menggunakan dataset ADE20K untuk pelatihan dan Urban100 untuk evaluasi, penelitian ini menilai efektivitas kedua arsitektur dalam menghasilkan gambar yang lebih detail dan realistis. Hasil menunjukkan bahwa SRGAN-InceptionNet unggul pada metrik objektif seperti PSNR dan SSIM, dengan PSNR sebesar 22,01 dan SSIM sebesar 65,23% pada Urban100. Di sisi lain, SRGAN-Dense121 menghasilkan output yang lebih disukai secara subjektif oleh pengguna, seperti yang ditunjukkan dengan nilai MOS tertinggi sebesar 3,83.

Super Resolution (SR) is an essential technique in image processing that aims to enhance the resolution of low-resolution images to produce high-quality image details. Traditional methods, such as bicubic interpolation, often fail to capture texture details and spatial information accurately. The advent of Generative Adversarial Networks (GANs) has brought significant advancements in generating sharper and more realistic images. However, challenges remain in capturing complex textures, particularly in structural images such as buildings and text, due to the limitations of the content loss model used in Super-Resolution Generative Adversarial Networks (SRGAN).

This research explores alternative feature maps for calculating content loss in SRGAN by replacing the Visual Geometry Group (VGG) model with DenseNet and InceptionNet. Using the ADE20K dataset for training and Urban100 for evaluation, the study assesses the effectiveness of both architectures in producing more detailed and realistic images. The results show that SRGAN-InceptionNet excels in objective metrics such as PSNR and SSIM, achieving a PSNR of 22.01 and an SSIM of 65.23\% on Urban100. On the other hand, SRGAN-Dense121 produces outputs that are more subjectively preferred by users, as evidenced by the highest MOS score of 3.83.

Kata Kunci : Super Resolution, Generative Adversarial Networks (GANs), DenseNet, InceptionNet, SRGAN

  1. S1-2024-481250-abstract.pdf  
  2. S1-2024-481250-bibliography.pdf  
  3. S1-2024-481250-tableofcontent.pdf  
  4. S1-2024-481250-title.pdf  
  5. S1-2025-481250-bibliography.pdf  
  6. S1-2025-481250-tableofcontent.pdf  
  7. S1-2025-481250-title.pdf