Pengembangan Aplikasi Web Scraping Berbasis Cloud untuk MyTEnS GoBeyond Menggunakan Selenium dan Integrasi Google Spreadsheet
Aura Nisa' Hidayat, Dr. Sahirul Alam, S.T., M.Eng.
2025 | Tugas Akhir | D4 TEKNOLOGI JARINGAN
Kebutuhan akan tingginya volume data operasional sehingga membutuhkan
proses yang cepat, akurat, dan efisien. PT Telkom Indonesia selama ini masih
mengandalkan proses manual dalam pengumpulan data dari platform internal
perusahaan yaitu MyTEnS GoBeyond. Untuk mengatasi permasalahan tersebut, penelitian
ini bertujuan untuk mengembangkan sistem otomatisasi pengambilan data berbasis
teknik web scraping, yang diimplementasikan menggunakan bahasa pemrograman
Python dengan library Selenium. Sistem ini memanfaatkan layanan cloud computing
dari Amazon Web Services (AWS) dengan menjalankan sistem pada server virtual
Amazon EC2 berbasis sistem operasi Ubuntu, penjadwalan sistem dengan cron job,
serta menggunakan Amazon CloudWatch untuk monitoring server. Data hasil
scraping kemudian dikirim secara otomatis ke Google Spreadsheet melalui
integrasi Google Sheets API menggunakan autentikasi OAuth 2.0. Hasil dari
penelitian ini menunjukkan bahwa sistem berhasil melakukan scraping secara
otomatis setiap hari, dengan proses login, navigasi halaman, verifikasi data,
hingga pengunggahan ke spreadsheet berjalan lancar dengan rata-rata waktu 119
detik. Sistem ini terbukti dapat meningkatkan efisiensi waktu pengambilan data
>90% dibandingkan proses manual sebelumnya, meminimalisir resiko human
error, serta mendukung pemantauan real-time melalui spreadsheet. Dengan
demikian, sistem yang dikembangkan mampu menggantikan proses manual secara
efektif dan memberikan nilai tambah dalam proses pengumpulan data operasional
harian.
The increasing volume of data in corporate operations demands a
fast, automated, and error-minimized reporting system. PT Telkom Indonesia has
been relying on a manual process in collecting data from the company's internal
platform, MyTEnS GoBeyond. To overcome these problems, this research aims to
develop a data retrieval automation system based on web scraping techniques,
which is implemented using the Python programming language with the Selenium
library. This system utilizes cloud computing services from Amazon Web Services
(AWS) by running the system on an Amazon EC2 virtual server based on the Ubuntu
operating system, scheduling the system with a cron job, and using Amazon
CloudWatch for server monitoring. The scraped data is then sent automatically
to Google Sheets through Google Sheets API integration using OAuth 2.0
authentication. The results of this research show that the system succeeds in
scraping automatically every day, with the login process, page navigation, data
verification, and uploading to the spreadsheet running smoothly with an average
time of 119 seconds. This system is proven to be able to increase the
efficiency of data retrieval time >90% compared to the previous manual
process, minimize the risk of human error, and support real-time monitoring
through spreadsheets. Thus, the developed system is able to effectively replace
manual processes and provide added value in the daily operational data
collection process.
Kata Kunci : Web Scraping, Selenium, Amazon EC2, Cloud Computing, Otomatisasi Data