Analisis Komparatif Differential Privacy Pada Federated Learning Melalui Metode Server & Client Clipping Untuk Deteksi Penipuan Kartu Kredit
Bintang Restu Bawono, Dr. Ir. Guntur Dharma Putra, , S.T., M.Sc ; Dr.Eng. Ir. Sunu Wibirama, S.T., M.Eng., IPM.
2025 | Skripsi | TEKNOLOGI INFORMASI
Sebagian besar data transaksi perbankan bersifat imbalanced, dimana hal ini menjadikan model klasifikasi tradisional rentan menghasilkan false positive yang tinggi, mengakibatkan biaya investigasi tambahan serta potensi ketidaknyamanan bagi nasabah yang sah. Berbagai pendekatan, seperti data balancing melalui teknik oversampling ataupun undersampling, maupun data augmentation, strategi-strategi ini sering kali memperkenalkan synthetic data, meningkatkan risiko overfitting pada model klasifikasi tersebut. Federated Learning (FL)—paradigma yang melatih model kecerdasan buatan secara terdistribusi tanpa memindahkan data mentah—hadir sebagai alternatif dibanding praktik konvensional untuk melakukan training data dengan data yang terbatas untuk tiap institusi. Walau demikian, gradien yang dikirim dalam FL masih dapat mengungkap informasi sensitif. Di sinilah Differential Privacy (DP) berfungsi: menambahkan noise Gaussian terkontrol sebesar ? dan membatasi kebocoran lewat anggaran privasi ? (privacy budget), yaitu batas numerik seberapa banyak informasi tentang individu dapat tersirat dari keluaran algoritma.
Riset ini merancang dan mengevaluasi Differentially-Private Federated Learning pada European Credit Card Fraud Dataset memakai arsitektur Convolutional Neural Network. Sensitivitas gradien dibatasi melalui clipping, yakni memotong norma gradien ke ambang tertentu agar setiap pembaruan tidak menghasilkan kebocoran data. Empat skema clipping diuji—fixed clipping dan adaptive clipping yang ditempatkan di client ataupun server. Masing-masing dikombinasikan dengan empat tingkat noise (? = 0, 0,01, 0,03, dan 0,10) dan disimulasikan pada dua klien selama 50 communication rounds. Kinerja diukur menggunakan (?), clipping norm, accuracy, dan Area Under the ROC Curve (AUC)—metrik yang tangguh untuk data penipuan yang tidak seimbang.
Eksperimen menegaskan keberadaan privacy–utility trade-off. Pada tingkat noise rendah, seluruh varian model mempertahankan akurasi dan AUC tinggi dengan privacy budget yang masih ketat; sebaliknya, penambahan noise secara bertahap menaikkan ? sekaligus menurunkan utilitas model. Di antara keempat skema, konfigurasi adaptive-side adaptive clipping paling stabil sehingga memberikan kompromi terbaik antara perlindungan privasi formal dan efektivitas deteksi penipuan yang dapat diterapkan di dunia nyata
Kata Kunci : Federated Learning, Differential Privacy, Clipping, Convolutional Neural Network, Credit-Card Fraud.