Analisis Partisipasi Klien dalam Federated Learning untuk Pemeliharaan Prediktif: Analisis Kinerja dan Generalisasi Model
Muhammad Hanan Syarif, Ir.Andi Rahadiyan Wijaya, S.T., M.Sc., Ph.D., IPM.
2025 | Tesis | S2 Teknik Industri
Integrasi Federated Learning (FL) dalam pemeliharaan prediktif menjadi bagian penting dari perkembangan Industri 4.0 dan Internet of Things (IoT) di sektor industri. Namun, penerapan FL di lingkungan industri menghadapi tantangan, khususnya terkait distribusi data yang bersifat non-iid (tidak independen dan identik) antar mesin. Selain itu, jumlah klien yang berpartisipasi dalam proses pelatihan sering kali bervariasi, yang dapat berdampak signifikan terhadap kinerja dan generalisasi model. Oleh karena itu, pemahaman tentang bagaimana model FL dapat mempertahankan kemampuan generalisasi di seluruh klien, terutama dalam kondisi jumlah partisipasi yang berubah-ubah, menjadi aspek penelitian yang krusial. Penelitian ini secara khusus mengeksplorasi tiga arsitektur model — 1D CNN-GRU, 1D CNN-LSTM, dan 1D CNN-BiLSTM — dalam kerangka Federated Learning, dengan menjaga privasi data melalui pelatihan kolaboratif tanpa pertukaran data mentah. Dataset Microsoft Azure Predictive Maintenance digunakan untuk mengevaluasi kinerja model secara sistematis di bawah berbagai skenario partisipasi klien. Hasil eksperimen menunjukkan bahwa peningkatan jumlah klien yang berpartisipasi meningkatkan kinerja model dan generalisasi, terutama untuk klien yang tidak terlihat. Namun, peningkatan ini menunjukkan hasil yang semakin kecil setelah ambang batas tertentu. Analisis statistik menunjukkan bahwa peningkatan kinerja yang signifikan terjadi ketika partisipasi klien meningkat dari 11 menjadi 22, 33, dan 44 klien, seperti yang ditunjukkan oleh nilai-p yang mencerminkan perbedaan yang berarti. Di atas 44 klien (misalnya, 55 hingga 66 klien), peningkatan akurasi menjadi tidak signifikan secara statistik. Secara keseluruhan, penelitian ini menegaskan bahwa Federated Learning dapat meningkatkan kinerja dan generalisasi model pemeliharaan prediktif secara efektif sambil menjaga privasi data, serta menawarkan wawasan penting mengenai tingkat partisipasi klien yang optimal untuk penerapan praktis di lingkungan industri nyata.
The integration of Federated Learning (FL) in predictive maintenance is an important part of the development of Industry 4.0 and the Internet of Things (IoT) in the industrial sector. However, the implementation of FL in an industrial environment faces challenges, especially regarding the distribution of non-iid (not independent and identical) data between machines. In addition, the number of clients participating in the training process often varies, which can have a significant impact on model performance and generalization. Therefore, understanding how FL models can maintain generalization ability across clients, especially under the condition of changing participation numbers, is a crucial aspect of research. This research specifically explores three model architectures - 1D CNN-GRU, 1D CNNLSTM, and 1D CNN-BiLSTM - in a Federated Learning framework, by maintaining data privacy through collaborative training without raw data exchange. The Microsoft Azure Predictive Maintenance dataset is used to systematically evaluate the performance of the models under various client participation scenarios. The experimental results show that increasing the number of participating clients improves model performance and generalization, especially for invisible clients. However, this improvement shows diminishing returns after a certain threshold. Statistical analysis showed that significant performance improvements occurred when client participation increased from 11 to 22, 33, and 44 clients, as indicated by p-values reflecting meaningful differences. Above 44 clients (e.g., 55 to 66 clients), the improvement in accuracy became statistically insignificant. Overall, this study confirms that Federated Learning can effectively improve the performance and generalization of predictive maintenance models while preserving data privacy, as well as offer important insights regarding the optimal client participation level for practical application in real industrial environments.
Kata Kunci : Federated Learning, Predictive Maintenance, Generalization Performance, Model Scalability, Industrial IoT