Identifikasi Spesies Burung Dalam Ekosistem Taman Nasional Alas Purwo Menggunakan Convolutional Neural Network Satu Dimensi
BIMANTARA HANUMPRAJA, Sentagi Sesotya Utami, S.T., M.Sc., Ph.D.; Ir. Agus Arif, M.T.
2019 | Skripsi | S1 TEKNIK FISIKAPenelitian konservasi lingkungan saat ini telah menggunakan rekaman vokalisasi satwa liar khususnya spesies burung dalam mengungkap ciri ekosistem. Namun pengamatan suara spesies burung membutuhkan waktu, biaya, dan tenaga yang besar jika dilakukan secara manual. Penggunaan metode pembelajaran mesin sudah banyak dikembangkan untuk melakukan pengamatan tersebut secara otomatis. Akan tetapi, metode tersebut masih membutuhkan proses ekstraksi fitur yang bergantung pada kemampuan dan pengalaman ahli, sehingga menimbulkan subjektifitas. Suara burung yang digunakan berasal dari segmentasi audio rekaman ekosistem Taman Nasional Alas Purwo. Jumlah data burung yang digunakan sebanyak 306 audio yang terdiri dari tiga spesies burung. Data mentah suara burung langsung dilatih menggunakan Convolutional Neural Network (CNN) satu dimensi. Tidak ada pemrosesan sinyal pada data suara burung. Standarisasi dilakukan menggunakan skor-Z (Z-Score). Lima variasi hyperparameter diterapkan pada model ini untuk mencari kombinasi hyperparameter terbaik. CNN satu dimensi yang memiliki dua layer konvolusi dan satu layer MaxPool mampu memberikan akurasi sebesar 86,36%. Kombinasi hyperparameter yang digunakan adalah learning rate sebesar 0,01, tanpa menggunakan dropout, tanpa menggunakan regularisasi L2 dan tanpa penambahan batch normalization. Selain itu, random seed digunakan untuk mencegah terjadinya perubahan akurasi ketika proses latih diulang.
Current environmental conservation studies have used vocal recordings of wildlife, especially bird species, in revealing ecosystem characteristics. But observing the sounds of bird species requires a lot of time, money and energy if done manually. The use of machine learning methods has been developed to carry out these observations automatically. However, this method still requires a feature extraction process that depends on the ability and experience of experts, giving rise to subjectivity. The sound of the birds used comes from the audio segmentation of the Alas Purwo National Park ecosystem record. The amount of bird data used was 306 audio consisting of three bird species. Raw bird sound data is directly trained using a one-dimensional Convolutional Neural Network (CNN). There is no signal processing on bird sound data. Standardization is done using the Z-Score. Five variations of hyperparameter are applied to this model to find the best hyperparameter combination. One-dimensional CNN which has two convolution layers and one MaxPool layer can provide an accuracy of 86.36%. The hyperparameter combination used is a learning rate of 0.01, without using dropout, without using L2 regularization and without the addition of batch normalization. In addition, random seed is used to prevent changes in accuracy when the training process is repeated.
Kata Kunci : Konvolusi Jaringan Saraf Satu Dimensi, Biodiversitas, Pengenalan Spesies, Taman Nasional Alas Purwo