PENGEMBANGAN METODE MEL-FREQUENCY CEPSTRAL COEFFICIENTS CO-OCCURRENCE MATRIX MULTIKANAL UNTUK AUDIO FORENSIK REKAMAN TERPENGARUH FAKTOR PENUAAN
ROY RUDOLF HUIZEN, Prof. Jazi Eko Istiyanto, M.Sc., Ph.D., IPU. ; Dr. Agfianto Eko Putra, M.Si.
2018 | Disertasi | S3 Ilmu KomputerAudio forensik pada rekaman suara salah satunya digunakan mengetahui identitas individu. Prosesnya dengan membandingkan karakteristik ciri sampel kata rekaman bukti dan pembanding. Hasil mencocokkan bukti dan pembanding untuk interval waktu singkat akurasi tinggi, sedangkan untuk interval waktu hingga puluhan tahun akurasi menurun. Penurunan akurasi dipengaruhi perubahan karakteristik ciri karena pertambahan usia. Meningkatkan akurasi untuk interval waktu hingga puluhan tahun menjadi masalah utama dipecahkan pada penelitian ini. Sehingga perlu dikembangkan metode ekstraksi ciri yang dapat meningkatkan akurasi. Metode ekstraksi ciri pada penelitian ini mengeksplorasi Mel-frequency cepstral coefficients (MFCC), mengembangkannya secara multikanal. Proses ekstraksi ciri multikanal dengan memilah suara menjadi lima bagian sesuai dengan komponen ciri yaitu frekuensi dasar (F0) dan frekuensi resonansi 1 hingga 4 (F1, F2, F3, F4). Ekstraksi ciri secara multikanal menjadi kontribusi utama penelitian ini, kontribusi lainnya adalah varian skala Mel, terdiri atas multikanal 5-varian filterbank (M5FB), multikanal 2-varian filterbank (M2FB) dan multikanal 1-varian filterbank (M1FB). Kontribusi lainnya berupa koefisien cepstrum di ekstraksi menggunakan Gray Level Co-Occurrence Matrix (GLCM). Metode tersebut dikenal sebagai MFCC multikanal (Mel-Frequency Cepstral Coefficients Co-Occurrence Matrix Multikanal). Pengujian metode ekstraksi ciri MFCC multikanal menggunakan rekaman bukti dan pembanding, dengan interval waktu 10 dan 25 tahun. Hasilnya metode MFCC multikanal karakteristik ciri cepstrum, akurasi 99,8% pada interval waktu 10 tahun dan untuk 25 tahun sebesar 82,5%. Pengujian dengan karakteristik ciri GLCM untuk interval waktu 10 tahun akurasi 78,0% dan 77,8% untuk interval waktu 25 tahun. Sedangkan untuk karakteristik ciri gabungan (cepstrum dan GLCM) interval waktu 10 tahun sebesar 77,8% dan 25 tahun sebesar 62,8%. Metode ekstraksi MFCC multikanal mempunyai akurasi lebih baik dibandingkan dengan metode MFCC, yang hasilnya untuk interval waktu 10 tahun sebesar 58,3% dan 25 tahun sebesar 52,0%. Nilai EER metode MFCC multikanal sebesar 0,35 untuk 10 tahun dan 0.45 untuk 25 tahun, sedangkan untuk MFCC sebesar 0,54 untuk 10 tahun dan 0,56 untuk 25 tahun. Hasil tersebut menunjukkan pengembangan metode ekstraksi ciri multikanal yang menjadi kontribusi utama penelitian ini mampu meningkatkan akurasi khususnya pada rekaman yang terpengaruh faktor penuaan disebabkan interval waktu.
Audio forensics on the sound recordings one of them used to know the identity of individuals. The process by comparing the characteristics of samples of evidence and comparison records. Results match evidence and comparators for short time intervals of high accuracy, while for intervals of up to decades accuracy decreases. Decreased accuracy is influenced by characteristic change characteristics due to age. Increasing accuracy of the time interval of up to tens of years became the main problem solved in this study. So it is necessary to develop the method of feature extraction that can improve the accuracy. The characteristic extraction method in this study explored Mel-Frequency Coefficients Cepstral (MFCC), developed it multichannel. The multichannel feature extraction process by sorting sounds into five parts corresponds to the characteristic components of the fundamental frequency (F0) and resonant frequency 1 to 4 (F1, F2, F3, F4). Multichannel feature extraction became the main contribution of this study, the other contributors being the Mel scale variant, consisting of multichannel 5-variant filterbank (M5FB), multichannel 2-variant filterbank (M2FB) and multichannel 1-filterbank variant (M1FB). Another contribution is the coefficient of cepstrum in extraction using Gray Level Co-Occurrence Matrix (GLCM). The method is known as MFCC multichannel (Mel-Frequency Cepstral Coefficients Co-Occurrence Matrix Multichannel). Examination of multichannel MFCC feature extraction methods using proof and comparison records, with 10 and 25 years time intervals. The result of MFCC method multichannel characteristic of cepstrum, 99,8% accuracy at 10 years interval and for 25 years equal to 82,5%. Tests with characteristic of GLCM for 10 years interval accuracy of 78.0% and 77.8% for 25 years intervals. As for the characteristics of combined characteristics (cepstrum and GLCM) 10 years interval of 77.8% and 25 years of 62.8%. The multichannel MFCC extraction method has better accuracy than the MFCC method, which results in 10-year intervals of 58.3% and 25 years of 52.0%. The EER values of multichannel MFCC methods were 0.35 for 10 years and 0.45 for 25 years, while for MFCC of 0.54 for 10 years and 0.56 for 25 years. These results indicate the development of multichannel feature extraction methods that became the main contribution of this study was able to improve the accuracy, especially on the recording that affected the aging factor caused by the time interval
Kata Kunci : Interval waktu, faktor penuaan, ekstraksi ciri, identifikasi, audio forensik