Laporkan Masalah

Penyandi Isyarat Musik pada Pesat Bit di Bawah 16 kbit/s Berdasar Model Isyarat Modulasi Frekuensi

BONDHAN WINDURATNA, Prof. Adhi Susanto, M.Sc., Ph.D. ; Dr. Ir. Risanuri Hidayat, M.Sc.

2016 | Disertasi | S3 Ilmu Teknik Elektro

Kompresi data atau penyandian sumber telah dan masih memainkan sebuah peran penting dalam berbagai area di kehidupan sehari-hari. Dalam bidang telekomunikasi aplikasi data kompresi digunakan untuk menyelesaikan masalah kapasitas saluran yang sempit. Dalam dunia hiburan yang berbasis multi-media, data kompresi diandalkan untuk mengatasi masalah kapasitas memori. Setelah mengalami puluhan tahun pengembangan terdapat beberapa penyandi audio, yaitu standart MPEG, standart ITU dan penyandi nonkomersial. Setiap penyandi audio bekerja pada cakupan pesat bit tertentu, tergantung pada jenis model isyarat yang digunakan dan metode yang dipakai. Penyandi waktu-frekuensi (T/F) atau penyandi Tranform dirancang untuk keseluruhan jenis isyarat audio dan diprioritaskan mempunyai pesat bit keluaran di atas 32 kbit/s. Penyandi isyarat tutur bekerja di ranah waktu dan mempunyai pesat bit keluaran antara 4 kbit/s sampai 32 kbit/s. Untuk isyarat musik dengan pesat bit di bawah 16 kbit/s belum terdapat banyak penyandi audio. Untuk memberikan altenatif penyandian isyarat musik pada pesat bit di bawah 16 kbit/s dengan efisiensi yang diharapkan lebih baik, penulis mengusulkan penyandi berdasar isyarat FM. Ide dasar pembuatan penyandi ini adalah adanya kesamaan struktur frekuensi harmonik yang dipunyai oleh mayoritas isyarat musik dan isyarat FM. Isyarat musik tidak langsung disandikan menjadi aliran bit, melainkan direpresentasikan terlebih dahulu sebagai isyarat termodulasi frekuensi. Parameter-parameter FM diestimasi dari isyarat musik dan selanjutnya disandikan kedalam aliran bit. Untuk mengurangi kompleksitas penyandi dan menjaga pesat bit tetap berada dalam daerah kerja yang direncanakan, diasumsikan dalam isyarat musik hanya terdapat sebuah sumber harmonik meskipun isyarat musik berasal dari beberapa instrumen musik secara simultan. Selain sifat harmonis, sifat statis sesaat dari isyarat musik di ranah waktu juga diperhitungkan dalam perancangan penyandi dan diimplementasikan dalam pola kerja penyandi yang prediktif. Penyandi yang dikembangkan mempunyai empat tahapan proses pokok, yaitu ekstraksi komponen sinusoid, separasi komponen harmonik, estimasi parameter FM dan penyandian parameter FM. Pada penentuan kesempurnaan pemodelan isyarat FM, sebuah model psikoakustik diandalkan untuk dalam penilaian kualitas pemodelan. Hasil simulasi memperlihatkan bahwa penyandi FM telah berhasil menyandikan isyarat musik instrumen tunggal pada pesat bit disekitar 6 kbit /s dengan kualitas setara dengan MPEG2 pada pesat bit 16 kbit/s dan lebih baik dari penyandi ITU G722.1 pada 16 kbit/s. Untuk isyarat musik instrumen jamak pada pesat yang sama, kualitas penyandi yang diusulkan menurun seiring dengan menurunnya kualitas penyandi MPEG2 dan ITU-G722.1. Akhirnya dengan mempertimbangkan hasil-hasil simulasi dapat disimpulkan bahwa penyandi FM dapat menjadi pilihan yang baik untuk isyarat musik instrumen tunggal pada pesat bit yang sangat rendah.

Data compression or source coding has been playing an important role in many areas in daily life. In the telecommunication field its application is used to solve the narrow channel capacity problems. In the multi-media based entertaining system it is utilized to master the memory-capacity problem. After decades development there are several audio encoders available with various techniques, namely MPEG-standard, ITU-standard and noncommercial ones. Each audio encoder works at a certain range bit rate depending on the signal model used and the method implemented. A time-frequency (T/F) encoder is designed for universal audio signals and has output bit rate above 32 kbit/s. The speech-signal encoder works mostly in the time domain and its output bit rate ranges between 4 kbit/s and 32 kbit/s. For music signals at bit rate below 16 kbit/s there still are a view audio encoder avaliable. Therefore there is a challenge to create a music encoder working in the bit rate range up to 16 kbit/s. One of the basic ideas behind creating the proposed encoder is the togetherness in having harmonical components between the music signals and frequency modulated signals. The music signal is not processed to be a bit stream directly but represented as a frequency modulated signal at first. The FM parameters are estimated and extracted from the music signal and coded as a bit stream. In order to reduce the encoder complexities and to keep the encoder working at below 16 kbit/s it is asumsed that there is always one harmonic source contained in the to be encoded music signal. Besides having the harmonic structure, the music signal spectrum has a low change rate along the time domain. Based on this benifiting fact the proposed encoder is also designed to operate in the predictive mode in order to save the usage numbers of FM parameters. The developed encoder has four cascaded main processes, namely sinusoid components extraction, harmonic components separation, FM parameters estimation and FM parameter encoding. The simulation results for the single instrument music signals show that the proposed encoder at about 6 kbit/s has the same quality level with MPEG2 at 16 kbit/s and the better quality than ITU-G722.1 at 16 kbit/s. For the ensemble music signal at the same bit rate, the performance of the proposed encoder is as good as the qualities of the MPEG2 and ITU-G722.1. Considering the simulation results, it is to be concluded that the proposed encoder is a better option for the single instrument music signals at very low bit rate.

Kata Kunci : Modulasi frekuensi, penyandi, pemodelan, pesat bit, model psikoakustik

  1. S3-2016-308390-abstract.pdf  
  2. S3-2016-308390-bibliography.pdf  
  3. S3-2016-308390-tableofcontent.pdf  
  4. S3-2016-308390-title.pdf