Laporkan Masalah

HYBRID METODE HIDDEN MARKOV MODEL DENGAN SELF ORGANIZATION MAPS UNTUK IDENTIFIKASI PROTEIN CODING REGIONS PADA GEN DNA DARI ARABIDOPSIS THALIANA

MUHAMMAD FAJAR HARTANTO, Dr.-Ing. MHD. Reza M.I. Pulungan, S.Si., M.Sc.

2014 | Tesis | S2 Ilmu Komputer

Permasalahan utama untuk mengidentifikasi susunan DNA pada genome eukaryoit yang diolah melalui proses komputasi belum terpecahkan. Metode Hidden Markov Model diterapkan untuk dapat mengatasi permasalahan tersebut, dimana dapat mengklasifikasi susunan data DNA. Penelitian ini mengusulkan penerapan metode Hybrid HMM dengan SOM untuk mengatasi permasalahan identifikasi wilayah pada genome eukaryoit. Penerapan metode SOM diterapkan untuk mengatasi keterbatasan pada metode HMM terutama kasus overfitting. Data yang dipergunakan pada penelitian ini ialah genome tumbuhan dengan nama latin Arabidopsis Thaliana. Akurasi metode Hybrid HMM dengan SOM akan dibandingkan dengan metode HMM akan dievaluasi pada dua level, yakni level nukleotida dan exon. Pada level nukleotida akan menguji dari segi sensitivitas(Sn), spesitiviti(Sp) dan koefisien korelasi(CC), sama halnya pada level exon yang akan menguji dari segi sensitivitas( Sn) dan spesitiviti (Sp). Hasil pengujian dengan menerapkan metode HMM menunjukkan nilai SnHMM = 94% (level nukleotida), SpHMM = 90% (level nukleotida), CCHMM = 2:9%, SnHMM = 82% (level exon), dan SnHMM = 90% (level exon). Berbeda dengan hasil pengujian pada metode Hybrid HMM dengan SOM menunjukkan nilai SnHybrid = 98% (level nukleotida), SpHybrid = 94% (level nukleotida), CcHybrid = 2:6%, SnHybrid = 88% (level exon), dan SnHybrid = 94% (level exon).

Main issues to identify the order DNA in genome eurkaryote are processed through the process computing has not been solved. The method Hidden Markov can overcome Model is applied to these issues, which can be classify, and dis-integrity data structure DNA. This Research suggests the application methods Hybrid well with SOM to address the problems in the region identification genome eurkaryote. The SOM algorithm is applied to overcome the shortage method well especially overfitting case. Data that is used in this research is genome plants with latin name Arabidopsis Thaliana. Accuracy of Hybrid method HMM with SOM will be compared with the HMM method will be evaluated on two levels, the level nucleotide and exon. At a level nucleotide will test in terms of sensitivity(Sn), specificity(Sp) and the drag coefficient correlation(CC), in the same thing at a level exon that will test in terms of sensitivity(Sn) and specificity (Sp). Test result by applying methods HMM in the SnHMM = 94% (level nukleotida), SpHMM = 90% (level nukleotida), CCHMM = 2:9%, SnHMM = 82% (level exon), and SnHMM = 90% (level exon). Different with test result in Hybrid method HMM with SOM shows the SnHybrid = 98% (level nukleotida), SpHybrid = 94% (level nukleotida), CcHybrid = 2:6%, SnHybrid = 88% (level exon), and SnHybrid = 94% (level exon).

Kata Kunci : Hybrid HMM/SOM, Self Organizing Map (SOM), HMM, Gene prediction


    Tidak tersedia file untuk ditampilkan ke publik.