Implementasi teori mutual information pada pembangunan Thesaurus Bahasa Indonesia
HARINI, Asih Widi, Ir. F. Soesianto, BSc.E.,Ph.D
2005 | Tesis | S2 Teknik ElektroThesaurus adalah sekumpulan pernyataan yang disusun dengan aturan tertentu yang saling berkaitan secara hierarki, asosiasi, atau hubungan kesepadanan. Tesis ini membahas “Implementasi Teori Mutual Information Pada Pembangunan Thesaurus Bahasa Indonesiaâ€, dan membangun perangkat lunak yang diberi nama THESINDO (Thesaurus Indonesia Otomatis). Perangkat lunak ini digunakan untuk mencari kata-kata dalam bahasa Indonesia, yang berkaitan secara semantik dengan suatu kata (thesaurus yang flat). Mutual information merupakan metode statistik yang digunakan untuk menentukan seberapa besar keterkaitan dua buah kata. Metode ini diterapkan dengan menggunakan sejumlah artikel berbahasa Indonesia yang dikumpulkan dari internet. Hasilnya berupa basis data yang berisi kata-kata yang saling berkaitan. Tahap analisis dan perancangan menggunakan metode analisis dan desain terstruktur (berorientasi aliran data) yang menghasilkan diagram aliran data. Sedangkan tahap implementasi menggunakan pemrograman Borland Delphi 6 dengan penyimpanan data pada SQL Server 2000. Perangkat lunak ini dapat dipakai pada lingkungan sistem operasi Windows 2000. Spesifikasi kriteria pengujian yang ditetapkan menyatakan bahwa perangkat lunak dianggap benar memenuhi beberapa kasus uji tertentu sesuai dengan spesifikasi kebutuhan. Konsep mutual information dapat digunakan untuk mengestimasi keterkaitan kata secara semantik. Perangkat lunak yang telah dibuat dapat membangun basis data thesaurus bahasa Indonesia secara otomatis dari kumpulan artikel. Kinerja THESINDO akan lebih baik jika menggunakan artikel yang banyak.
Thesaurus is a compiled group of statements with certain order of hierarchical, association, or equivalence relationship. This thesis study a " The Implementation of Mutual Information Theory on the Indonesian Thesaurus Development ", and develop a software which called as THESINDO (Thesaurus Indonesia Otomatis). This software used in the function for retrieving the interconnected Indonesian words semantically with a word (flat thesaurus). Mutual information is a statistical methods to determine the degree of interconnection between two words. This method applied by using an amount of Indonesian articles which have been collected from the web. The result is the words relation database. Analysis and design phase are using the structured analysis and design method (data flow oriented) yielding data flow diagram. Implementation phase is using Borland Delphi 6 and depository of data at SQL Server 2000. This software is enable to run at Windows 2000 operating system environment. Determination of software test specification criteria is assumed by a correctness, which fulfillment of some test cases to meet the requirement specification. The conception of mutual information is apply to estimate interconnected words in the semantics. Software which have been made will generate Indonesian thesaurus database automatically from some articles. The better performance of THESINDO is come from a lot of articles.
Kata Kunci : Teori Mutual Information,Thesaurus,Bahasa Indonesia, thesaurus, statistical, mutual information, flat, probability, Indonesian, semantic.