TEMU KEMBALI INFORMASI BERBASIS SEMANTIK STUDI KASUS : DOKUMEN PERUNDANG-UNDANGAN; SEMANTIC BASED INFORMATION RETRIEVAL CASE STUDY : LEGAL DOCUMENTS
Zuliharso, Eri, Retantyo Wardoyo
2015 | Tesis | FMIPAPerbedaan itu antara lain dokumen perundangan mempunyai judul dan kata yang didefinisikan secara khusus untuk perundangan tersebut. Penelitian ini dibagi menjadi empat bagian utama : membangun basisdata leksikal mengikuti format WordNet Princeton, mengkonstruksi ontologi yang mampu menyimpan informasi kamus leksikal, membangun model perolehan informasi berbasis semantik Bahasa Indonesia, dan membangun model perolehan informasi berbasis semantik lintas-bahasa Bahasa Indonesia dan Bahasa Inggris. Untuk membangun basisdata leksikal mengikuti format Princeton WordNet dilakukan dengan cara 1. membangun thesaurus berdasarkan Kamus Besar Bahasa Indonesia, 2. membangun wordnet Bahasa Indonesia memanfaatkan Princeton WordNet, Wikipedia, Kamus Besar Bahasa Indonesia, 3. menambah leksikon dengan memanfaatkan dokumen perundangan yang tersedia dalam Bahasa Indonesia dan Bahasa Inggris. Informasi tentang perundang-undangan dan informasi leksikal untuk suatu kata direpresentasikan dalam ontologi berdasar arsitektur WordNet dan disimpan dengan format Ontology Web Language (OWL). Komponen utama WordNet dan hirarki perundangundangan ditransformasikan sebagai kelas dalam OWL. Relasi diantara himpunan sinonim, kata leksikal, perundang-undangan ditransformasikan sebagai properti OWL. Ontologi mempunyai hirarki kelas yang sederhana. Struktur judul, definisi kata dan isi dalam perundangan digunakan untuk mencari kombinasi perluasan query yang menghasilkan presisi dan recall terbaik. Model Perolehan Informasi Berbasis Semantik Bahasa Indonesia dilakukan dengan memanfaatkan hubungan sinonim untuk memperluas query. Perluasan query pada judul mendapatkan presisi terbaik. Query dengan kata yang mempunyai makna yang ambigu dalam kamus akan menyebabkan presisi dan recall yang rendah. Model perolehan informasi berbasis semantik cross-lingual menterjemahkan term dalam query berdasarkan prioritas dengan urutan penterjemahan berdasarkan kata yang ada di judul perundang-undangan, kata di bagian ketentuan umum perundangan dan kamus bilingual. Kata yang dihasilkan dari hasil penterjemahan selanjutnya diperluas dengan memanfaatkan hubungan sinonim, hiperonim dan hiponim dari Princeton WordNet. Perluasan query pada judul mendapatkan presisi dan recall terbaik. Query dengan kata yang mempunyai makna yang ambigu dalam kamus akan menyebabkan query hasil terjemahan yang ambigu. Query hasil terjemahan yang ambigu menyebabkan perolehan dokumen dengan relevansi yang rendah.
Kata Kunci : N