Metode Basic Boolean untuk retrieval dan text indexing abstract naskah publikasi thesis Magister Ilmu Komputer UGM
RAHMAN, Indi, Drs. Agus Hardjoko, M.Sc.,Ph.D
2007 | Tesis | S2 Ilmu KomputerPada beberapa tahun terakhir, seiring dengan peningkatan jumlah koleksi dokumen yang berisikan informasi elektronik kian banyak, kebutuhan untuk menemukan informasi yang relevan dalam bentuk digital semakin penting. Salah satu cara yang cukup populer untuk menemukan informasi tersebut adalah dengan menggunakan operator basic boolean, yaitu AND, OR dan NOT. Penerapan operator ini membantu dalam mendefenisikan kriteria pencarian dan mengendalikan logika pencarian. Mekanisme standard untuk mendukung query basic boolean adalah dengan menggunakan file inverted indek. Untuk mengekstrak dokumen dan membuat tabel term inverted indeks yang dikelompokan berdasarkan nilai hexa desimalnya, digunakan langkah parsing, remove stopword, stemming dan weighting atau pembobotan. Parsing mengacu pada proses identifikasi token di dalam suatu stream teks. Remove stopword mampu untuk mengurangi beban tempat penyimpanan serta waktu pencarian terhadap kata-kata umum. Stemming digunakan untuk membentuk akar kata dari token. Weighting digunakan untuk menjumlah term sehingga term yang sama pada dokumen berbeda memiliki bobot yang berbeda. Penerapan basic boolean untuk pencarian data abstract thesis Ilmu Komputer Universitas Gadjahmada, melakukan pencarian string query yang diinputkan terhadap data term inverted. Kemudian memberikan respon kepada user berupa judul, uraian singkat dan alamat dokumen sesuai dengan logika pencarian yang diinginkannya, serta mengurutkan dokumen yang relevan tersebut berdasarkan ranking dari term itu sendiri.
In recent years, growth-up amount document collection which comprising electronic data information increasingly, requirement to find relevant information data digital progressively to be important. One of way popular to find the information is using boolean basic operator, that is AND, OR and NOT. Applying this operator can assist in seeking definition criterion and control seeking logic. Standard mechanism to support boolean basic query is using inverted index file. For the extract document and make the tables of term inverted index is grouping term value in hexa decimal, used by parsing step, remove stopword, stemming and weighting. Parsing representing process identify token in a text stream. Remove stopword can to lessen repository burden and also seeking time to common words. Stemming used to making root from the word. Weighting used to sum up term so that same term at document others to have different weight. Applying basic boolean for the seeking Thesis Abstract in the Master of Science in Computer Science in Gadjahmada University, conducting seeking of query string which is input from user to term inverted data. Then give respon to user in the form of title, brief description and document address as according to wanted seeking logic, and also sort the relevant document pursuant to ranking from itself term.
Kata Kunci : Basic Boolean,Retrieval,Inverted Index, Basic boolean, retrieval, inverted index, parsing, remove stopword, stemming, weighting dan ranking