Evaluasi Efektivitas Kombinasi Teknik Prompt Engineering Dengan Format Representasi Skema Knowledge Graph Dalam Tugas Text-To-Cypher Berbasis Large Language Model
Axel Xaverius Tamtama, Dr. Indriana Hidayah, S.T., M.T.; Syukron Abu Ishaq Alfarozi, S.T., Ph.D.
2026 | Skripsi | TEKNOLOGI INFORMASI
Perencanaan akademik memerlukan dukungan sistem bimbingan akademik yang efektif, tetapi dalam praktiknya peran dosen pembimbing akademik kerap terkendala oleh beban kerja, keterbatasan waktu, dan tersebarnya informasi akademik. Pemanfaatan chatbot berbasis Large Language Model (LLM) menawarkan solusi otomatisasi, tetapi masih rentan terhadap halusinasi pada domain spesifik berbasis kurikulum Program Studi (prodi) tertentu. Untuk memastikan jawaban selaras dengan struktur kurikulum, pengetahuan akademik dapat dimodelkan sebagai Knowledge Graph (KG) dan diakses menggunakan Cypher, yaitu bahasa query deklaratif untuk basis data graf yang digunakan untuk mengekspresikan pola relasi antarentitas dan mengambil data secara terstruktur. Agar pengguna tetap dapat bertanya dalam bahasa alami, LLM perlu menerjemahkan pertanyaan tersebut menjadi query Cypher yang tepat, suatu tugas yang dikenal sebagai Text-to-Cypher. Namun, integrasi LLM dan KG masih menghadapi tantangan pada tugas tersebut karena kinerjanya dipengaruhi oleh teknik prompt engineering dan format representasi skema KG. Oleh karena itu, penelitian ini melakukan evaluasi empiris pengaruh kombinasi kedua faktor tersebut terhadap tugas Text-to-Cypher berbasis LLM.
Penelitian ini menggunakan pendekatan eksperimental kuantitatif dengan membandingkan kombinasi tiga teknik prompt engineering (zero-shot prompting, few-shot prompting, dan chain-of-thought prompting (CoT)) dengan tiga format representasi skema KG (full schema, nodes and paths, dan only paths). Evaluasi kinerja mengadaptasi kerangka kerja Metric-Based LLM Evaluation yang menilai Cypher query oleh LLM berdasarkan validitas sintaksis Cypher dan kepatuhan skema KG, kemiripan terhadap ground truth, serta kesesuaian hasil eksekusi. Kinerja tiap konfigurasi diukur menggunakan metrik LLMetric (tingkat konfigurasi) dan LLMetric-Q (tingkat pertanyaan). Eksperimen dilakukan dengan memanfaatkan KG berisi Kurikulum 2021 Prodi Teknologi Informasi FT UGM dan model Qwen2.5 Coder 32B Instruct.
Hasil penelitian menunjukkan bahwa kombinasi CoT dengan format only paths memberikan kinerja terbaik dengan nilai LLMetric sebesar 71,40?n rata-rata LLMetric-Q sebesar 71,62%. Uji Friedman mengonfirmasi adanya perbedaan signifikan antarteknik prompt engineering. Uji Wilcoxon menunjukkan bahwa CoT dan few-shot prompting sama-sama unggul signifikan dibanding zero-shot prompting, sementara CoT dan few-shot prompting tidak berbeda signifikan satu sama lain. Sementara itu, format representasi skema KG tidak menunjukkan perbedaan signifikan secara statistik. Kombinasi CoT dengan format only paths unggul karena CoT membantu LLM menalar jawaban langkah demi langkah, sementara format only paths menyajikan relasi KG yang lengkap dan valid, tetapi tetap ringkas sehingga mempermudah penyusunan Cypher query yang tepat. Temuan ini menegaskan bahwa teknik prompt engineering merupakan faktor utama dalam keberhasilan tugas Text-to-Cypher, sementara representasi skema KG berperan sebagai penguat ketika dipadukan dengan teknik yang tepat.
Kata Kunci : Large Language Model, Knowledge Graph, Text-to-Cypher, Prompt Engineering, Skema Knowledge Graph