Laporkan Masalah

Konversi Basis Data Relasional ke NoSQL DB Menggunakan EGTA dan EMNS

SUTEDI, Teguh Bharata Adji, S.T., M.T., M. Eng., Ph.D.; Noor Akhmad Setiawan, S.T., M.T., Ph.D.

2019 | Disertasi | DOKTOR TEKNIK ELEKTRO

Basis data NoSQL adalah solusi yang ditawarkan untuk mengatasi ketidakmampuan basis data relasional dalam menangani luapan data karena perkembangan dan penerapan teknologi informasi saat ini. Namun, basis data NoSQL memiliki perbedaan karakteristik yang signifikan dibandingkan dengan basis data relasional. Oleh karena itu, metode konversi yang andal diperlukan untuk memigrasikan data dari basis data relasional ke basis data NoSQL. Dengan demikian, berbagai kebutuhan berikutnya tetap dapat dipenuhi dari data-data tersebut. Beberapa metode konversi data telah dikembangkan untuk tujuan tersebut, termasuk di dalamnya Graph Transforming Algorithms dan Multiple Nested Schema. Kedua metode ini dapat secara dramatis meningkatkan query performance dalam skema NoSQL yang dihasilkan. Namun demikian, kedua metode tersebut masih perlu dikembangkan untuk mengkonversi basis data relasional dengan kondisi hubungan tabel yang lebih beragam, menghasilkan space performance yang lebih hemat, menjamin kelengkapan data, dan mempertahankan query performance-nya. Penelitian ini mengembangkan metode Enhanced Graph Transforming Algorithm (EGTA) dan Enhanced Multiple Nested Schema (EMNS). Pada satu sisi, EGTA dikembangkan dengan menambahkan aturan untuk menyelesaikan multigraph (loop dan/atau multiple edges) serta menyempurnakan mekanisme konversi untuk simple graph. Pada sisi lain, EMNS dikembangkan dengan menambahkan aturan untuk menyelesaikan transitive dependency, subtype-supertype relationship, hubungan jamak antar tabel, dan hubungan antara tabel dengan dirinya sendiri. Selain itu, penelitian ini juga mengembangkan matriks adjacency untuk memudahkan proses konversi data ke skema NoSQL. Berdasarkan hasil eksperimen pertama, skema NoSQL dari EGTA menggunakan ruang penyimpanannya 13,6 % lebih hemat daripada hasil Graph Transforming Algorithm, sedangkan skema NoSQL dari EMNS menggunakan penyimpanannya 45,2 % lebih hemat daripada hasil Multiple Nested Schema. Dalam percobaan itu, skema NoSQL yang dihasilkan dari EGTA menggunakan penyimpanan 2,6% lebih efisien dibandingkan dengan hasil EMNS. Selanjutnya, pada eksperimen kedua, hanya EGTA dan EMNS yang mampu menyelesaikan konversi basis data relasional dengan struktur yang kompleks (mengandung beberapa tabel dengan hubungan jamak dan tabel yang merujuk dirinya sendiri). Skema NoSQL dari EGTA pada eksperimen kedua menggunakan ruang penyimpanan 1,5% lebih hemat daripada hasil EMNS. Selain itu, berdasarkan eksperimen di atas terbukti bahwa query performance EGTA dan EMNS tetap mampu bersaing dan bahkan lebih unggul dari metode lainnya di berbagai kondisi yang diujicobakan.

The NoSQL database is a solution proposed to overcome the inability of relational databases in handling data overflow due to the development and the application of current information technology. However, the NoSQL database has significant characteristic differences compared to relational databases. Therefore, there is a need for a reliable conversion method to migrate data from the relational database to the NoSQL database so that big data processing can utilize existing data. For this purpose, several previous studies have developed data conversion methods, including Graph Transforming Algorithms and Multiple Nested Schema. Both of these methods can dramatically increase query performance in the NoSQL schema result obtained. However, to convert relational databases with more diverse table relationship conditions, produce more efficient space performance, ensure data completeness, and maintain query performance, it requires research to develop both. This research developed the Enhanced Graph Transforming Algorithm (EGTA) and Enhanced Multiple Nested Schema (EMNS) methods. On the one hand, developing EGTA by adding rules to complete the multi-graph (loop and/or multiple sides) and perfecting the conversion mechanism for simple graphs. On the other hand, developing EMNS by adding rules to resolve transitive dependencies, super-type subtype relationships, multiple relationships between tables, and the relationship between tables with itself. In addition, this research also developed an adjacency matrix to facilitate the process of converting data to the NoSQL schema. Based on the results of the first experiment, the NoSQL schema from EGTA used its storage space 13.6% more efficiently than the Graph Transforming Algorithm results, while the NoSQL schema from EMNS used its storage 45.2% more efficiently than the Multiple Nested Schema result. In that experiment, the NoSQL schema generated from EGTA used the storage 2.6% more efficiently than the EMNS result. Furthermore, in the second experiment, only EGTA and EMNS were able to complete the conversion of relational databases with complex structures (containing multiple tables with multiple relationships and tables that refer to themselves). The NoSQL schema from EGTA in the second experiment used the storage space 1.5% more efficiently than the EMNS results. In addition, the performance of the EGTA and EMNS queries in the above experiment is also able to compete and even be superior to other methods in various conditions tested.

Kata Kunci : Konversi, NoSQL, transitive dependency, loop, multiple edges

  1. S3-2019-389931-abstract.pdf  
  2. S3-2019-389931-bibliography.pdf  
  3. S3-2019-389931-tableofcontent.pdf  
  4. S3-2019-389931-title.pdf