ANALISIS DAN IMPLEMENTASI BLOCK-LEVEL CACHE MENGGUNAKAN NVME SSD PADA KLASTER PENYIMPANAN CEPH BERBASIS ERASURE CODE
FUAD RAHMAN NUGROHO, Warsun Najib, S.T., M.Sc.; Dr. Ridi Ferdiana, S.T., M.T.
2019 | Skripsi | S1 TEKNOLOGI INFORMASIProses manajemen perangkat keras pada klaster penyimpanan dengan cara tradisional diketahui memakan sumber daya dan waktu yang relatif banyak. Sementara itu, kecepatan pertumbuhan data semakin meningkat dari tahun ke tahun sehingga dibutuhkan metode yang lebih efektif dan efisien terutama dari segi performa maupun biaya. Metode penyimpanan tersebut juga perlu memerhatikan aspek proteksi data dan resiliensi yaitu kemampuan untuk melakukan pemulihan data ketika terjadi kerusakan pada perangkat. Salah satu bentuk solusi dari permasalahan tersebut adalah dengan membangun sebuah klaster penyimpanan terdistribusi dengan fitur proteksi data berbasis erasure code yang memiliki overhead rendah, disertai dengan implementasi block cache untuk mengakselerasi performa. Platform penyimpanan Ceph merupakan salah satu implementasi konsep software-defined storage untuk membangun klaster penyimpanan terdistribusi secara horizontal yang berjalan pada lapisan perangkat lunak. Ceph mendukung penggunaan erasure code sebagai metode proteksi data dengan membagi dan mendistribusikan data ke beberapa server. Namun dengan adanya penurunan performa akibat penggunakan erasure code, dilakukan implementasi block cache menggunakan NVMe SSD guna mengakselerasi performa penyimpanan. Klaster penyimpanan diuji menggunakan Fio untuk mendapatkan metrik performa synthetic, dan menggunakan SysBench untuk mendapatkan metrik performa server pangkalan data. Hasil analisis menunjukkan implementasi block cache dapat meningkatkan performa random read sampai dengan 4.623% dan random write sampai dengan 482% untuk ukuran blok 4K dalam pengujian synthetic. Pada pengujian server pangkalan data, terjadi peningkatan transactions per second sampai dengan 1.492% dan latency turun 3.080% dibandingkan menggunakan HDD. Selain itu, penggunaan erasure code mampu menghemat biaya infrastruktur sebesar 17,16%. dibandingkan penggunaan metode replikasi.
Managing storage hardware in typical storage cluster is time and resource consuming. At the same time, the amount of data produced is growing each year which caused the need of more effective and efficient storage system to store the data, particularly on performance and cost standpoint. The storage system also need to consider the data protection aspect to enable the cluster to sustain the loss of drives. One of the solutions to those problems is to build a distributed storage cluster with data protection feature with low overhead based on erasure code, while leveraging block cache to increase performance. Ceph is a form of software-defined storage (SDS) implementation to build distributed and scale-out storage cluster that runs on application layer. Ceph fully supports erasure code data protection method by dividing data into chunks and distributed them to several servers. Erasure coding intoduces new overheads which lower the overall storage performance. In order accelerate the performance, a layer of block cache consisting of NVMe SSD is implemented. The storage cluster needs to be evaluated and benchmarked with Fio to get the synthetic performance metrics, and with SysBench to get the database server performance metrics. Analysis result shows that block cache significantly improves the 4K random read with up to 4.623% faster performance, while 4K random write performance is up to 482% faster. Database server benchmark also shows significant improvement with the increase of transactions per second with up to 1.492% higher TPS, and reduced the latency by 3.080% compared to HDD. Erasure code also lower the infrasctructure cost by 17,16% compared to typical replicated method.
Kata Kunci : Software-defined Storage, Ceph, Erasure Code, Block Cache, Cache