Laporkan Masalah

DETEKSI OUTLIER PADA DATA CAMPURAN MENGGUNAKAN ALGORITMA AVF (ATTRIBUTE VALUE FREQUENCY) DAN Z-SCORE (Studi Kasus: Data Transaksi Penjualan di Apotek UGM)

YUD KARISMOLLAH CHOIR, Nur Rokhman, S.Si., M.Kom

2016 | Skripsi | S1 ILMU KOMPUTER

Outlier merupakan objek yang berbeda dibandingkan objek-objek lainnya dalam suatu data. Sehingga outlier pada suatu data perlu mendapatkan perhatian khusus karena dapat mengganggu distribusi data dan pada akhirnya mempersulit dalam penemuan informasi penting dari kumpulan data. Saat ini, telah banyak metode yang dikembangkan untuk mengatasi permasalahan outlier. Akan tetapi metode tersebut hanya fokus pada data yang seragam, yaitu data kategorik atau data numerik saja. Padahal pada data yang nyata kebanyakan tidak hanya mempunyai atribut yang seragam, tetapi juga memiliki atribut campuran, yaitu numerik dan kategorik. Contoh data nyata dengan atribut campuran yaitu data transaksi penjualan di Apotek UGM. Pada penelitian ini akan dilakukan deteksi outlier pada data campuran menggunakan algoritma AVF dan algoritma Z-Score. Data yang digunakan dalam penelitian adalah data transaksi penjualan di Apotek UGM yang memiliki atribut kategorik dan numerik. Algoritma AVF digunakan untuk deteksi outlier pada atribut kategorik. Sedangkan algoritma Z-Score digunakan untuk deteksi outlier pada atribut numerik. Kemudian dilakukan perankingan dari hasil deteksi outlier menggunakan algoritma AVF dan algoritma Z-Score sehingga didapat ranking outlier pada data campuran. Hasil dari penelitian ini, algoritma AVF dan algoritma Z-Score dapat melakukan deteksi outlier pada data transaksi penjualan di Apotek UGM yang berjenis campuran. Hasil dari deteksi outlier memberikan gambaran pola yang aneh dalam transaksi penjualan di Apotek UGM dari tanggal 1 – 16 April 2016.

Outlier is a different object compared to other objects in a data, so the outlier in a data needs to have a special attention because it can cause bugs in the data distribution and eventually makes it difficult to find some important information from the data collection. There have been many methods developed to overcome the outlier problem today. However, they only focus on one kind of data, that is, either categorical or numerical data, where as most real data do not only have one kind of attribute, but a mixed one, that is, both numerical and categorical. One of the example of a real data with mixed attribute is the sales transaction data of Apotek UGM. This research will detect the outlier on mixed data using AVF and Z-Score algorithms. The data used in this research is the sales transaction data at Apotek UGM (which has both categorical and numerical attribute). AVF algorithm is used to detect the outlier on the categorical attribute, and Z-Score the numerical one. A ranking from the outlier detection using AVF and Z-Score algorithms will be done so a ranking on the mixed data can be conceived. The result of this reseach is that AVF and Z-Score algorithms are able to detect outlier on a sales transaction data of Apotek UGM, which is that of a mixed attribute. The result of the outlier detection shows a strange pattern in Apotek UGM’s sales transaction data from 1-16 April 2016.

Kata Kunci : outlier, deteksi outlier, data campuran, data transaksi, apotek, AVF, Z-Score, data mining


    Tidak tersedia file untuk ditampilkan ke publik.