Laporkan Masalah

ALGORITMA FAST GREEDY UNTUK MENDETEKSI OUTLIER

SEFTIAN HARI MURTI, Yunita Wulan Sari, S.Si., M.Sc.

2017 | Skripsi | S1 STATISTIKA

Data mining adalah ekstrasi atau penggalian data yang diinginkan dari data jumlah yang besar. Sedangkan outlier adalah sebuah titik data pada suatu dataset dimana sangat berbeda dibandingkan dengan titik data pada dataset pada umumnya. Outlier tidak bisa langsung disimpulkan sebagai sebuah keuntungan atau sebagai masalah namun harus dipandang dalam konteks analisi dan harus dievaluasi mengenai kemungkina informasi yang bisa didapatkan. Fungsi deteksi outlier adalah suatu teknik untuk mencari obyek dimana obyek tersebut mempunyai perilaku yang berbeda dari obyek-obyek yang lainya. Penerapan deteksi outlier dapat ditemukan pada sejumlah bidang kegunaan, seperti deteksi kecurangan (fraud detection), deteksi penyusupan (intrusion detection), gangguan ekosistem, noise pada citra, kesehatan masyarakat dan kedokteran. Kebanyakan metode yang ada didesain untuk data numerik. Algoritma fast greedy akan mengatasi masalah yang ada pada aplikasi di dunia nyata yang mengandung data katagorikal. Algortima fast greedy dapat mendeteksi outlier dengan menggunakan rumus fungsi entropy untuk perhitungannya.

Data minig is the extraction the desired data from large amounts of data. ehile outlier defined as a data point a dataset where us different than point from common dataset. Outliers can not be directly inferred as an advantage or as a problem, but shouldbe viewed in the context og the analysis and should be evaluated for possibility thar information could be obtained. Outlier detection funsction is a technique to lookfor objects to which these objects have different behaviors from other objects. Application of outlier detection can be found in some areas of usability, such as the fraud detection, intrusion detection, disruption of ecosystems, noise in the imgages, public health and medicine. Most exiting methods are designed for numeric data. Fast greedy algorithm wlii solve the existing problems in real world applications containing categorical data. Fast greedy algorithm can detect outlier using entropy function formula for calculation.

Kata Kunci : data mining, outlier, outlier detection, fast greedy, entropy


    Tidak tersedia file untuk ditampilkan ke publik.