Page 32 - Analisis Statistik Bigdata menggunakan Aplikasi Phyton
P. 32
significantly shift regression line, dan performa model machine learning yang dapat
terdistorsi. Namun, tidak semua outliers harus dihapus karena dalam beberapa
kasus, outliers justru merupakan informasi paling berharga dalam dataset, seperti
dalam fraud detection dalam transaksi fraudulent adalah outliers yang ingin
dideteksi, atau dalam quality control dengan defective products merupakan outliers
yang perlu diidentifikasi.

