Page 30 - Pengantar Machine Learning
P. 30

Secara umum, real data memiliki beberapa permasalahan kualitas





                                                                                                              Incompletness: mengandung value yang hilang atau data dengan sedikit


                                                                                                              atribut


                                                                                                              Noise: terdiri dari data dengan kesalahan record atau exception


                                                                                                              Inconsistency: inconsistent records










     Dirty Data
   25   26   27   28   29   30   31   32   33   34   35