Page 64 - E Modul Data Analytics
P. 64

Data Analytics






                       Cross-Industry  Standard  Process  for  Data  Mining  (CRISP-DM)  yang  dikembangkan
               pada tahun 1996 oleh analis dari beberapa industri seperti Daimler Chrysler, NCR, dan SPSS,
               menyediakan  proses  standar  dari  data  mining  sebagai  strategi  pemecahan  masalah  secara

               umum dari bisnis maupun unit penelitian.
































                                               Gambar 5. 3 Tahapan Proses Data Mining

               Tahapan proses dalam Data Mining dapat dijelaskan sebagai berikut:


               5.3.1  Seleksi Data

                       Pemilihan  (seleksi)  data  baru  sekumpulan  data  operasional  perlu  dilakukan  sebelum
               tahap penggalian informasi dalam KDD dimulai. Data hasil seleksi yang akan digunakan untuk

               proses data mining disimpan dalam suatu berkas, terpisah dari data operasional.


               5.3.2  Pre-processing/Cleaning (Pemilihan data)

                       Sebelum  proses  data  mining  dapat  dilaksanakan,  perlu  dilakukan  proses  cleaning
               Proses  cleaning  mencakup  antara  lain  membuang  duplikasi  data,  memeriksa  data  yang

               konsisten, dan memperbaiki kesalahan pada data, seperti kesalahan cetak  (tipografi).M Juga
               dilakukan proses  enrichment, yaitu proses "memperkaya" data yang sudah ada dengan data

               atau  informasi  lain  yang  relevan  dan  diperlukan  untuk  KDD,  seperti  data  atau  informasi
               eksternal.




                                                             52
   59   60   61   62   63   64   65   66   67   68   69