Page 31 - E Modul Data Analytics
P. 31
Data Analytics
menentukan alat dan teknik analisis untuk fase berikutnya. Pastikan bahwa teknik analisis
memungkinkan tim untuk memenuhi tujuan bisnis dan menerima atau menolak hipotesis kerja.
2.1.4 Fase 4 Model Building
Pada Tahap ini tim data science perlu mengembangkan kumpulan data untuk tujuan
pelatihan, pengujian, dan produksi. Kumpulan data ini memungkinkan data scientist untuk
mengembangkan model analitik dan melatihnya (training data), sambil menyisihkan beberapa
data (hold-out data atau test data) untuk menguji model.
Sebagai bagian dari fase ini, tim data science harus mengeksekusi model yang
ditentukan dalam Fase 3. Selama fase ini, pengguna menjalankan model dari paket perangkat
lunak analitik seperti R atau SAS, pada ekstrak file dan kumpulan data kecil untuk tujuan
pengujian. Dalam skala kecil, nilai validitas model dan hasilnya. Misalnya, tentukan apakah
model tersebut menyumbang sebagian besar data dan memiliki akurasi prediksi yang tinggi.
Pada titik ini, perbaiki model untuk mengoptimalkan hasil, seperti dengan memodifikasi input
variabel atau mengurangi variabel yang berkorelasi.
2.1.5 Fase 5 Communicate Result
Setelah menjalankan model, tim perlu membandingkan
hasil pemodelan dengan kriteria yang ditetapkan untuk
keberhasilan dan kegagalan. Pada Fase 5, tim
mempertimbangkan cara terbaik untuk mengartikulasikan
temuan dan hasil kepada berbagai anggota tim dan pemangku
kepentingan, dengan mempertimbangkan peringatan, asumsi,
19