Page 43 - Learning Dosen
P. 43
7. Pima Indians Dataset
Pima Indians Dataset yaitu dataset ini berasal dari
National Institute of Diabetes and Digestive and Kidney
Diseases, dan berisi informasi tentang 768 wanita dari
suatu populasi di dekat Phoenix, Arizona, AS. Hasil yang
diuji adalah Diabetes, 258 dinyatakan positif dan 500
dinyatakan negatif.
Selain dataset pada ANN, penerapan jaringan saraf
menggunakan CNN dalam pembuatan pipeline dan
membangun model prediktif, terkadang hasilnya tidak
sempurna atau tidak sesuai yang diharapkan. Hal
tersebut dapat diatasi dengan menerapkan augmentasi
data. Augmentasi data merupakan strategi yang
berfokus pada regenerasi lebih banyak gambar dari
yang sudah tersedia. Selain itu, Teknik tersebut juga dapat
memproduksi gambar dalam bentuk atau dimensi lain.
Gambar 21 Penerapan Augmentasi Data pada Gambar Anjing
Gambar seekor anjing (Gambar 16) tersebut terlihat
seperti gambar yang diambil beberapa kali dari arah
yang berbeda. Tapi sebenarnya gambar tersebut
ditambah untuk menghasilkan bentuk atau dimensi lain
menggunakan augmentasu data. Adapun langkah kerja
augmentasi data yaitu:
- Mengurangi bias model terhadap kelas data tertentu ke
kelas lain, hal ini dapat membantu algoritma dalam
menggeneralisasi dengan baik.
36