Page 19 - E-MODUL TOPIK KHUSUS JARINGAN KOMPUTER
P. 19
a. Definisi
Data adalah kumpulan fakta atau informasi yang dapat diukur atau
dihitung. Dalam konteks machine learning, data menjadi bahan dasar
yang digunakan untuk melatih model dan menguji kinerjanya.
b. Jenis Data
• Data Pelatihan (Training Data); data yang digunakan untuk
melatih model. Ini berisi pasangan input-output atau fitul-label
• Data pengujian (Testing Data); Data yang digunakan untuk
menguji sejauh mana model dapat memprediksi dengan akurat
setelah dilatih.
• Data validasi (Validation Data); dalam beberapa kasus, data
yang terpisah digunakan untuk validasi, membantu dalam
penyetelan parameter model.
2. Fitur (Features);
a. Definisi
Fitur adalah atribut atau karakteristik yang diekstraksi dari data.
Mereka merupakan variabel yang digunakan oleh model untuk
membuat prediksi atau klasifikasi.
b. Contoh fitur
Dalam kasus pengenalan gambar, fitur dapat berupa intensitas piksel.
Dalam kasus teks, fitur dapat mencakup kata-kata atau frekuensi kata.
Dalam prediksi harga rumah, fitur dapat mencakup jumlah kamar,
luas tanah, dll.
3. Label
9