Page 31 - Pengantar Machine Learning
P. 31
Setelah dilakukan pre-processing, data perlu dikonversikan ke representasi
data yang sesuai dengan model machine learning.
Bentuk konversi data uumnya meliputi berikut ini:
Classification: data kategori dikodekan ke dalam representasi numerik
yang sesuai.
Data nilai data dikonvesikan ke data kategori untuk mengurangi nilai variable
(untuk age segmentation)
Conversion Data lainnya
pada teks: kata dikonversikan ke dalam vektor kata melalui word
embedding (menggunakan word2vec model, BERT model, etc)
Feature Engineering
Normalisasi fitur untuk memastikan rentang nilai yang sama untuk
variabel input dari model yang sama.
Feature expansion: Menggabungkan atau mengonversi variabel yang
ada untuk menghasilkan fitur baru, seperti rata-rata.