Page 31 - Pengantar Machine Learning
P. 31

Setelah  dilakukan  pre-processing,  data  perlu  dikonversikan  ke  representasi


                                                                                                   data yang sesuai dengan model machine learning.




                                                                                                   Bentuk konversi data uumnya meliputi berikut ini:


                                                                                                            Classification:  data  kategori  dikodekan  ke  dalam  representasi  numerik


                                                                                                            yang sesuai.

     Data                                                                                                   nilai  data  dikonvesikan  ke  data  kategori  untuk  mengurangi  nilai  variable



                                                                                                            (untuk age segmentation)
     Conversion                                                                                             Data lainnya



                                                                                                                    pada  teks:  kata  dikonversikan  ke  dalam  vektor  kata  melalui  word


                                                                                                                    embedding (menggunakan word2vec model, BERT model, etc)


                                                                                                            Feature Engineering


                                                                                                                    Normalisasi  fitur  untuk  memastikan  rentang  nilai  yang  sama  untuk


                                                                                                                    variabel input dari model yang sama.


                                                                                                                    Feature  expansion:  Menggabungkan  atau  mengonversi  variabel  yang


                                                                                                                    ada untuk menghasilkan fitur baru, seperti rata-rata.
   26   27   28   29   30   31   32   33   34   35   36