Page 64 - E-Skripsi Analisis Sentimen Terhadap Aplikasi Sapawarga Jabar Super Apps Pada Ulasan Google Play Store
P. 64

e.  Tokenization


                                  Proses  akhir  melakukan  tokenisasi  pada  setiap  kalimat  dengan

                           memecah  teks  menjadi  unit-unit  kecil.  Dalam  penelitian  ini  akan


                           menggunakan  ekstraksi  fitur  unigram-bigram,  di  mana  setiap  kalimat  akan

                           dipecah  menjadi  satu  dan  dua  pasangan  pada  setiap  kata.  Data  ulasan  hasil


                           tokenisasi  disimpan  dalam  format  Comma  Separated  Value  (.csv).  Adapun

                           alur proses tokenization dapat dilihat pada Gambar 3.8.































                                                Gambar 3. 8 Alur Proses Tokenization


                        3.3.2  Pelabelan Data


                               Pada tahap ini setiap kata yang sudah diklasifikasikan akan diberikan label

                        sentimen  positif  dan  negatif,  serta  menghapus  sentimen  berlabel  netral.  Kamus


                        lexicon yang digunakan yaitu SentiWordNet. Pada Tabel 3.6 menunjukkan contoh

                        kamus SentiWordNet berikut bobot dari setiap kata.








                                                              50
   59   60   61   62   63   64   65   66   67   68   69