Page 37 - E-Skripsi Analisis Sentimen Terhadap Aplikasi Sapawarga Jabar Super Apps Pada Ulasan Google Play Store
P. 37

proses  stopword  removal  dan  stemming  berjalan  dengan  lebih  baik  dan  sesuai


                        karena  ulasannya  sudah  di  normalisasi  terlebih  dahulu.  Adapun  kamus

                        normalization yang penulis gunakan bersumber dari penelitian Aliyah Salsabila et


                        al. (2019), dan akun GitHub nandanovenia yang memiliki 5.000 dan 16.701 kata

                        slang dan singkatan beserta kata bakunya.


                               Proses  stopword  removal  dan  stemming  ditempatkan  setelah

                        normalization.  Hal  ini  memungkinkan  proses  stopword  removal  dan  stemming

                        dapat membaca setiap kata yang sudah di standarisasi. Kamus stopword removal


                        yang  penulis  gunakan  yaitu  kamus  eksternal  bersumber  dari  hasil  kajian

                        penelitian  Tala  (2003,  seperti  yang  digunakan  dalam  Prihatini  et  al.,  2023).


                        Sedangkan  untuk  kamus  stemming  bersumber  dari  kamus  Sastrawi  yang  sudah

                        terdapat pada tools aplikasinya.


                               Penulis menerapkan tahap tokenization pada setiap proses normalization,

                        stopword  removal,  dan  stemming.  Hal  ini  dilakukan  untuk  memastikan  bahwa

                        proses berulang dapat memberikan hasil yang diinginkan.


                               Selain itu juga, penulis menempatkan proses tokenization secara terpisah


                        di tahap terakhir. Hal ini dilakukan karena dalam penelitian ini akan memberikan

                        label  sentimen  menggunakan  Lexicon-Based,  sehingga  membutuhkan  data  atau

                        ulasan yang sudah melalui proses tokenization yaitu pemecahan kalimat ke dalam


                        kumpulan kata. Adapun fitur yang penulis gunakan dalam proses tokenization ini

                        yaitu  dengan  mengekstraksi  fitur  unigram-bigram.  Kombinasi  fitur  unigram-


                        bigram dapat melakukan pemecahan kalimat dengan sesuai tanpa menghilangkan

                        maksud atau persepsi dari isi ulasan tersebut.







                                                              23
   32   33   34   35   36   37   38   39   40   41   42