Page 37 - E-Skripsi Analisis Sentimen Terhadap Aplikasi Sapawarga Jabar Super Apps Pada Ulasan Google Play Store
P. 37
proses stopword removal dan stemming berjalan dengan lebih baik dan sesuai
karena ulasannya sudah di normalisasi terlebih dahulu. Adapun kamus
normalization yang penulis gunakan bersumber dari penelitian Aliyah Salsabila et
al. (2019), dan akun GitHub nandanovenia yang memiliki 5.000 dan 16.701 kata
slang dan singkatan beserta kata bakunya.
Proses stopword removal dan stemming ditempatkan setelah
normalization. Hal ini memungkinkan proses stopword removal dan stemming
dapat membaca setiap kata yang sudah di standarisasi. Kamus stopword removal
yang penulis gunakan yaitu kamus eksternal bersumber dari hasil kajian
penelitian Tala (2003, seperti yang digunakan dalam Prihatini et al., 2023).
Sedangkan untuk kamus stemming bersumber dari kamus Sastrawi yang sudah
terdapat pada tools aplikasinya.
Penulis menerapkan tahap tokenization pada setiap proses normalization,
stopword removal, dan stemming. Hal ini dilakukan untuk memastikan bahwa
proses berulang dapat memberikan hasil yang diinginkan.
Selain itu juga, penulis menempatkan proses tokenization secara terpisah
di tahap terakhir. Hal ini dilakukan karena dalam penelitian ini akan memberikan
label sentimen menggunakan Lexicon-Based, sehingga membutuhkan data atau
ulasan yang sudah melalui proses tokenization yaitu pemecahan kalimat ke dalam
kumpulan kata. Adapun fitur yang penulis gunakan dalam proses tokenization ini
yaitu dengan mengekstraksi fitur unigram-bigram. Kombinasi fitur unigram-
bigram dapat melakukan pemecahan kalimat dengan sesuai tanpa menghilangkan
maksud atau persepsi dari isi ulasan tersebut.
23