Page 37 - E-Skripsi Analisis Sentimen Terhadap Aplikasi Sapawarga Jabar Super Apps Pada Ulasan Google Play Store

P. 37

proses stopword removal dan stemming berjalan dengan lebih baik dan sesuai

karena ulasannya sudah di normalisasi terlebih dahulu. Adapun kamus

normalization yang penulis gunakan bersumber dari penelitian Aliyah Salsabila et

al. (2019), dan akun GitHub nandanovenia yang memiliki 5.000 dan 16.701 kata

slang dan singkatan beserta kata bakunya.

Proses stopword removal dan stemming ditempatkan setelah

normalization. Hal ini memungkinkan proses stopword removal dan stemming

dapat membaca setiap kata yang sudah di standarisasi. Kamus stopword removal

yang penulis gunakan yaitu kamus eksternal bersumber dari hasil kajian

penelitian Tala (2003, seperti yang digunakan dalam Prihatini et al., 2023).

Sedangkan untuk kamus stemming bersumber dari kamus Sastrawi yang sudah

terdapat pada tools aplikasinya.

Penulis menerapkan tahap tokenization pada setiap proses normalization,

stopword removal, dan stemming. Hal ini dilakukan untuk memastikan bahwa

proses berulang dapat memberikan hasil yang diinginkan.

Selain itu juga, penulis menempatkan proses tokenization secara terpisah

di tahap terakhir. Hal ini dilakukan karena dalam penelitian ini akan memberikan

label sentimen menggunakan Lexicon-Based, sehingga membutuhkan data atau

ulasan yang sudah melalui proses tokenization yaitu pemecahan kalimat ke dalam

kumpulan kata. Adapun fitur yang penulis gunakan dalam proses tokenization ini

yaitu dengan mengekstraksi fitur unigram-bigram. Kombinasi fitur unigram-

bigram dapat melakukan pemecahan kalimat dengan sesuai tanpa menghilangkan

maksud atau persepsi dari isi ulasan tersebut.

32 33 34 35 36 37 38 39 40 41 42