Page 64 - E-Skripsi Analisis Sentimen Terhadap Aplikasi Sapawarga Jabar Super Apps Pada Ulasan Google Play Store
P. 64
e. Tokenization
Proses akhir melakukan tokenisasi pada setiap kalimat dengan
memecah teks menjadi unit-unit kecil. Dalam penelitian ini akan
menggunakan ekstraksi fitur unigram-bigram, di mana setiap kalimat akan
dipecah menjadi satu dan dua pasangan pada setiap kata. Data ulasan hasil
tokenisasi disimpan dalam format Comma Separated Value (.csv). Adapun
alur proses tokenization dapat dilihat pada Gambar 3.8.
Gambar 3. 8 Alur Proses Tokenization
3.3.2 Pelabelan Data
Pada tahap ini setiap kata yang sudah diklasifikasikan akan diberikan label
sentimen positif dan negatif, serta menghapus sentimen berlabel netral. Kamus
lexicon yang digunakan yaitu SentiWordNet. Pada Tabel 3.6 menunjukkan contoh
kamus SentiWordNet berikut bobot dari setiap kata.
50