Page 38 - E-Skripsi Analisis Sentimen Terhadap Aplikasi Sapawarga Jabar Super Apps Pada Ulasan Google Play Store
P. 38
2.4 Ekstraksi Fitur n-gram
Menurut Laoh et al. (2019), n-gram merupakan rangkaian kata yang
diambil secara berurutan dari sebuah teks atau kalimat. “n” menunjukkan jumlah
kata yang akan dibentuk dari sebuah teks. “gram” teknik untuk
mempertimbangkan satu atau lebih kata dalam menilai skor sebuah teks. n-gram
dapat dibentuk satu (n=1) hingga lebih tinggi mengacu pada empat (n=4), lima
(n=5), dan seterusnya (Tripathy et al., 2016). Berikut ini penjelasan model n-gram
yang digunakan dalam penelitian ini (Rahman et al., 2020).
a. Unigram
Model Unigram mendefinisikan pernyataan kata atau urutan kata yang
disajikan dengan cara memisahkan setiap suku kata secara individual. Berikut
metrik pemodelan Unigram:
( ) = ( ) ( ) ( ) (2. 1)
1
1 2
2
Di mana, P merepresentasikan probabilitas, merepresentasikan suku
1
kata pertama dan seterusnya.
b. Bigram
Model bigram mengelompokkan pernyataan kata atau rangkaian kata
menjadi dua. Teknik ini akan mengelompokkan setiap kata dari suku pertama
dan kedua sebagai pasangan kata dan selanjutnya suku kedua dan suku ketiga
dan seterusnya.
( ) = ( , ) ( , ) (2. 2)
2
2
1
1 2
Di mana, P merepresentasikan probabilitas, merepresentasikan suku
1
kata pertama dan seterusnya.
24