Page 38 - E-Skripsi Analisis Sentimen Terhadap Aplikasi Sapawarga Jabar Super Apps Pada Ulasan Google Play Store
P. 38

2.4     Ekstraksi Fitur n-gram


                               Menurut  Laoh  et  al.  (2019),  n-gram  merupakan  rangkaian  kata  yang

                        diambil secara berurutan dari sebuah teks atau kalimat. “n” menunjukkan jumlah


                        kata  yang  akan  dibentuk  dari  sebuah  teks.  “gram”  teknik  untuk

                        mempertimbangkan satu atau lebih kata dalam menilai skor sebuah teks. n-gram


                        dapat dibentuk satu  (n=1) hingga lebih tinggi mengacu pada empat (n=4), lima

                        (n=5), dan seterusnya (Tripathy et al., 2016). Berikut ini penjelasan model n-gram

                        yang digunakan dalam penelitian ini (Rahman et al., 2020).


                        a.  Unigram

                                  Model Unigram mendefinisikan pernyataan kata atau urutan kata yang


                           disajikan dengan cara memisahkan setiap suku kata secara individual. Berikut

                           metrik pemodelan Unigram:


                                                (         ) =   (   )  (   )  (   )              (2. 1)
                                                              1
                                                 1 2   
                                                                           
                                                                    2
                                  Di mana, P merepresentasikan probabilitas,     merepresentasikan suku
                                                                              1
                           kata pertama dan seterusnya.

                        b.  Bigram


                                  Model bigram mengelompokkan pernyataan kata atau rangkaian kata

                           menjadi dua. Teknik ini akan mengelompokkan setiap kata dari suku pertama

                           dan kedua sebagai pasangan kata dan selanjutnya suku kedua dan suku ketiga


                           dan seterusnya.

                                                (         ) =   (   ,    )  (   ,    )           (2. 2)
                                                                           
                                                                      2
                                                                 2
                                                              1
                                                 1 2   
                                  Di mana, P merepresentasikan probabilitas,     merepresentasikan suku
                                                                              1
                           kata pertama dan seterusnya.






                                                              24
   33   34   35   36   37   38   39   40   41   42   43