Page 44 - E-Skripsi Analisis Sentimen Terhadap Aplikasi Sapawarga Jabar Super Apps Pada Ulasan Google Play Store
P. 44

nilai Term Frequency (TF) dan Inverse Document Frequency (IDF) pada setiap


                        kata dalam suatu dokumen. Selain itu juga fitur TF-IDF ini merupakan pemodelan

                        yang  baik  untuk  mengevaluasi  pentingnya  kata  dalam  dokumen  (Ahuja  et  al.,


                        2019).  Bisa  disimpulkan  bahwa  pembobotan  TF-IDF  merupakan  teknik  dalam

                        pemrosesan teks untuk memberikan bobot pada setiap kata berdasarkan seberapa


                        pentingnya kata-kata tersebut.

                               Term  Frequency  (TF)  adalah  numerik  yang  mengukur  seberapa  sering

                        kata-kata tertentu muncul dalam suatu dokumen. Berikut ini metrik perhitungan


                        TF pada formula (2.3) (Al-Obaydy et al., 2022).

                                                                    ,  
                                                       ,    =                                    (2. 3)
                                                                     ′
                                                              {   ′ :        }
                                                                  ,  

                               Di mana       adalah term frequency dari kata t dalam dokumen d. Fungsi
                                            ,  

                             ,     adalah  jumlah  kemunculan  t  dalam  dokumen  d.  Fungsi     ′   adalah
                                                                                               ,  
                                     ′
                                                                    ′
                        kemunculan     dalam  dokumen  d.  Fungsi    adalah  kata  lain  yang  ada  dalam
                                                       ′
                        dokumen d. Fungsi       {   ′ :        } adalah jumlah kemunculan kata yang paling
                                                     ,  
                        banyak dalam dokumen d.


                               Inverse  Document  Frequency  (IDF)  adalah  numerik  yang  menghitung

                        frekuensi dan signifikansi kata di semua dokumen. Berikut ini metrik perhitungan


                        IDF pada formula (2.4) (Al-Obaydy et al., 2022).

                                                                    
                                                        ,    =                                   (2. 4)
                                                             {        :         }


                               Di  mana          ,    adalah  inverse  document  frequency  dari  kata  t  dalam


                        koleksi D. D adalah jumlah total dokumen dalam koleksi D. d adalah dokumen





                                                              30
   39   40   41   42   43   44   45   46   47   48   49