Page 45 - E-Skripsi Analisis Sentimen Terhadap Aplikasi Sapawarga Jabar Super Apps Pada Ulasan Google Play Store
P. 45

tertentu  dalam  koleksi  D.  t  adalah  kata  yang  sedang  diukur  IDF-nya.


                        {        :         } adalah himpunan dokumen dalam koleksi D di mana t muncul.

                               Selanjutnya  untuk  mendapatkan  pembobotan  kata,  hasil  TF  dikalikan


                        dengan IDF. Berikut ini metrik perhitungan TF-IDF pada formula (2.5).

                                                   −        =       ×                            (2. 5)
                                                                          ,  
                                                                ,  
                               Menurut (Das et al., 2021) pembobotan TF-IDF merupakan cara terbaik

                        untuk  mengonversikan  representasi  tekstual  informasi  menjadi  Vector  Space

                        Modal  (VSM).  Vector  Space  Modal  (VSM)  merupakan  pustaka  yang  berguna


                        untuk  menentukan  seberapa  banyak  kata  tertentu  relevan  dengan  dokumen.

                        Pustaka  VSM  akan  digunakan  dalam  tahap  pemodelan  atau  klasifikasi  model


                        SVM.




                        2.9     Confusion Matrix

                               Confusion  Matrix  merupakan  alat  evaluasi  visual  yang  dapat  digunakan


                        dalam menguji kinerja klasifikasi (Xu et al., 2020). Seperti halnya menguji hasil

                        kinerja algoritma pada machine learning yang akan mengidentifikasi berupa kata-


                        kata positif dan negatif. Dimensi matriks yang digunakan pada penelitian ini yaitu

                        klasifikasi biner 2 x 2 dengan kolom pada Confusion Matrix mewakili hasil kelas

                        prediksi, dan baris mewakili hasil kelas yang sebenarnya (aktual).


                               Pada Gambar 2.5 terdapat empat kombinasi antara kelas prediksi dengan

                        kelas aktual yaitu sebagai berikut:


                        a.  True Positive (TP), yang berarti jumlah sampel positif diklasifikasikan dengan

                           benar ke dalam kelas positif.







                                                              31
   40   41   42   43   44   45   46   47   48   49   50