Page 45 - E-Skripsi Analisis Sentimen Terhadap Aplikasi Sapawarga Jabar Super Apps Pada Ulasan Google Play Store
P. 45
tertentu dalam koleksi D. t adalah kata yang sedang diukur IDF-nya.
{ : } adalah himpunan dokumen dalam koleksi D di mana t muncul.
Selanjutnya untuk mendapatkan pembobotan kata, hasil TF dikalikan
dengan IDF. Berikut ini metrik perhitungan TF-IDF pada formula (2.5).
− = × (2. 5)
,
,
Menurut (Das et al., 2021) pembobotan TF-IDF merupakan cara terbaik
untuk mengonversikan representasi tekstual informasi menjadi Vector Space
Modal (VSM). Vector Space Modal (VSM) merupakan pustaka yang berguna
untuk menentukan seberapa banyak kata tertentu relevan dengan dokumen.
Pustaka VSM akan digunakan dalam tahap pemodelan atau klasifikasi model
SVM.
2.9 Confusion Matrix
Confusion Matrix merupakan alat evaluasi visual yang dapat digunakan
dalam menguji kinerja klasifikasi (Xu et al., 2020). Seperti halnya menguji hasil
kinerja algoritma pada machine learning yang akan mengidentifikasi berupa kata-
kata positif dan negatif. Dimensi matriks yang digunakan pada penelitian ini yaitu
klasifikasi biner 2 x 2 dengan kolom pada Confusion Matrix mewakili hasil kelas
prediksi, dan baris mewakili hasil kelas yang sebenarnya (aktual).
Pada Gambar 2.5 terdapat empat kombinasi antara kelas prediksi dengan
kelas aktual yaitu sebagai berikut:
a. True Positive (TP), yang berarti jumlah sampel positif diklasifikasikan dengan
benar ke dalam kelas positif.
31