Page 45 - E-Skripsi Analisis Sentimen Terhadap Aplikasi Sapawarga Jabar Super Apps Pada Ulasan Google Play Store

P. 45

tertentu dalam koleksi D. t adalah kata yang sedang diukur IDF-nya.

{ : } adalah himpunan dokumen dalam koleksi D di mana t muncul.

Selanjutnya untuk mendapatkan pembobotan kata, hasil TF dikalikan

dengan IDF. Berikut ini metrik perhitungan TF-IDF pada formula (2.5).

− = × (2. 5)
,
,
Menurut (Das et al., 2021) pembobotan TF-IDF merupakan cara terbaik

untuk mengonversikan representasi tekstual informasi menjadi Vector Space

Modal (VSM). Vector Space Modal (VSM) merupakan pustaka yang berguna

untuk menentukan seberapa banyak kata tertentu relevan dengan dokumen.

Pustaka VSM akan digunakan dalam tahap pemodelan atau klasifikasi model

SVM.

2.9 Confusion Matrix

Confusion Matrix merupakan alat evaluasi visual yang dapat digunakan

dalam menguji kinerja klasifikasi (Xu et al., 2020). Seperti halnya menguji hasil

kinerja algoritma pada machine learning yang akan mengidentifikasi berupa kata-

kata positif dan negatif. Dimensi matriks yang digunakan pada penelitian ini yaitu

klasifikasi biner 2 x 2 dengan kolom pada Confusion Matrix mewakili hasil kelas

prediksi, dan baris mewakili hasil kelas yang sebenarnya (aktual).

Pada Gambar 2.5 terdapat empat kombinasi antara kelas prediksi dengan

kelas aktual yaitu sebagai berikut:

a. True Positive (TP), yang berarti jumlah sampel positif diklasifikasikan dengan

benar ke dalam kelas positif.

40 41 42 43 44 45 46 47 48 49 50