Page 44 - E-Skripsi Analisis Sentimen Terhadap Aplikasi Sapawarga Jabar Super Apps Pada Ulasan Google Play Store
P. 44
nilai Term Frequency (TF) dan Inverse Document Frequency (IDF) pada setiap
kata dalam suatu dokumen. Selain itu juga fitur TF-IDF ini merupakan pemodelan
yang baik untuk mengevaluasi pentingnya kata dalam dokumen (Ahuja et al.,
2019). Bisa disimpulkan bahwa pembobotan TF-IDF merupakan teknik dalam
pemrosesan teks untuk memberikan bobot pada setiap kata berdasarkan seberapa
pentingnya kata-kata tersebut.
Term Frequency (TF) adalah numerik yang mengukur seberapa sering
kata-kata tertentu muncul dalam suatu dokumen. Berikut ini metrik perhitungan
TF pada formula (2.3) (Al-Obaydy et al., 2022).
,
, = (2. 3)
′
{ ′ : }
,
Di mana adalah term frequency dari kata t dalam dokumen d. Fungsi
,
, adalah jumlah kemunculan t dalam dokumen d. Fungsi ′ adalah
,
′
′
kemunculan dalam dokumen d. Fungsi adalah kata lain yang ada dalam
′
dokumen d. Fungsi { ′ : } adalah jumlah kemunculan kata yang paling
,
banyak dalam dokumen d.
Inverse Document Frequency (IDF) adalah numerik yang menghitung
frekuensi dan signifikansi kata di semua dokumen. Berikut ini metrik perhitungan
IDF pada formula (2.4) (Al-Obaydy et al., 2022).
, = (2. 4)
{ : }
Di mana , adalah inverse document frequency dari kata t dalam
koleksi D. D adalah jumlah total dokumen dalam koleksi D. d adalah dokumen
30