Page 74 - E-Skripsi Analisis Sentimen Terhadap Aplikasi Sapawarga Jabar Super Apps Pada Ulasan Google Play Store
P. 74
Penambangan data diambil pada tanggal 14 Agustus 2023. Hasil
penambangan data terdapat 2.383 ulasan aplikasi Sapawarga di Google Play
Store. Kemudian hasil akhir terdapat 1.710 ulasan aplikasi dengan memfilter akun
pengguna yang di privasi, yaitu “Pengguna Google”.
4.3 Data Preprocessing
Selanjutnya setelah data didapatkan melakukan pemrosesan data melalui
lima proses data diantaranya cleansing, normalization, stopword removal,
stemming, dan tokenization.
4.2.1 Cleansing
Proses ini akan mengubah teks menjadi huruf kecil, membersihkan kolom
ulasan dari karakter khusus, tanda baca, dan simbol yang tidak relevan. Berikut ini
merupakan tahapan dan script dalam proses cleansing:
a. Mengimpor pustaka pandas untuk menganalisis data, reguler expressions (re)
untuk mencari data dan menggantinya, string untuk mengimpor karakter tanda
baca, dan DataFrame (df) untuk membaca file.
b. Menjalankan fungsi untuk mengubah teks menjadi huruf kecil, menghapus
karakter non-alphanumeric, teks dari tab, new line, link, hastag, URL, back
slice, angka, non-ASCII, tanda baca, dan whitespace yang berlebih.
c. Menjalankan fungsi untuk membersihkan ulasan pada kolom “content” dan
menyimpannya ke dalam kolom baru “cleaned”. Kemudian menyimpan hasil
pembersihan data ke dalam file “cleaned.csv”.
60