Page 40 - E Modul Data Analytics
P. 40
Data Analytics
3.1.2 Data Crawling
Crawling data adalah proses yang
digunakan untuk mengumpulkan opini
pengguna dari berbagai website atau situs
tertentu yang mengandung opini pengguna
berdasarkan ruang lingkup penelitian yang
diusulkan. Proses crawling data ini bisa
menggunakan API yang biasanya telah
disediakan oleh situs yang bersangkutan.
Data yang diambil merupakan data tweet
yang terdapat dalam Twitter menggunakan
koneksi untuk mengakses API Twitter. Pengaksesan data tweet Twitter memerlukan hak akses
untuk dapat mengakses data tweet berupa consumer key, consumer secret, access token, dan
access token secret (Sari dkk.,2020)(Fernandes dkk., 2023). API Twitter atau Application
Programming Interface (API) twitter adalah suatu program atau aplikasi yang disediakan oleh
twitter untuk mempermudah developer lain dalam mengakses informasi yang ada di website
twitter. Pendaftaran sebagai developer aplikasi twitter untuk menggunakan API twitter dapat
dilakukan di lama https://dev.twitter.com
3.2 Akses sumber data terbuka seperti: Kaggle, UCI repository, satudata.
Jenis dataset ada dua yaitu Private dan
Public. Private Dataset di dapat dari data set yang
diambil organisasi yang kita jadikan objek penilitian
seperti: Bank, Rumah Sakit, Industri, Perusahaan
Jasa, etc sedangkan Public Dataset adalah data
set yang di dapat repositori public yang disepakati
oleh para peneliti data mining. Yang dapat diakses
pada website dibawah ini:
28