Page 40 - E Modul Data Analytics
P. 40

Data Analytics






               3.1.2  Data Crawling
                                                                          Crawling  data  adalah  proses  yang

                                                                   digunakan  untuk  mengumpulkan  opini
                                                                   pengguna dari berbagai website atau situs
                                                                   tertentu yang mengandung opini pengguna

                                                                   berdasarkan ruang lingkup penelitian yang
                                                                   diusulkan.  Proses  crawling  data  ini  bisa
                                                                   menggunakan  API  yang  biasanya  telah

                                                                   disediakan  oleh  situs  yang  bersangkutan.
                                                                   Data  yang  diambil  merupakan  data  tweet

                                                                   yang terdapat dalam Twitter menggunakan
               koneksi untuk mengakses API Twitter. Pengaksesan data tweet Twitter memerlukan hak akses
               untuk dapat mengakses data tweet berupa consumer key, consumer secret, access token, dan

               access  token  secret  (Sari  dkk.,2020)(Fernandes  dkk.,  2023).  API  Twitter  atau  Application
               Programming Interface (API) twitter adalah suatu program atau aplikasi yang disediakan oleh
               twitter  untuk  mempermudah  developer  lain  dalam  mengakses  informasi  yang  ada  di  website

               twitter.  Pendaftaran  sebagai  developer  aplikasi  twitter  untuk  menggunakan  API  twitter  dapat
               dilakukan di lama https://dev.twitter.com

               3.2   Akses sumber data terbuka seperti: Kaggle, UCI repository, satudata.



                                                                  Jenis  dataset  ada  dua  yaitu  Private  dan
                                                           Public. Private Dataset di dapat dari data set yang
                                                           diambil organisasi yang kita jadikan objek penilitian

                                                           seperti:  Bank,  Rumah  Sakit,  Industri,  Perusahaan
                                                           Jasa,  etc  sedangkan  Public  Dataset  adalah  data

                                                           set yang di dapat repositori public yang disepakati
                                                           oleh para peneliti data mining. Yang dapat diakses
                                                           pada website dibawah ini:










                                                             28
   35   36   37   38   39   40   41   42   43   44   45