Page 21 - 28MODUL KELAS X INFORMATIKA
P. 21

1.  Discovery:  Mesin  pencari  mengumpulkan  daftar  awal  URL

                                (disebut seed URLs) dari berbagai sumber, seperti: Halaman

                                populer  (misalnya,  situs  berita  atau  portal  besar),  Tautan

                                yang  dikirimkan  langsung  oleh  webmaster  melalui  alat

                                seperti Google Search Console, dan Daftar URL dari proses

                                crawling sebelumnya. Daftar ini menjadi "peta awal" untuk

                                memulai eksplorasi.




















                             2.  Crawling: Search engine menggunakan program yang disebut


                                web  crawler  untuk  menjelajahi  internet  secara  terus-

                                menerus.  Web  crawler  mengikuti  tautan  antar  halaman

                                untuk  mengumpulkan  informasi  dari  berbagai  situs  web.

                                Input dari program web crawler ini adalah halaman dari situs

                                web yang ada. Ketika web crawler menemukan halaman baru

                                ia  mengindeks  halaman  tersebut  untuk  memungkinkan

                                penelusuran di kemudian hari.



                                                                                                   21
   16   17   18   19   20   21   22   23   24   25   26