Page 21 - 28MODUL KELAS X INFORMATIKA
P. 21
1. Discovery: Mesin pencari mengumpulkan daftar awal URL
(disebut seed URLs) dari berbagai sumber, seperti: Halaman
populer (misalnya, situs berita atau portal besar), Tautan
yang dikirimkan langsung oleh webmaster melalui alat
seperti Google Search Console, dan Daftar URL dari proses
crawling sebelumnya. Daftar ini menjadi "peta awal" untuk
memulai eksplorasi.
2. Crawling: Search engine menggunakan program yang disebut
web crawler untuk menjelajahi internet secara terus-
menerus. Web crawler mengikuti tautan antar halaman
untuk mengumpulkan informasi dari berbagai situs web.
Input dari program web crawler ini adalah halaman dari situs
web yang ada. Ketika web crawler menemukan halaman baru
ia mengindeks halaman tersebut untuk memungkinkan
penelusuran di kemudian hari.
21