Page 21 - 28MODUL KELAS X INFORMATIKA

P. 21

1. Discovery: Mesin pencari mengumpulkan daftar awal URL

(disebut seed URLs) dari berbagai sumber, seperti: Halaman

populer (misalnya, situs berita atau portal besar), Tautan

yang dikirimkan langsung oleh webmaster melalui alat

seperti Google Search Console, dan Daftar URL dari proses

crawling sebelumnya. Daftar ini menjadi "peta awal" untuk

memulai eksplorasi.

2. Crawling: Search engine menggunakan program yang disebut

web crawler untuk menjelajahi internet secara terus-

menerus. Web crawler mengikuti tautan antar halaman

untuk mengumpulkan informasi dari berbagai situs web.

Input dari program web crawler ini adalah halaman dari situs

web yang ada. Ketika web crawler menemukan halaman baru

ia mengindeks halaman tersebut untuk memungkinkan

penelusuran di kemudian hari.

16 17 18 19 20 21 22 23 24 25 26