Page 18 - 3.Big Data Analytics
P. 18
หลักสูตรการวิเคราะห์ข้อมูลขนาดใหญ่ 17
Section 4: Google web search
4.1 วัตถุประสงคการเรียนรู
1) เขาใจกระบวนการทำงานของ Google Web Search
4.2 กระบวนการทำงานของ
ปกติการคนหาขอมูลของ Google นั้นใชหลักการพื้นฐานในลักษณะของการคนคืนสารสนเทศ (Information
Retrieval อยางไรก็ตามในระบบการคนหาของ Google นั้นมีเทคนิคมากมายเพื่อทำใหการคนหานั้นไดรับคำตอบที่ตรง
เปาหมายและรวดเร็วที่สุด ขั้นตอนโดยภาพรวมประกอบดวย
รูปที่ 4.1 หลักการของโปรแกรม Spider ในระบบการคนหาของ Google
(Google, 2019
1 การคนหาและรวบรวมขอมูล: ขั้นตอนแรกสุด Google ใชโปรแกรมที่ถูกเรียกวา “Spider” วิ่งไปตาม
เว็บไซตและวิ่งไปตามจุดเชื่อมโยง (links ตาง ๆ เพื่อทำการเก็บขอมูลที่เกี่ยวของใหไดมากที่สุด ซึ่งขอมูลที่ถูก
บรรจุไวใน Metadata ของเว็บไซตนั้นเปนสวนสำคัญที่สุดที่ตัว Spider สามารถคนหาขอมูลได หลักการทำงาน
ดังกลาวแสดงไดดังรูปที่ 4.1
BIG DATA ANALYTICS สถาบันสหวิทยาการดิจิทัลและหุนยนต มหาวิทยาลัยเทคโนโลยีราชมงคลพระนคร