Page 18 - 3.Big Data Analytics
P. 18

หลักสูตรการวิเคราะห์ข้อมูลขนาดใหญ่   17




                  Section 4: Google web search




                  4.1    วัตถุประสงคการเรียนรู

                           1)  เขาใจกระบวนการทำงานของ Google Web Search


                  4.2    กระบวนการทำงานของ


                             ปกติการคนหาขอมูลของ Google นั้นใชหลักการพื้นฐานในลักษณะของการคนคืนสารสนเทศ (Information
                  Retrieval อยางไรก็ตามในระบบการคนหาของ  Google นั้นมีเทคนิคมากมายเพื่อทำใหการคนหานั้นไดรับคำตอบที่ตรง

                  เปาหมายและรวดเร็วที่สุด ขั้นตอนโดยภาพรวมประกอบดวย







































                                   รูปที่ 4.1 หลักการของโปรแกรม Spider ในระบบการคนหาของ Google


                                                         (Google, 2019


                             1 การคนหาและรวบรวมขอมูล: ขั้นตอนแรกสุด  Google ใชโปรแกรมที่ถูกเรียกวา “Spider” วิ่งไปตาม

                         เว็บไซตและวิ่งไปตามจุดเชื่อมโยง (links ตาง ๆ เพื่อทำการเก็บขอมูลที่เกี่ยวของใหไดมากที่สุด ซึ่งขอมูลที่ถูก
                         บรรจุไวใน Metadata ของเว็บไซตนั้นเปนสวนสำคัญที่สุดที่ตัว Spider สามารถคนหาขอมูลได หลักการทำงาน

                         ดังกลาวแสดงไดดังรูปที่ 4.1




                   BIG DATA ANALYTICS                             สถาบันสหวิทยาการดิจิทัลและหุนยนต มหาวิทยาลัยเทคโนโลยีราชมงคลพระนคร
   13   14   15   16   17   18   19   20   21   22   23