Page 44 - 3.Big Data Analytics
P. 44

หลักสูตรการวิเคราะห์ข้อมูลขนาดใหญ่   43




                  แบบทดสอบ (ปรนัย


                  1 ขอใด  ไมไดเปน ลักษณะของขอมูลขนาดใหญ

                     ก. มีความหลากหลายของขอมูลทั้งแบบโครงสรางและไมเปนโครงการ
                     ข. ขอมูลมีการเกิดและเปลี่ยนแปลงตลอดเวลาอยางรวดเร็ว
                     ค. ขอมูลมีขนาดใหญมากเกินกวาที่ระบบฐานขอมูลแบบเกาจะรองรับได

                     ง. ขอมูลถูกทำสำเนาจัดเก็บไวในหลายๆ ที่จนกลายเปนขอมูลที่มีปริมาณมาก

                  2  ขอใดอธิบายอิทธิพลของสื่อสังคมออนไลนตอการวิเคราะหขอมูลขนาดใหญไดชัดเจนที่สุด

                     ก. สื่อสังคมออนไลนถือวาเปนแหลงขอมูลตามนิยามของขอมูลขนาดใหญที่สำคัญในยุคปจจุบัน
                     ข. การนำเสนอขอมูลในสื่อสังคมออนไลนมักไมเปนความจริง เนื่องจากใครก็สามารถนำเสนอขอมูลได
                     ค. แนวโนมการหลอกลวงดวยขอมูลเท็จจากสื่อสังคมออนไลน ทำใหระบบรักษาความปลอดภัยของขอมูลขนาดใหญ
                     จำเปนตองเขารหัสที่ยากขึ้น

                     ง. อิทธิพลของสื่อสังคมออนไลนตอการวิเคราะหขอมูลขนาดใหญ ไมไดเปนสวนหนึ่งตอการวิเคราะหผลตอบรับจากลูกคา


                  3 ระเบียบวิธี แบบ K-Means คืออะไร
                     ก. การจัดกลุมขอมูลและแทนคาของแตละกลุมดวยคาเฉลี่ยของกลุม ซึ่งใชเปนจุดศูนยกลางในการวัดระยะหางของขอมูล
                     ในกลุมเดียวกัน
                     ข. การจัดกลุมขอมูลแบบมีขั้นตอนและจำนวนกลุมตัวอยางตองไมมากนัก

                     ค. การจัดกลุมขอมูลโดยคัดแยกขอมูลออกเปน 2 สวน
                     ง. การจัดกลุมขอมูลโดยใชหลักการของ Binary Search Tree


                  4 โปรแกรมใดวิ่งไปตามเว็บไซตและวิ่งไปตามจุดเชื่อมโยง ( links ตางๆ เพื่อรวบรวมขอมูล และทำใหระบบการคนหาของ
                  Google   นั้นไดรับคำตอบที่ตรงเปาหมายและรวดเร็วที่สุด
                     ก. Feeder

                     ข. Spider
                     ค. Google Ads

                     ง. Google Cloud

                  5 หลักการทำงานโดยภาพรวมของ  MapReduce ทำงานอยางไร
                     ก. ทำการเขารหัสขอมูลตนทางและถอดรหัสที่ปลายทาง

                     ข. กระจาย Task ไปรันแบบ Parallel บนเครื่องหลาย ๆ เครื่อง
                     ค. กระจายขอมูลไปจัดเก็บยังสวนตาง ๆ เพื่อลดพื้นที่การใชงานบนเครื่องแมขาย

                     ง. นำขอมูลไปประมวลผลบนเครื่องศูนยกลางเครื่องเดียว






                   BIG DATA ANALYTICS                             สถาบันสหวิทยาการดิจิทัลและหุนยนต มหาวิทยาลัยเทคโนโลยีราชมงคลพระนคร
   39   40   41   42   43   44   45   46   47   48   49