Page 44 - 3.Big Data Analytics
P. 44
หลักสูตรการวิเคราะห์ข้อมูลขนาดใหญ่ 43
แบบทดสอบ (ปรนัย
1 ขอใด ไมไดเปน ลักษณะของขอมูลขนาดใหญ
ก. มีความหลากหลายของขอมูลทั้งแบบโครงสรางและไมเปนโครงการ
ข. ขอมูลมีการเกิดและเปลี่ยนแปลงตลอดเวลาอยางรวดเร็ว
ค. ขอมูลมีขนาดใหญมากเกินกวาที่ระบบฐานขอมูลแบบเกาจะรองรับได
ง. ขอมูลถูกทำสำเนาจัดเก็บไวในหลายๆ ที่จนกลายเปนขอมูลที่มีปริมาณมาก
2 ขอใดอธิบายอิทธิพลของสื่อสังคมออนไลนตอการวิเคราะหขอมูลขนาดใหญไดชัดเจนที่สุด
ก. สื่อสังคมออนไลนถือวาเปนแหลงขอมูลตามนิยามของขอมูลขนาดใหญที่สำคัญในยุคปจจุบัน
ข. การนำเสนอขอมูลในสื่อสังคมออนไลนมักไมเปนความจริง เนื่องจากใครก็สามารถนำเสนอขอมูลได
ค. แนวโนมการหลอกลวงดวยขอมูลเท็จจากสื่อสังคมออนไลน ทำใหระบบรักษาความปลอดภัยของขอมูลขนาดใหญ
จำเปนตองเขารหัสที่ยากขึ้น
ง. อิทธิพลของสื่อสังคมออนไลนตอการวิเคราะหขอมูลขนาดใหญ ไมไดเปนสวนหนึ่งตอการวิเคราะหผลตอบรับจากลูกคา
3 ระเบียบวิธี แบบ K-Means คืออะไร
ก. การจัดกลุมขอมูลและแทนคาของแตละกลุมดวยคาเฉลี่ยของกลุม ซึ่งใชเปนจุดศูนยกลางในการวัดระยะหางของขอมูล
ในกลุมเดียวกัน
ข. การจัดกลุมขอมูลแบบมีขั้นตอนและจำนวนกลุมตัวอยางตองไมมากนัก
ค. การจัดกลุมขอมูลโดยคัดแยกขอมูลออกเปน 2 สวน
ง. การจัดกลุมขอมูลโดยใชหลักการของ Binary Search Tree
4 โปรแกรมใดวิ่งไปตามเว็บไซตและวิ่งไปตามจุดเชื่อมโยง ( links ตางๆ เพื่อรวบรวมขอมูล และทำใหระบบการคนหาของ
Google นั้นไดรับคำตอบที่ตรงเปาหมายและรวดเร็วที่สุด
ก. Feeder
ข. Spider
ค. Google Ads
ง. Google Cloud
5 หลักการทำงานโดยภาพรวมของ MapReduce ทำงานอยางไร
ก. ทำการเขารหัสขอมูลตนทางและถอดรหัสที่ปลายทาง
ข. กระจาย Task ไปรันแบบ Parallel บนเครื่องหลาย ๆ เครื่อง
ค. กระจายขอมูลไปจัดเก็บยังสวนตาง ๆ เพื่อลดพื้นที่การใชงานบนเครื่องแมขาย
ง. นำขอมูลไปประมวลผลบนเครื่องศูนยกลางเครื่องเดียว
BIG DATA ANALYTICS สถาบันสหวิทยาการดิจิทัลและหุนยนต มหาวิทยาลัยเทคโนโลยีราชมงคลพระนคร