Page 10 - 3.Big Data Analytics
P. 10
หลักสูตรการวิเคราะห์ข้อมูลขนาดใหญ่ 9
รูปที่ 1.3 ลักษณะของขอมูลขนาดใหญ
(Braun, 2015
1.4 ความทาทายในโลกของขอมูลใหญ
เมื่อขอมูลขนาดใหญเขามาเรื่อย ความสำคัญของวิทยาการขอมูล (Data Sciences ก็เพิ่มขึ้นอยางรวดเร็วใน
การจัดการกับขอมูลขนาดใหญ ขอมูลขนาดใหญและสมัยใหมนั้นไมสามารถอาศัยฐานขอมูลสัมพันธ (Relational Database
แบบสมัยกอนไดอีกแลว เนื่องจากขอมูลไมไดมีโครงสรางชัดเจน (Unstructured Data มีการเปลี่ยนแปลงอยางรวดเร็ว
ขอมูลมีจำนวนมาก ไมไดมาจากการสุมตัวอยางจากการสำรวจเหมือนในอดีต แตก็มีปญหาไมยิ่งหยอนไปกวากันเนื่องจากมี
ปญหาคุณภาพขอมูล ขอมูลทับซอนไมตรงกันหรือไมสอดคลองกัน มีขอมูลเยอะแตก็มีขอมูลสูญหาย (Missing data
มากมาย หนาที่ของนักวิทยาศาสตรขอมูล (Data Scientist คือการจัดการรวบรวมขอมูล วิเคราะหขอมูล สรุปผล นำ
เสนอแนะ และนำสารสนเทศที่ไดไปใชงานใหเกิดประโยชนสูงสุดแกองคกร
บทบาทหนาที่นั้นนำมาซึ่งความทาทายมากมายมาใหนักวิทยาศาสตรขอมูล ตองเรียนรู ปรับตัว และแกปญหา
1. ขอมูลมีขนาดใหญและไหลเขามารวดเร็วมาก จนตองหา algorithm หรือขั้นตอนวิธีในการวิเคราะหใหเร็วขึ้น
มีการแยกกันคำนวณ (Distributed computing
2. ขอมูลขนาดใหญไมมีโครงสราง ทำใหตองพัฒนาวิธีการทางสถิติใหมๆ ใหเทาทันกับการวิเคราะหขอมูลที่ไมมี
โครงสราง สถิติกราฟกและการสรางภาพนิทัศน (Statistical Graphic and Data Visualization กลับมีความสำคัญมาก
BIG DATA ANALYTICS สถาบันสหวิทยาการดิจิทัลและหุนยนต มหาวิทยาลัยเทคโนโลยีราชมงคลพระนคร