Page 10 - 3.Big Data Analytics
P. 10

หลักสูตรการวิเคราะห์ข้อมูลขนาดใหญ่   9











































                                                รูปที่ 1.3 ลักษณะของขอมูลขนาดใหญ

                                                         (Braun, 2015


                  1.4 ความทาทายในโลกของขอมูลใหญ


                             เมื่อขอมูลขนาดใหญเขามาเรื่อย ความสำคัญของวิทยาการขอมูล (Data Sciences  ก็เพิ่มขึ้นอยางรวดเร็วใน

                  การจัดการกับขอมูลขนาดใหญ ขอมูลขนาดใหญและสมัยใหมนั้นไมสามารถอาศัยฐานขอมูลสัมพันธ (Relational Database
                  แบบสมัยกอนไดอีกแลว เนื่องจากขอมูลไมไดมีโครงสรางชัดเจน (Unstructured Data มีการเปลี่ยนแปลงอยางรวดเร็ว

                  ขอมูลมีจำนวนมาก ไมไดมาจากการสุมตัวอยางจากการสำรวจเหมือนในอดีต แตก็มีปญหาไมยิ่งหยอนไปกวากันเนื่องจากมี

                  ปญหาคุณภาพขอมูล ขอมูลทับซอนไมตรงกันหรือไมสอดคลองกัน มีขอมูลเยอะแตก็มีขอมูลสูญหาย (Missing data
                  มากมาย หนาที่ของนักวิทยาศาสตรขอมูล (Data Scientist คือการจัดการรวบรวมขอมูล วิเคราะหขอมูล สรุปผล นำ

                  เสนอแนะ และนำสารสนเทศที่ไดไปใชงานใหเกิดประโยชนสูงสุดแกองคกร

                           บทบาทหนาที่นั้นนำมาซึ่งความทาทายมากมายมาใหนักวิทยาศาสตรขอมูล ตองเรียนรู ปรับตัว และแกปญหา


                           1. ขอมูลมีขนาดใหญและไหลเขามารวดเร็วมาก จนตองหา algorithm หรือขั้นตอนวิธีในการวิเคราะหใหเร็วขึ้น
                  มีการแยกกันคำนวณ (Distributed computing


                           2. ขอมูลขนาดใหญไมมีโครงสราง ทำใหตองพัฒนาวิธีการทางสถิติใหมๆ ใหเทาทันกับการวิเคราะหขอมูลที่ไมมี

                  โครงสราง สถิติกราฟกและการสรางภาพนิทัศน (Statistical Graphic and Data Visualization กลับมีความสำคัญมาก


                   BIG DATA ANALYTICS                             สถาบันสหวิทยาการดิจิทัลและหุนยนต มหาวิทยาลัยเทคโนโลยีราชมงคลพระนคร
   5   6   7   8   9   10   11   12   13   14   15