Page 38 - 3.Big Data Analytics
P. 38

หลักสูตรการวิเคราะห์ข้อมูลขนาดใหญ่   37




                  Section 16: Big Data Architecture and Analytics Platforms with Hadoop’s architecture




                  16.1  วัตถุประสงคการเรียนรู

                             1)  เขาใจสถาปตยกรรมของ Hadoop

                             2)  เขาใจระบบนิเวศของ Hadoop


                  16.2   Hadoop

                             ตามนิยามคุณลักษณะของขอมูลขนาดใหญ ดวย 3V: Volume, Variety และ Velocity นั้นเครื่องมือในการ

                  ทำ การวิเคราะหขอมูลขนาดใหญ ก็จะตองเปลี่ยนไปจากที่เคยใช RDBMS ที่เปน SQL ตองเปลี่ยนเปนเครื่องมืออื่นๆ ที่

                  สามารถจัดการขอมูลไดจำนวนมากขึ้นอยาง NewSQL เชน MySQL Cluster, Amazon RDS หรือ Azure SQL หรือ
                  เครื่องมือที่เปน NoSQL อยาง MongoDB หรือ Cassandra และเครื่องมืออยาง Hadoop ที่ไดรับความสนใจอยางกวาง

                  เพราะสามารถที่จะจัดการขอมูล Unstructured ขนาดใหญได เชนขอมูลที่ เปน Text File, XML หรือ JSON

                             Hadoop เปน Open source Project ของ Apache สำหรับการเก็บและบริหารขอมูลขนาดใหญ (Holmes,

                  2012  Hadoop เขียนดวยโปรแกรมภาษาจาวา มีความสามารถในการทำ Fault Tourarent เพราะจะเก็บขอมูลซ้ำกันใน

                  หลายๆ ที่ และเปนระบบที่เปน Horizontal Scale ที่รันบนเครื่อง commodity server จำนวนมาก Hadoop Project
                  เริ่มตนโดย Doug Cutting และ Mike Cafarella ที่เปนทีมงานของบริษัท Yahoo ซึ่งตอมาก็มีบริษัทอื่นๆ นำไปใชกันอยาง

                  กวางขวางเชน eBay, Facebook และ Amazon รวมถึงมีบริษัทหลายๆ รายที่นำ Hadoop มาทำ Commercial

                  Distribution อาทิเชน Cloudera, MapR, IBM Infoshphere BigInsight, Hortonwork ดังรูปที่ 16.1 สภาพแวดลอมของ

                  Hadoop




























                                               รูปที่ 16.1 สภาพแวดลอมของ Hadoop
                                                        (Forrester, 2016


                   BIG DATA ANALYTICS                             สถาบันสหวิทยาการดิจิทัลและหุนยนต มหาวิทยาลัยเทคโนโลยีราชมงคลพระนคร
   33   34   35   36   37   38   39   40   41   42   43