Page 40 - 3.Big Data Analytics
P. 40

หลักสูตรการวิเคราะห์ข้อมูลขนาดใหญ่   39




                  16.3   ระบบนิเวศของ Hadoop


                           ระบบ Hadoop เองจะมีองคประกอบหลักอยูแคสองสวนคือ HDFS และ Map/Reduce ซึ่งคอนขางจะไมสะดวก

                  กับผูใชงานที่มีความตองการอื่น เชน การประมวลผลโดยใชภาษา SQL การเขียนหรืออานขอมูลแบบ Random access หรือ
                  การถายโอนขอมูลจากที่อื่น จึงมีการพัฒนาโครงการที่มาทำงานรวมกับ Hadoop โดยแนวคิดระบบนิเวศของ Hadoop Zoo

                  แสดงไดดังรูปที่ 16.4 กรอบแนวคิดระบบนิเวศของ Hadoop เพื่อใหไดประสิทธิภาพดียิ่งขึ้น ซึ่งมีเครื่องมือที่สำคัญดังนี้

                        Hive เปนเครื่องมือสำหรับผูตองการสืบคน (Query ขอมูลที่เก็บใน  HDFS ดวยภาษาลักษณะ SQL แทนที่

                           จะตองมาเขียนโปรแกรม Map/ Reduce โดย Hive จะทำหนาที่ในการแปล SQL line ใหมาเปน Map/Reduce

                           แลวก็ทำการรันแบบ Batch ดังรูปที่ 16.5 สถาปตยกรรมของ Hive

























                                            รูปที่ 16.4 กรอบแนวคิดระบบนิเวศของ Hadoop
                                                        (Forrester, 2016


























                                                 รูปที่ 16.5 สถาปตยกรรมของ Hive

                                                        (Forrester, 2016


                   BIG DATA ANALYTICS                             สถาบันสหวิทยาการดิจิทัลและหุนยนต มหาวิทยาลัยเทคโนโลยีราชมงคลพระนคร
   35   36   37   38   39   40   41   42   43   44   45