Page 40 - 3.Big Data Analytics
P. 40
หลักสูตรการวิเคราะห์ข้อมูลขนาดใหญ่ 39
16.3 ระบบนิเวศของ Hadoop
ระบบ Hadoop เองจะมีองคประกอบหลักอยูแคสองสวนคือ HDFS และ Map/Reduce ซึ่งคอนขางจะไมสะดวก
กับผูใชงานที่มีความตองการอื่น เชน การประมวลผลโดยใชภาษา SQL การเขียนหรืออานขอมูลแบบ Random access หรือ
การถายโอนขอมูลจากที่อื่น จึงมีการพัฒนาโครงการที่มาทำงานรวมกับ Hadoop โดยแนวคิดระบบนิเวศของ Hadoop Zoo
แสดงไดดังรูปที่ 16.4 กรอบแนวคิดระบบนิเวศของ Hadoop เพื่อใหไดประสิทธิภาพดียิ่งขึ้น ซึ่งมีเครื่องมือที่สำคัญดังนี้
Hive เปนเครื่องมือสำหรับผูตองการสืบคน (Query ขอมูลที่เก็บใน HDFS ดวยภาษาลักษณะ SQL แทนที่
จะตองมาเขียนโปรแกรม Map/ Reduce โดย Hive จะทำหนาที่ในการแปล SQL line ใหมาเปน Map/Reduce
แลวก็ทำการรันแบบ Batch ดังรูปที่ 16.5 สถาปตยกรรมของ Hive
รูปที่ 16.4 กรอบแนวคิดระบบนิเวศของ Hadoop
(Forrester, 2016
รูปที่ 16.5 สถาปตยกรรมของ Hive
(Forrester, 2016
BIG DATA ANALYTICS สถาบันสหวิทยาการดิจิทัลและหุนยนต มหาวิทยาลัยเทคโนโลยีราชมงคลพระนคร