Page 39 - 3.Big Data Analytics
P. 39
หลักสูตรการวิเคราะห์ข้อมูลขนาดใหญ่ 38
Hadoop จะมีองคประกอบหลักสองสวนคือ
HDFS (Hadoop Distribution File System ทำหนาที่เปนสวนเก็บขอมูล ซึ่งจะเก็บขอมูลขนาดใหญที่ถูก
แบงเปนไฟลยอยเก็บลง ใน Data Node จำนวนมาก โดยจะมี Master Node ทำหนาที่ระบุตำเเหนง ของ
ขอมูลที่เก็บใน Data node ดังรูปที่ 16.2
รูปที่ 16.2 สถาปตยกรรมของ Hadoop HDFS
(Forrester, 2016
ตามรูปที่ 16.3 การทำ Hadoop Cluster ถือวาเปนสิ่งจำเปนในการประมวลผลขอมูลขนาดใหญ เนื่องจาก
ตองใชทรัพยากรรวมกันอยางมาก
รูปที่ 16.3 การทำ Hadoop Cluster
(Forrester, 2016
BIG DATA ANALYTICS สถาบันสหวิทยาการดิจิทัลและหุนยนต มหาวิทยาลัยเทคโนโลยีราชมงคลพระนคร