Page 20 - 6.Machine Learning for Data Science
P. 20
หลักสูตรการวิเคราะหอินเทอรเน็ตของทุกสรรพสิ่งเบื้องตนดวย Hadoop | 19
รูปที่ 3.1 โครงสรางของ HDFS
[ที่มา. https://data-flair.training/blogs/hadoop-tutorial/]
การทำงานของ HDFS จะแบงการทำงานออกเปน 2 สวน คือ Namenode ที่จะทำการตรวจสอบและบริหาร
จัดการ Datanodes โดยจะทำงานบน master และสวนที่สองคือ DataNodes เปนสวนที่เก็บขอมูลไวจริงๆ ซึ่งทำงานบน
slave โดย DataNodes จะตองรายงานสถานะของตัวเองไปยัง Namenodes ทุกๆ 3 วินาที
Map-Reduce เปนสวนที่ใชในการประมวลผลขอมูลของ Hadoop ซึ่งแบงการทำงานออกเปนสองสวนคือ Map
และ Reduce ในขั้นตอน Map ขอมูลที่นำเขามาจะถูกแปลงเปนคูของ key และ value และขั้นตอน reduce จะทำการรวมคู
ของ key และ value เขาดวยกันและสงไปเขียนลงบน HDFS การทำงานของ Map Reduce แสดงดังรูปที่ 3.2
รูปที่ 3.2 โครงสรางการทำงานของ Map Reduce
[ที่มา. https://data-flair.training/blogs/hadoop-tutorial/]
YARN เปนสวนที่ใชบริหารจัดการทรัพยากรตาง ๆ ของ Hadoop โดยมีองคประกอบหลักคือ
สวนบริหารทรัพยากรซึ่งทำงานบน master
สวนบริหาร Nodes ซึ่งทำงานบน slave
สวนสงงาน โดย client จะสงงานมายังสวนบริหารทรัพยากร
INTRODUCTION TO IOT ANALYTICS USING HADOOP สถาบันสหวิทยาการดิจิทัลและหุนยนต มหาวิทยาลัยเทคโนโลยีราชมงคลพระนคร