Page 20 - 3.Big Data Analytics
P. 20
หลักสูตรการวิเคราะห์ข้อมูลขนาดใหญ่ 19
Section 5: Parallel and distributed computing using MapReduce
5.1 วัตถุประสงคการเรียนรู
1) เขาใจกระบวนการทำงานแบบขนานและกระจายตัวดวย Map/Reduce
5.2 กระบวนการทำงานแบบขนานและกระจายตัวดวย Map/Reduce
Map/Reduce จะเปนสวนประมวลผลขอมูล ที่นักพัฒนาสามารถเขียน โปรแกรมโดยใชภาษาจาวามาวิเคราะห
ขอมูลในรูปแบบของฟงกชันการ Map และ Reduce ไดโดยระบบก็จะกระจาย Task ไปรันแบบ Parallel บนเครื่องหลายๆ
เครื่องดังรูปที่ 5.1 และ รูปที่ 5.2
รูปที่ 5.1 ภาพรวมของ MapReduce Word Count Process
(Adam & Josh, 2017
BIG DATA ANALYTICS สถาบันสหวิทยาการดิจิทัลและหุนยนต มหาวิทยาลัยเทคโนโลยีราชมงคลพระนคร