Page 41 - 3.Big Data Analytics
P. 41
หลักสูตรการวิเคราะห์ข้อมูลขนาดใหญ่ 40
Pig เปนเครื่องมือคลายๆกับ Hive ที่ชวยใหประมวลผลขอมูลโดยไมตองเขียนโปรแกรม Map/Reduce ซึ่ง
Pig จะใชโปรแกรมภาษา script งาย ๆ เรียกวา Pig Latin แทน โดย Pig เหมาะกับการทำ ETL สำหรับ
การแปลงขอมูลในรูปแบบตาง ๆ เชน JSON
Sqoop เปนเครื่องมือในการถายโอนขอมูลระหวางฐานขอมูลที่อยูรูปแบบ Table บน RDBMS อยาง SQL
server, Oracle หรือ MySQL กับขอมูลบน HDFS ของ Hadoop ดังรูปที่ 16.6 สถาปตยกรรมของ Sqoop
รูปที่ 16.6 สถาปตยกรรมของ Sqoop
(Forrester, 2016
Flume เปนเครื่องมือในการดึงขอมูลจากระบบอื่น ๆ แบบ real-time เขาสู HDFS เชนการดึง Log จาก
Web Server การดึงขอมูลเหลานี้จะตอง มีการติดตั้ง Agent ที่เครื่อง Server ดังรูปที่ 16.7
BIG DATA ANALYTICS สถาบันสหวิทยาการดิจิทัลและหุนยนต มหาวิทยาลัยเทคโนโลยีราชมงคลพระนคร