Page 27 - 5.Introduction to IoT Analytics using hadoop
P. 27
หลักสูตรการวิเคราะหอินเทอรเน็ตของทุกสรรพสิ่งเบื้องตนดวย Hadoop 26
1. ความปลอดภัยของขอมูล จะตองคิดเผื่อเหตุการณที่ขอมูลใน SSD มันเสียดวย โดยที่การเก็บขอมูลเอาไว
ที่เดียวนั้น ถือวามีความเสี่ยงสูงดังนั้นจะตองมีระบบสำรองขอมูลอัตโนมัติ แลวการประเมินพื้นที่จัดเก็บ
ขอมูลนั้นก็จะตองคิดเผื่อพื้นที่ที่จะตองใชในการสำรองขอมูลเอาไวดวย
2. ประสิทธิภาพ ถึงแมวาจะมีพื้นที่จัดเก็บขอมูลที่ใหญและเร็ว และมีเครื่องคอมพิวเตอรแรงๆ แตเชื่อวามัน
ไมพอที่จะใชวิเคราะหขอมูล Big Data หรอก ถายังใชวิธีวิเคราะหแบบเดิมๆ ที่เคยทำกับ RDBMS อยู
หรือตอใหทำได ก็คงจะตองใชตนทุนที่สูงมาก
ถึงแมวาปญหาที่วามาอาจจะดูเยอะ แตจริงๆ แลวมันมีตัวชวยอยูครับ ซึ่ง tool ที่เคานิยมใชกันมากที่สุดตัวหนึ่งก็
คือ Hadoop แลว Hadoop คืออะไร
3.4 Hadoop
Hadoop คือ Java programming framework ที่รองรับการทำงานที่ตองประมวลผลและเก็บขอมูลขนาดใหญ
เปนสวนหนึ่งของ apache project โดย Hadoop ถูกออกแบบมาใหเปน application ที่สามารถทำงานไดบนระบบแบบ
node หรือมี hardware จำนวนหลายๆเครื่องพรอมกัน เพื่อรองรับขอมูลขนาดใหญ ซึ่งใชการแตก file system ออกมา
กระจายตาม node ใหสามารถทำงานไดรวดเร็วพรอมทั้งสงขอมูลหากันระหวาง node ทั้งหมด รวมถึงมีความสามารถในการ
จัดการ node มี่เสียหายไดโดนไมทำใหเกิดขอมูลสูญหาย ปจจุบัน Hadoop ถูกนำมาใชในงาน big data จำพวก การคำนวณ
ขอมูลทางวิทยาศาสตรเฉพาะทาง, เชิงธุรกิจ รวมถึงวางแผนการขาย และ ประมวลผลขอมูล sensor จำนวนมาก หรือ
internet of things (IoT
[ที่มา. https://opencirrus.org/what-is-hadoop-cluster-ecosystem/]
INTRODUCTION TO IOT ANALYTICS USING HADOOP สถาบันสหวิทยาการดิจิทัลและหุนยนต มหาวิทยาลัยเทคโนโลยีราชมงคลพระนคร