Page 38 - 5.Introduction to IoT Analytics using hadoop
P. 38
หลักสูตรการวิเคราะหอินเทอรเน็ตของทุกสรรพสิ่งเบื้องตนดวย Hadoop 37
ชุดของเลเยอรมีงานตอไปนี้:
1. การจัดการชุดขอมูลหลัก: ชุดขอมูลหลักเปนชุดขอมูลดิบที่ไมเปลี่ยนแปลงและตอทายซึ่งขอมูลจะถูก
ตอทายเทานั้นและไมไดรับการปรับปรุง ดังนั้นเราสามารถรักษาฐานขอมูลเวอรชันที่สอดคลองกันได
เสมอโดยที่มีการลบสิ่งสกปรก / ที่ไมสอดคลองกันตอทายฐานขอมูลที่อยูในสภาพแวดลอม Hadoop
แบทชเลเยอรจะถูกเก็บไวใน HDFS
2. การประมวลผลมุมมองแบทชลวงหนา: การใชขอมูลในชุดขอมูลหลักเราสามารถคำนวณมุมมองลวงหนา
ซึ่งสามารถนำมารวมกับมุมมองจากเลเยอรความเร็วเพื่อใหขอมูลเชิงลึกที่สามารถดำเนินการไดใหกับ
ลูกคา มุมมองจากชุดชั้นจะเขารวมกับมุมมองจากชั้นความเร็วในชั้นนำเสนอ ในกรณีที่มีความลมเหลว
เราสามารถคำนวณมุมมองใหม (เนื่องจากขอมูลไมเปลี่ยนรูป และเราจะมี สถานะที่สอดคลองกันกลับมา
มุมมองถูกคำนวณเหนือชุดขอมูลทั้งหมดและดวยเหตุนี้จึงไมคาดวาจะมีการคำนวณมุมมองบอยครั้ง การ
คำนวณมุมมองอาจใชเวลาสองสามชั่วโมงขึ้นอยูกับขนาดของชุดขอมูล ในสภาพแวดลอม Hadoop
มุมมองจะถูกคำนวณในแตละการวนซ้ำของโปรแกรมลดแผนที่
Speed Layer: ไดรับการออกแบบสำหรับ “การเขาถึงแบบสุมการเขียนแบบสุม” การคำนวณมุมมองเกิดขึ้นแบบ
คอยเปนคอยไป เลเยอรนี้มีขอมูลที่ทันสมัยที่สุด นอกเหนือจากการมีขอมูลที่ทันสมัยเลเยอรนี้ยังมีขอมูลนอยลง ทำไดโดยการ
ลางขอมูลในชวงเวลาปกติ ดังนั้นมุมมองในเลเยอรนี้จึงไมเปนไปตามธรรมชาติ
เนื่องจากการคำนวณเกิดขึ้นแบบไมตอเนื่องตรรกะในการนำเลเยอรนี้มาใชจึงมีความซับซอน ดังนั้นความซับซอน
สวนใหญจึงถูกสงไปยังสวนเล็กๆ (เชนเลเยอรความเร็ว สิ่งนี้เรียกวา "การแยกความซับซอน" เวลาแฝงที่ต่ำของขอมูลมักจะ
นำไปสูความไมถูกตอง นี่เปนการแลกเปลี่ยนที่ยอมรับในเลเยอรนี้
Presentation Layer: รับผิดชอบการจัดการแบบสอบถาม แบบสอบถามจะตอบดวยการรวมมุมมองจากเลเยอร
ความเร็วและเลเยอรแบทช มุมมองชุดงานจะไดรับการจัดทำดัชนีเพื่อใหพวกเขาสามารถสอบถามดวยเวลาแฝงที่ต่ำ
ขอดีของสถาปตยกรรมแลมบดา
- สถาปตยกรรมแลมบดาใชประโยชนจากวิธีการประมวลผลแบบแบทชและการประมวลผลแบบสตรีม
- สามารถวิเคราะหขอมูลขนาดใหญไดในเวลาจริง
ขอเสียของสถาปตยกรรมแลมบดา
- มีตรรกะที่ซ้ำกันจำนวนมากระหวางมุมมองแบทชและมุมมองความเร็ว
- มีความซับซอนในการปฏิบัติงานของระบบที่เกี่ยวของในการนำสถาปตยกรรมแลมบดาไปใช ดังนั้นการ
ใชงานสถาปตยกรรมนี้จึงเปนเรื่องยาก
INTRODUCTION TO IOT ANALYTICS USING HADOOP สถาบันสหวิทยาการดิจิทัลและหุนยนต มหาวิทยาลัยเทคโนโลยีราชมงคลพระนคร