Page 34 - 5.Introduction to IoT Analytics using hadoop

P. 34

หลักสูตรการวิเคราะหอินเทอรเน็ตของทุกสรรพสิ่งเบื้องตนดวย Hadoop 33

Apache Spark เปน tool สำหรับทำ data processing ที่สรางบน Hadoop อีกทีครับ จุดขายของ Spark นั้นจะ

อยูที่ความเร็วในการประมวลผล ซึ่งมีความสามารถเร็วกวา MapReduce ของ Hadoop ไดถึง 10-100 เทาเลยทีเดียว แถมยัง
มาพรอมกับ Spark SQL ที่จะชวยใหสามารถเขียน query ไดงายๆ เหมือนกับการใช HiveQL

Spark เร็วกวา MapReduce 10-100 เทา

ลองใชงานจริงดวย Cloud Dataproc

มาถึงตรงนี้ เราจะเห็นวา Big Data มันไมไดเขาใจยากอยางที่คิด แตถาจะใหเห็นภาพมากขึ้น จะตองลองเลนของ

จริงดูจะทำใหเขาใจมากขึ้น แลวในปจจุบัน การหา Hadoop มาเลนก็ไมไดลำบากเหมือนแตกอน เพราะในปจจุบัน Google

ไดเปดตัว Cloud Dataproc ซึ่งเปนบริการที่นำ Hadoop และ Spark มาติดตั้งบนระบบ Cloud ของ Google แถมยัง
ปรับแตงระบบมาใหใชงานไดงายๆ แลวมีคาบริการก็ถือวาไมแพงเทาไร

หากขอมูลที่ตองการจะวิเคราะหอยูบนระบบ Cloud ของ Google อยูแลว การใช Cloud Dataproc ก็ยิ่งสะดวกเขา
ไปใหญ ใหเขา Google Cloud Platform แลวไปที่ Big Data แลวเลือก Cloud Dataproc เราก็จะเจอเมนูยอย 2 อัน สำหรับ

สราง Cluster และ Job ที่อยากจะใหรันบน Cluster ใหเลือก Clusters แลว Create a cluster ไดเลย

INTRODUCTION TO IOT ANALYTICS USING HADOOP สถาบันสหวิทยาการดิจิทัลและหุนยนต มหาวิทยาลัยเทคโนโลยีราชมงคลพระนคร

29 30 31 32 33 34 35 36 37 38 39