Page 34 - 5.Introduction to IoT Analytics using hadoop
P. 34
หลักสูตรการวิเคราะหอินเทอรเน็ตของทุกสรรพสิ่งเบื้องตนดวย Hadoop 33
Apache Spark เปน tool สำหรับทำ data processing ที่สรางบน Hadoop อีกทีครับ จุดขายของ Spark นั้นจะ
อยูที่ความเร็วในการประมวลผล ซึ่งมีความสามารถเร็วกวา MapReduce ของ Hadoop ไดถึง 10-100 เทาเลยทีเดียว แถมยัง
มาพรอมกับ Spark SQL ที่จะชวยใหสามารถเขียน query ไดงายๆ เหมือนกับการใช HiveQL
Spark เร็วกวา MapReduce 10-100 เทา
ลองใชงานจริงดวย Cloud Dataproc
มาถึงตรงนี้ เราจะเห็นวา Big Data มันไมไดเขาใจยากอยางที่คิด แตถาจะใหเห็นภาพมากขึ้น จะตองลองเลนของ
จริงดูจะทำใหเขาใจมากขึ้น แลวในปจจุบัน การหา Hadoop มาเลนก็ไมไดลำบากเหมือนแตกอน เพราะในปจจุบัน Google
ไดเปดตัว Cloud Dataproc ซึ่งเปนบริการที่นำ Hadoop และ Spark มาติดตั้งบนระบบ Cloud ของ Google แถมยัง
ปรับแตงระบบมาใหใชงานไดงายๆ แลวมีคาบริการก็ถือวาไมแพงเทาไร
หากขอมูลที่ตองการจะวิเคราะหอยูบนระบบ Cloud ของ Google อยูแลว การใช Cloud Dataproc ก็ยิ่งสะดวกเขา
ไปใหญ ใหเขา Google Cloud Platform แลวไปที่ Big Data แลวเลือก Cloud Dataproc เราก็จะเจอเมนูยอย 2 อัน สำหรับ
สราง Cluster และ Job ที่อยากจะใหรันบน Cluster ใหเลือก Clusters แลว Create a cluster ไดเลย
INTRODUCTION TO IOT ANALYTICS USING HADOOP สถาบันสหวิทยาการดิจิทัลและหุนยนต มหาวิทยาลัยเทคโนโลยีราชมงคลพระนคร