Page 34 - 5.Introduction to IoT Analytics using hadoop
P. 34

หลักสูตรการวิเคราะหอินเทอรเน็ตของทุกสรรพสิ่งเบื้องตนดวย Hadoop   33



                           Apache Spark เปน tool สำหรับทำ data processing ที่สรางบน Hadoop อีกทีครับ จุดขายของ Spark นั้นจะ

                  อยูที่ความเร็วในการประมวลผล ซึ่งมีความสามารถเร็วกวา MapReduce ของ Hadoop ไดถึง 10-100 เทาเลยทีเดียว แถมยัง
                  มาพรอมกับ Spark SQL ที่จะชวยใหสามารถเขียน query ไดงายๆ เหมือนกับการใช HiveQL













                           Spark เร็วกวา MapReduce 10-100 เทา

                        ลองใชงานจริงดวย Cloud Dataproc

                            มาถึงตรงนี้ เราจะเห็นวา Big Data มันไมไดเขาใจยากอยางที่คิด แตถาจะใหเห็นภาพมากขึ้น จะตองลองเลนของ

                  จริงดูจะทำใหเขาใจมากขึ้น แลวในปจจุบัน การหา Hadoop มาเลนก็ไมไดลำบากเหมือนแตกอน เพราะในปจจุบัน Google

                  ไดเปดตัว Cloud Dataproc ซึ่งเปนบริการที่นำ Hadoop และ Spark มาติดตั้งบนระบบ Cloud ของ Google แถมยัง
                  ปรับแตงระบบมาใหใชงานไดงายๆ แลวมีคาบริการก็ถือวาไมแพงเทาไร


                        หากขอมูลที่ตองการจะวิเคราะหอยูบนระบบ Cloud ของ Google อยูแลว การใช Cloud Dataproc ก็ยิ่งสะดวกเขา
                  ไปใหญ ใหเขา Google Cloud Platform แลวไปที่ Big Data แลวเลือก Cloud Dataproc เราก็จะเจอเมนูยอย 2 อัน สำหรับ

                  สราง Cluster และ Job ที่อยากจะใหรันบน Cluster ใหเลือก Clusters แลว Create a cluster ไดเลย









































                   INTRODUCTION TO IOT ANALYTICS USING HADOOP     สถาบันสหวิทยาการดิจิทัลและหุนยนต มหาวิทยาลัยเทคโนโลยีราชมงคลพระนคร
   29   30   31   32   33   34   35   36   37   38   39