Page 33 - 6.Machine Learning for Data Science
P. 33

หลักสูตรการวิเคราะหอินเทอรเน็ตของทุกสรรพสิ่งเบื้องตนดวย Hadoop  |  32

                  บทที่ 6 ตัวอยางเครื่องมือสำหรับการเรียนรูของเครื่องจักร



                           การเรียนรูของเครื่องจักรเปนกระแสที่นิยมในปจจุบันจึงมีเครื่องมือที่ใชในการสรางการเรียนรูของเครื่องจักร
                  เกิดขึ้นจำนวนมากดังเชน Spark, Azure ML, AWS ML ซึ่งเปนเครื่องมือที่นิยมและมีความนาเชื่อถือสูง


                  6.1  วัตถุประสงคการเรียนรู


                           เพื่อใหผูเรียนรูจักเครื่องมือสำหรับการพัฒนาการเรียนรูของเครื่องจักร

                  6.2  Spark Machine Learning


                         Spark มีขอดีที่ชวยใหนักพัฒนาสามารถพัฒนาโปรแกรมรูปแบบการเรียนรูของเครื่องจักรไดงายดังเชน สามารถ

                  รองรับภาษาสำหรับการเขียนโปรแกรมไดหลายภาษาเชน Java, Python, R โดย Spark ถูกพัฒนาขึ้นจากภาษา Scala ดังนั้น
                  จึงรองรับภาษา Scala อีกดวย และ สามารถทำงานไดแบบ real-time stream processing เนื่องจาก Spark ทำงานบน

                  หนวยความจำหลัก การประมวลผลเปนแบบ swift ลดการเขียนโคดซ้ำ ๆ ลงไดจึงชวยใหการพัฒนาโปรแกรมทำไดเร็วขึ้น

                  โครงสรางของโปรแกรมดีขึ้น ทั้งยังมี graphX api ที่ใชในการประมวลผลแบบ graph และ parallel graph ขอดีทั้งหมด
                  ขางตนชวยใหผูใชและผูพัฒนาสามารถลดตนทุนการดำเนินการไดมาก


                         สำหรับคุณสมบัติเฉพาะของ Spark เฉพาะในสวนของการเรียนรูของเครื่องจักรมีดังตอไปนี้

                           การแยกแยะชนิด (Classification

                           การแบงกลุม (Clustering  ดวยฟงกชันถดถอย (regression

                           ฟงกชันทางสถิติ
                           ฟงกชันการกรองแบบ collaborative

                           tree algorithm

                           Frequent pattern mining และ

                           model persistence

                  6.3  Azure Machine Learning


                         Azure Machine learning เปนเครื่องมือที่พัฒนาโดย Microsoft ซึ่งจัดเปนเครื่องมือที่คอนขางสำเร็จรูปทำงานบน
                  ระบบกลุมเมฆ (cloud  ทั้งหมดโดยมีรูปแบบใหเลือกใชงาน 2 รูปแบบหลักคือ


                         Azure machine learning service ซึ่งสามารถสอนระบบ ใชงานโมเดล จัดการโมเดล โดยผานภาษาไพธอน

                  โดยรองรับการใชงาน open-source package ตาง ๆ เชน TensorFlow, PyTorch scikit learn เปนตน

                         Azure machine learning studio บริการนี้สามารถสราง ทดลอง ใชงานโมเดลที่ตั้งคาพื้นฐานไวใหกอนแลวโดย

                  การลากวาง ซึ่งทำใหงายในการพัฒนาอยางมาก การปรับแตงเชิงลึกสามารถใชภาษา python และ R ได ขอจำกัดของการใช
                  บริการนี้คือ ชุดขอมูลสำหรับการสอนระบบตองมีขนาดไมเกิน 10 GB



                   INTRODUCTION TO IOT ANALYTICS USING HADOOP                                        สถาบันสหวิทยาการดิจิทัลและหุนยนต มหาวิทยาลัยเทคโนโลยีราชมงคลพระนคร
   28   29   30   31   32   33   34   35   36   37   38