Page 7 - 6.Machine Learning for Data Science
P. 7

หลักสูตรการวิเคราะหอินเทอรเน็ตของทุกสรรพสิ่งเบื้องตนดวย Hadoop  |  6

                  แบบอางอิงตัวแปรคือการวิเคราะหการถดถอยเชิงเสน (linear regression  นอกจากนั้นยังมีเทคนิคการวิเคราะหแบบอื่นๆ ที่

                  จัดเปนรูปแบบการวิเคราะหเชิงทำนายแบบอางอิงตัวแปรที่ถูกนำใชในการวิเคราะหขอมูลดังเชน

                                Logistic Regression

                                Linear Discriminant Analysis

                                Naive Bayes

                                Artificial Neural Networks

                  1.1.2.  โมเดลการวิเคราะหเชิงทำนายแบบอิสระ

                           โมเดลนี้จะมีลักษณะตรงขามกับแบบอางอิงตัวแปรนั่นคือ โมเดลนี้จะไมขึ้นกับขอบเขตของตัวแปรสำหรับการ

                  เรียนรูของการวิเคราะหเชิงทำนายแบบอิสระสามารถเรียนรูไดอยางอิสระจากขอมูลฝกสอน (training data  โดยที่ขอมูลนั้น

                  จะเหมาะสม หรือพอดีกับ mapping function ที่สรางขึ้นมา ตัวอยางพื้นฐานของการทำนาย ดวยการวิเคราะหเชิงทำนาย
                  แบบอิสระคือ เพื่อนบานใกลสุด (k-nearest neighbor  ซึ่งทำนายโดยการหารูปแบบของระยะทางที่คลายคลึงกันจากขอมูล

                  ฝกสอน นอกจากเทคนิคเพื่อนบานใกลสุดดังกลาวขางตนแลวเทคนิคอื่นๆ สำหรับการวิเคราะหเชิงทำนายแบบอิสระที่นิยมใช

                  กันก็คือแผนผังตนไม (decision tree , Support Vector Machine (SVM  จุดเดนที่สำคัญ ของโมเดลการวิเคราะหเชิง
                  ทำนายอิสระคือสามารถใชไดดีกับรูปแบบการทำงานที่มีฟงกชันจำนวนมากไดที่มีโครงสรางไมชัดเจน ทั้งยังคงมีความแมนยำ

                  สูงในการทำนาย

                           นอกจากรูปแบบหลักสองรูปแบบที่ไดกลาวถึงแลว ยังมีอีกหนึ่งรูปแบบที่นาสนใจคือ โมเดลการวิเคราะหแบบกึ่ง

                  พารามิเตอร (semi-parametric  ซึ่งเปนรูปแบบที่อยูระหวางกลาง ระหวางโมเดลการวิเคราะหแบบอางอิงตัวแปร และโมเดล

                  การวิเคราะหแบบอิสระ โดยโมเดลแบบกึ่งพารามิเตอรจะมีองคประกอบทั้งแบบจำกัด (finite  และแบบไมจำกัด (infinite  ซึ่ง
                  จะทำลายขอจำกัดของโมเดลการวิเคราะหแบบอางอิงตัวแปรและ โมเดลการวิเคราะหแบบอิสระ โดยเทคนิคที่สำคัญของ

                  โมเดลแบบกึ่งพารามิเตอร คือการทำใหเรียบ (smoothing  และแกนกลาง (kernels  โดยตัวอยางโมเดลแบบกึ่งพารามิเตอรที่

                  เปนที่รูจัก คือ Cox proprotional hazards


                  1.3  ประโยชนของการวิเคราะหเชิงทำนาย


                          การวิเคราะหเชิงทำนายมีประโยชนในการชวยธุรกิจในพัฒนาสินคา บริการ และประสบการณที่ดีใหแกลูกคา โดย
                  การศึกษาพฤติกรรมของลูกคาที่มีศักยภาพผานชองทางสื่อสังคมออนไลน (social media  ดังในปจจุบันจะพบวาเมื่อผูใชเปด
                  หนาเพจเฟซบุกของตนเองจะพบกับขาวสารที่ผูใชทานนั้นๆ มีความสนใจ รวมถึงการโฆษณาสินคา บริการที่มีแนวโนมวาผูใช

                  ทานนั้นๆ จะใชบริการอยางอัตโนมัติซึ่งเกิดจากการศึกษาพฤติกรรมของผูบริโภคโดยเฟซบุก การศึกษากิจกรรมบนโลก
                  ออนไลนจากผูเขาเยี่ยมชมเว็บไซต และทำนายความตองการในอนาคตได โดยขอมูลที่รวบรวมไวจะถูกคำนวณและวิเคราะห

                  ดวยคุณลักษณะที่สำคัญ (key features  โดยที่คุณลักษณะหมายถึง รูปแบบที่จำเปน และ องคประกอบของขอมูล อยางไรก็ดี
                  คุณลักษณะประการก็ไมมีประโยชนในการวิเคราะห ดังนั้นในการวิเคราะหเชิงทำนายเพื่อใหเกิดประโยชนสูงสุดจึงตองทำการ
                  คัดเลือกเฉพาะคุณลักษณะเฉพาะที่สำคัญ  นอกจากนี้สารสนเทศอาจมีองคประกอบที่เกี่ยวเนื่องกับบางสิ่งโดยไมขึ้นกับโมเดล
                  อีกดวย



                   INTRODUCTION TO IOT ANALYTICS USING HADOOP                                        สถาบันสหวิทยาการดิจิทัลและหุนยนต มหาวิทยาลัยเทคโนโลยีราชมงคลพระนคร
   2   3   4   5   6   7   8   9   10   11   12