Page 7 - 6.Machine Learning for Data Science
P. 7
หลักสูตรการวิเคราะหอินเทอรเน็ตของทุกสรรพสิ่งเบื้องตนดวย Hadoop | 6
แบบอางอิงตัวแปรคือการวิเคราะหการถดถอยเชิงเสน (linear regression นอกจากนั้นยังมีเทคนิคการวิเคราะหแบบอื่นๆ ที่
จัดเปนรูปแบบการวิเคราะหเชิงทำนายแบบอางอิงตัวแปรที่ถูกนำใชในการวิเคราะหขอมูลดังเชน
Logistic Regression
Linear Discriminant Analysis
Naive Bayes
Artificial Neural Networks
1.1.2. โมเดลการวิเคราะหเชิงทำนายแบบอิสระ
โมเดลนี้จะมีลักษณะตรงขามกับแบบอางอิงตัวแปรนั่นคือ โมเดลนี้จะไมขึ้นกับขอบเขตของตัวแปรสำหรับการ
เรียนรูของการวิเคราะหเชิงทำนายแบบอิสระสามารถเรียนรูไดอยางอิสระจากขอมูลฝกสอน (training data โดยที่ขอมูลนั้น
จะเหมาะสม หรือพอดีกับ mapping function ที่สรางขึ้นมา ตัวอยางพื้นฐานของการทำนาย ดวยการวิเคราะหเชิงทำนาย
แบบอิสระคือ เพื่อนบานใกลสุด (k-nearest neighbor ซึ่งทำนายโดยการหารูปแบบของระยะทางที่คลายคลึงกันจากขอมูล
ฝกสอน นอกจากเทคนิคเพื่อนบานใกลสุดดังกลาวขางตนแลวเทคนิคอื่นๆ สำหรับการวิเคราะหเชิงทำนายแบบอิสระที่นิยมใช
กันก็คือแผนผังตนไม (decision tree , Support Vector Machine (SVM จุดเดนที่สำคัญ ของโมเดลการวิเคราะหเชิง
ทำนายอิสระคือสามารถใชไดดีกับรูปแบบการทำงานที่มีฟงกชันจำนวนมากไดที่มีโครงสรางไมชัดเจน ทั้งยังคงมีความแมนยำ
สูงในการทำนาย
นอกจากรูปแบบหลักสองรูปแบบที่ไดกลาวถึงแลว ยังมีอีกหนึ่งรูปแบบที่นาสนใจคือ โมเดลการวิเคราะหแบบกึ่ง
พารามิเตอร (semi-parametric ซึ่งเปนรูปแบบที่อยูระหวางกลาง ระหวางโมเดลการวิเคราะหแบบอางอิงตัวแปร และโมเดล
การวิเคราะหแบบอิสระ โดยโมเดลแบบกึ่งพารามิเตอรจะมีองคประกอบทั้งแบบจำกัด (finite และแบบไมจำกัด (infinite ซึ่ง
จะทำลายขอจำกัดของโมเดลการวิเคราะหแบบอางอิงตัวแปรและ โมเดลการวิเคราะหแบบอิสระ โดยเทคนิคที่สำคัญของ
โมเดลแบบกึ่งพารามิเตอร คือการทำใหเรียบ (smoothing และแกนกลาง (kernels โดยตัวอยางโมเดลแบบกึ่งพารามิเตอรที่
เปนที่รูจัก คือ Cox proprotional hazards
1.3 ประโยชนของการวิเคราะหเชิงทำนาย
การวิเคราะหเชิงทำนายมีประโยชนในการชวยธุรกิจในพัฒนาสินคา บริการ และประสบการณที่ดีใหแกลูกคา โดย
การศึกษาพฤติกรรมของลูกคาที่มีศักยภาพผานชองทางสื่อสังคมออนไลน (social media ดังในปจจุบันจะพบวาเมื่อผูใชเปด
หนาเพจเฟซบุกของตนเองจะพบกับขาวสารที่ผูใชทานนั้นๆ มีความสนใจ รวมถึงการโฆษณาสินคา บริการที่มีแนวโนมวาผูใช
ทานนั้นๆ จะใชบริการอยางอัตโนมัติซึ่งเกิดจากการศึกษาพฤติกรรมของผูบริโภคโดยเฟซบุก การศึกษากิจกรรมบนโลก
ออนไลนจากผูเขาเยี่ยมชมเว็บไซต และทำนายความตองการในอนาคตได โดยขอมูลที่รวบรวมไวจะถูกคำนวณและวิเคราะห
ดวยคุณลักษณะที่สำคัญ (key features โดยที่คุณลักษณะหมายถึง รูปแบบที่จำเปน และ องคประกอบของขอมูล อยางไรก็ดี
คุณลักษณะประการก็ไมมีประโยชนในการวิเคราะห ดังนั้นในการวิเคราะหเชิงทำนายเพื่อใหเกิดประโยชนสูงสุดจึงตองทำการ
คัดเลือกเฉพาะคุณลักษณะเฉพาะที่สำคัญ นอกจากนี้สารสนเทศอาจมีองคประกอบที่เกี่ยวเนื่องกับบางสิ่งโดยไมขึ้นกับโมเดล
อีกดวย
INTRODUCTION TO IOT ANALYTICS USING HADOOP สถาบันสหวิทยาการดิจิทัลและหุนยนต มหาวิทยาลัยเทคโนโลยีราชมงคลพระนคร