Page 17 - 3.Big Data Analytics
P. 17
หลักสูตรการวิเคราะห์ข้อมูลขนาดใหญ่ 16
3.4 ระเบียบวิธีการแบงกลุมแบบ Hierarchical Clustering
รูปแบบนี้เปนการจัดกลุมแบบมีขั้นตอน เปนเทคนิคที่นิยมใชในการจัดกลุมเทคนิคหนึ่งซึ่งมีขอจำกัดคือ จำนวน
กลุมตัวอยางที่ตองการจัดและจำนวนตัวแปรตองไมมากนัก (ไมควรเกิน 200 กลุม ขอดีของวิธีการนี้คือ เปนการเรียนรูแบบ
ไมมีผูสอน ดังนั้นจึงไมจำเปนตองทราบจำนวนกลุมที่มีในขอมูล และไมจำเปนตองทราบวาตัวแปรใด หรือกรณีใดอยูในกลุมใด
ทั้งนี้ชนิดของขอมูลหรือตัวแปรที่สามารถใชเทคนิค Hierarchical Cluster ไดมี 3 ประเภท คือ ขอมูลเปนสเกลอันตรภาค
(Interval scale หรือสเกลอัตราสวน ( Ratio scale ซึ่งเปนขอมูลเชิงปริมาณ , ขอมูลที่อยูในรูปความถี่ (Count Data ,
ขอมูลอยูในรูปฐานสองนั่นคือ มีได 2 คา คือ 0 กับ 1 โดยเทคนิค Hierarchical Cluster แบงเปน 2 เทคนิคยอยคือ
(Chatdanai, 2017
Agglomerative Hierarchical Cluster Analysis
Divisive Hierarchical Cluster Analysis
BIG DATA ANALYTICS สถาบันสหวิทยาการดิจิทัลและหุนยนต มหาวิทยาลัยเทคโนโลยีราชมงคลพระนคร