Page 17 - 3.Big Data Analytics
P. 17

หลักสูตรการวิเคราะห์ข้อมูลขนาดใหญ่   16




                  3.4 ระเบียบวิธีการแบงกลุมแบบ Hierarchical Clustering


                           รูปแบบนี้เปนการจัดกลุมแบบมีขั้นตอน เปนเทคนิคที่นิยมใชในการจัดกลุมเทคนิคหนึ่งซึ่งมีขอจำกัดคือ จำนวน

                  กลุมตัวอยางที่ตองการจัดและจำนวนตัวแปรตองไมมากนัก (ไมควรเกิน 200 กลุม ขอดีของวิธีการนี้คือ เปนการเรียนรูแบบ
                  ไมมีผูสอน ดังนั้นจึงไมจำเปนตองทราบจำนวนกลุมที่มีในขอมูล และไมจำเปนตองทราบวาตัวแปรใด หรือกรณีใดอยูในกลุมใด

                  ทั้งนี้ชนิดของขอมูลหรือตัวแปรที่สามารถใชเทคนิค Hierarchical Cluster ไดมี 3 ประเภท คือ ขอมูลเปนสเกลอันตรภาค

                  (Interval scale หรือสเกลอัตราสวน ( Ratio scale ซึ่งเปนขอมูลเชิงปริมาณ  , ขอมูลที่อยูในรูปความถี่ (Count Data ,
                  ขอมูลอยูในรูปฐานสองนั่นคือ มีได 2 คา คือ 0 กับ 1 โดยเทคนิค Hierarchical Cluster  แบงเปน 2 เทคนิคยอยคือ

                  (Chatdanai, 2017

                              Agglomerative Hierarchical Cluster Analysis


                              Divisive Hierarchical Cluster Analysis











































                   BIG DATA ANALYTICS                             สถาบันสหวิทยาการดิจิทัลและหุนยนต มหาวิทยาลัยเทคโนโลยีราชมงคลพระนคร
   12   13   14   15   16   17   18   19   20   21   22