Page 16 - Ebookการวิเคราะห์ข้อมูล New
P. 16
หนIวยการเรียนรูJที่ 3 การวิเคราะหKขJอมูล | 3.2 การวิเคราะหKเชิงทำนาย 7
อุณหภูมิ ความชื้นสัมพัทธI เกิดไฟปMา ระยะทาง ค7า K
(X) (Y) (Class) (Distance)
22.8 40 No 8.16 5
28.6 27 Yes 8.93
29.6 27 Yes 9.78 7
30.2 24 No 12.04
20.3 45 No 13.03 9
18.2 46 Yes 14.32
19.6 48 No 16.08 11
17.8 51 No 19.30
17.8 56 Yes 24.24 13
5) จำแนกข0อมูลใหม< ตามกลุ<มที่มีจำนวนสมาชิกมากที่สุดในชุดข0อมูล K ลำดับ
ุ
เมื่อค<า K เป5น 1 ข0อมูลใหม<จะถูกจำแนกในกลุ<ม "No" เนื่องจากรายการข0อมูลที่มีระยะทางน0อยที่สด
<
นั้นอยู<ในกลุ<ม "No" และหากค<า K มากกว<า 1 ข0อมูลใหม<จะถูกจำแนกให0อยู<ในกลุ<มที่มีสมาชิกมากทสุด เชน
ี่
กำหนดค<า K เป5น 3 และ 5 ผลการจำแนกเป5นดังตาราง
จำนวนสมาชิกกลุ7ม จำนวนสมาชิกกลุ7ม
ค7า K ผลการจำแนก
เกิดไฟไหม- (Yes) ไม7เกิดไฟไหม- (No)
K = 3 1 2 No
K = 5 2 3 No
การประเมินความถูกตFองในการจำแนกขFอมูล
การประเมินความถูกต0องในการจำแนกกลุ<มข0อมูลเพื่อทำนายผลในอนาคตเป5นสิ่งสำคัญมาก เพราะ
หากผลการทำนายผิดพลาดอาจเกิดความเสียหายเมื่อนำไปใช0จรง เช<น จากตัวอย<างข0างต0นทำนายวา จะไม<เกด
<
ิ
ิ
ไฟไหม0ในวันที่อุณหภูมิเท<ากับ 21.2º C และความชื้นสัมพัทธ+เท<ากับ 32% แต<หากวันดังกล<าวเกิดไฟไหม0 (ผล
การทำนายผิดพลาด) อาจจะทำให0ฝูงสิงโตย0ายไปที่อื่นไม<ทัน
ซึ่งการประเมินความถูกต0องควรนำไปทดสอบ
ุ
กับชุดข0อมูลที่ทราบคำตอบอยู<แล0ว ซึ่งมักเป5นข0อมูลชด
เดียวกันกับข0อมูลตั้งต0น แต<ถูกแยกไว0เฉพาะเพื่อการ
ประเมิน ยกตัวอย<างเช<น จากชุดข0อมูลไฟปnา อาจม ี
ข0อมูลตั้งต0นจำนวน 20 ตัวอย<าง จากข0อมูลกลุ<มน ี้
0
นักเรียนอาจกันข0อมูลไว 7 ตัวอย<าง เพื่อการประเมน
ิ
ส<วนอีก 13 ตัวอย<างที่เหลือสามารถนำไปใช0เปน
5
เครื่องมือในการทำนาย ดังรูป
เอกสารประกอบการเรียนรหัสวิชา ว 32103 รายวิชาวิทยาการคำนวณ 2 ชั้นมัธยมศึกษาปAที่ 5 | ครูธนเดช ลี้เลิศธนกุล