Page 23 - วิทยาการคำนวณม.55
P. 23
ู
ี
บทท 2 การเกบรวบรวมข้อมล 19
็
2.2.1 การทาความสะอาดข้อมล (data cleansing)
ํ
ู
ู
ี
ั
ข้อมลทรวบรวมมาน น อาจมี
ี
ข้อผิดพลาด ซึงไม่เหมาะสมทจะนาไปประมวลผล เช่น มีคาว่าง มีคาทอย่ ู
่
่
ี
ํ
ี
ั
ั
ิ
้
นอกขอบเขตคาทเปนไปได หนวยนบไม่ตรงกน คาผิดปกต (outlier) ตลอดจน มี
่
่
่
ํ
ู
่
ี
รูปแบบทตางกนการทาความสะอาดข้อมล
ั
1
่
ข้อผิดพลาดเหลานเกดจากหลายสาเหตุ เช่น ผู้ให้ข้อมลกรอกข้อมลไม่ครบถวน ผู้
้
ี
ู
ิ
ู
ี
ํ
ึ
ู
ึ
ู
ู
บันทกข้อมลพิมพ์ข้อมลผิดพลาด หรือการขาดข้อกาหนดในการบันทกข้อมลทตรง
ั
กน
1 คาว่าง
่
2 คาอย่นอกขอบเขต
ู
่
ํ
การทาความสะอาด
3 หนวยนบผิด
ั
่
ข้อมล
ู
4 คาผิดปกต ิ
่
5 พิมพ์ผิด
รายวิชาพืนฐานวิชาวิทยาศาสตร์และเทคโนโลยี (วิทยาการคานวณ)
ํ