Page 21 - 050 ณัฐพงศ์ เต็กเกร็ด
P. 21
ี่
บทท 2 15
บทที 2 การเกบรวบรวมและสํารวจขอมล
็
ู
็
ก
บ
บ
ว
ร
่
ร
ู
ข้อมลมีคุณคาวมและสํารวจข้อมล
ร
า
ก
เ
ู
2.2 การเตรียมข้อมล (DATA PREPARATION)
ู
ื
ี
ื
ู
ี
ื่
ู
ู
ั
ั้
เมอเลอกแหลงขอมลและรวบรวมขอมลไดแลวขนตอนถดไปคอการเตรยมขอมล เพอเตรยมพรอม
ื่
ู
ี
ู
ั
ึ่
สําหรบการประมวลผล ซงขอมลทจะใชในการประมวลผลนจะตองมความถกตอง ครบถวนสมบรณ
ี่
ู
ี้
ู
ู
ิ
ั
ี
ั้
ั
ี
ิ
ี่
ี
ู
ี
และไมมขอมลทมคาผดปกต ดงนน กอนจะนําขอมลไปใช จะตองมการจดเตรยมขอมล และทําความ
ู
สะอาดขอมล
2.2.1 การทาความสะอาดข้อมล (data cleansing)
ู
ํ
ี่
ี
ู
ึ่
ิ
ี่
ขอมลทรวบรวมมานน อาจมขอผดพลาด ซงไมเหมาะสมทจะนําไปประมวลผล เชน มคาวาง ม ี
ั้
ี
ั
ี่
ิ
ี่
ี
ั
คาทอยนอกขอบเขตคาทเปนไปได หนวยนบไมตรงกน คาผดปกต (outlier) ตลอดจนมรปแบบทตาง
ู
ู
ี่
ิ
ู
ู
ึ
กนขอผดพลาดเหลานเกดจากหลายสาเหต เชน ผใหขอมลกรอกขอมลไมครบถวน ผบนทกขอมล
ู
ู
ั
ู
ั
ิ
ุ
ิ
ี้
ั
ู
ู
ิ
ื
ี่
ิ
ึ
ั
พมพขอมลผดพลาด หรอการขาดขอกําหนดในการบนทกขอมลทตรงกน
2.2.2 การแปลงข้อมล (data transformation)
ู
ี่
เปาหมายของการแปลงขอมล คอเตรยมขอมลใหอยในรปแบบทพรอมสําหรบการประมวลผล
ั
ู
ู
ื
ู
ี
ู
ี่
โดยรปแบบของขอมลทพรอมประมวลผลในโปรแกรมตารางทํางานจะเปนตารางทแตละแถวคอขอมล
ื
ี่
ู
ู
ู
ู
ั
ึ่
ั
ั
ิ
ิ
ั้
ื่
หนงตวอยาง และแตละคอลมนคอขอมลแอตทรบวตของตวอยางนน เพอใหมความเขาใจตรงกน
ั
ี
ื
ี
ั
ู
ู
ึ
ิ
ควรเกบขอมลคําอธบายถงชอหรอความหมายของแตละแอตทรบวต นกเรยนสามารถแปลงขอมลได
ิ
ื
ิ
ื่
็
ึ้
หลายแบบขนกบความสนใจวาตองการหาคําตอบเกยวกบอะไร
ั
ี่
ั