Page 23 - วิทยาการคำนวณม.55
P. 23

ู
                 ี
          บทท 2 การเกบรวบรวมข้อมล                                                                         19
                             ็


     2.2.1 การทาความสะอาดข้อมล (data cleansing)
                      ํ
                                                 ู
            ู
                ี
                                  ั
     ข้อมลทรวบรวมมาน น อาจมี
                                                                                                    ี
     ข้อผิดพลาด ซึงไม่เหมาะสมทจะนาไปประมวลผล เช่น มีคาว่าง มีคาทอย่                                     ู

                                                                                    ่
                                                                                                ่
                                              ี
                                                   ํ
                              ี
                                                                   ั

                                                      ั
                                                                                      ิ
                                          ้
     นอกขอบเขตคาทเปนไปได หนวยนบไม่ตรงกน คาผิดปกต (outlier) ตลอดจน มี
                                               ่
                                                                         ่
                          ่
                                    ํ
                                                             ู
                    ่
                  ี
     รูปแบบทตางกนการทาความสะอาดข้อมล
                          ั
                                                                                                                   1
                            ่
     ข้อผิดพลาดเหลานเกดจากหลายสาเหตุ เช่น ผู้ให้ข้อมลกรอกข้อมลไม่ครบถวน ผู้
                                                                                                              ้
                                ี
                                                                               ู
                                   ิ
                                                                                                ู
                                                                                                                 ี
                                                                            ํ
                                                                                                    ึ
                                                                                                             ู
            ึ
                                    ู
                    ู
     บันทกข้อมลพิมพ์ข้อมลผิดพลาด หรือการขาดข้อกาหนดในการบันทกข้อมลทตรง
       ั
     กน
                                                                         1            คาว่าง
                                                                                       ่
                                                                         2      คาอย่นอกขอบเขต
                                                                                     ู
                                                                                  ่
                         ํ
                 การทาความสะอาด
                                                                        3          หนวยนบผิด
                                                                                          ั
                                                                                      ่
                          ข้อมล
                                 ู
                                                                        4           คาผิดปกต ิ
                                                                                     ่
                                                                        5            พิมพ์ผิด























                               รายวิชาพืนฐานวิชาวิทยาศาสตร์และเทคโนโลยี (วิทยาการคานวณ)

                                                                                    ํ
   18   19   20   21   22   23   24   25   26   27   28