Page 128 - 데이터과학 무엇을 하는가? 전자책
P. 128

부정확한 이름과 주소가 어 게 정제되는지  더 자세히 살펴보자. 데
                   이터 정제를 위해 제일 먼저 원천 데이터의 품질을 조사하고 관리 계획

                   을 세운다. 그런 다음 데이터를 표준화하여 중복된 내용을 제거하고 내

                   용상의 오류를 수정한 후 개인정보보호법에 저촉되는 부분이 있는지 확

                   인해 고객 식별 작업을 하면 데이터 정제 작업이 마무리된다.
                     액시엄의 데이터 정제 작업은 액시엄이 수십 년 동안 모은 방대한 참

                   고 데이터와 정제 도구를 사용해 이루어진다. 축적된 참고 데이터 없이

                   데이터의 내용을 수정하여 데이터의 품질을 높이는 것은 한계가 있다.

                   액시엄의 데이터 정제 도구와 참고 데이터는 입력 오류뿐만 아니라 정확
                   한 정보를 확인하여 수정도 한다. 더불어 미국 우체국 서비스의 주소 표

                   기 표준에 맞  가공하기 때문에 고객이 우편을 보  때 비용을 절약할

                   수 있다.



                    시 의 데이터 정제 서비스

                           데이터               정제  표 화,
                      품질  가와 데이터          변환, 수정, 중  제거,         법 저   부  인
                                                                    및 보
                       적화를 위한 기획            품질 결과 보고서



                                            데이터 내용 보
                          ,  분화,                이 , 사회           데이터 고   별
                         매 및 사용
                                              제, 인구











               126
   123   124   125   126   127   128   129   130   131   132   133