Page 128 - 데이터과학 무엇을 하는가? 전자책
P. 128
부정확한 이름과 주소가 어 게 정제되는지 더 자세히 살펴보자. 데
이터 정제를 위해 제일 먼저 원천 데이터의 품질을 조사하고 관리 계획
을 세운다. 그런 다음 데이터를 표준화하여 중복된 내용을 제거하고 내
용상의 오류를 수정한 후 개인정보보호법에 저촉되는 부분이 있는지 확
인해 고객 식별 작업을 하면 데이터 정제 작업이 마무리된다.
액시엄의 데이터 정제 작업은 액시엄이 수십 년 동안 모은 방대한 참
고 데이터와 정제 도구를 사용해 이루어진다. 축적된 참고 데이터 없이
데이터의 내용을 수정하여 데이터의 품질을 높이는 것은 한계가 있다.
액시엄의 데이터 정제 도구와 참고 데이터는 입력 오류뿐만 아니라 정확
한 정보를 확인하여 수정도 한다. 더불어 미국 우체국 서비스의 주소 표
기 표준에 맞 가공하기 때문에 고객이 우편을 보 때 비용을 절약할
수 있다.
시 의 데이터 정제 서비스
데이터 정제 표 화,
품질 가와 데이터 변환, 수정, 중 제거, 법 저 부 인
및 보
적화를 위한 기획 품질 결과 보고서
데이터 내용 보
, 분화, 이 , 사회 데이터 고 별
매 및 사용
제, 인구
126