Page 310 - 데이터과학 무엇을 하는가? 전자책
P. 310
상세 설명과 데이터의 품질 상태를 알 수 있도록 그에 대한 정보도 함께
제공되어야 한다.
정부가 공공 데이터를 개방해서 높은 부가가치를 창출하겠다고 전략
을 세웠지만, 정작 데이터 정제 과정에서 기업 데이터와 통합되지 않으
면 데이터의 의미를 해석하기 어렵고 현업에서의 활용 가능성도 매우 낮
아질 수밖에 없다.
외국의 가공 식별 번호 및 가공 데이터 판매 사례 살펴보기
기업이 보유하고 있는 예비 고객 정보나 상품 판매 시 수집한
고객 정보를 포함해 오래된 고객 데이터는 최근 데이터로 업데이트해야
실제로 활용이 가능하다. 그리고 이 데이터들을 개방된 공공 데이터와 연
결해서 사용하기 위해서는 통합 과정에 식별 가능한 정보가 있어야 한다.
외국에서는 내 · 외부 고객 데이터를 통합하여 정제하는 고객 매칭 시
스템이 잘 개발되어 있어 중복된 내용이나 잘못된 주소를 빠르고 정확하
게 정제한다. 잘못 매칭된 부정확한 데이터는 직접·간접적으로 기업에
더 큰 손실이 될 수 있기 때문에 데이터 정제 및 가공만 전문으로 하는 회
사들을 주로 활용한다.
미국에는 데이터 가공 전문 회사로, 하트행크(Harte-Hanks), 이노베
이티브 시스템(Innovative Systems), 데이터멘토스(DataMentors), 액시엄
(Acxiom), 엑스페리언(Experian), 날리지베이스 마케팅(KnowledgeBase
Marketing, KBM), 엡실론(Epsilon), 에퀴팩스(Equifax), 그리고 인포그룹
308