Page 126 - 데이터과학 무엇을 하는가? 전자책
P. 126
의 프라이머리 키(Primary key)를 사용하고 있었다.
고객의 필요에 부합하는 상품과 서비스를 적당한 시기에 제시하고, 고
객과의 관계를 장기간 유지하는 데는 반드시 좋은 품질의 데이터가 필요
하다(좋은 품질로 보강된 데이터는 최신 상태로 업데이트되어 정확한 정보를 제공한
다). GM 마케팅 은 데이터 품질의 중요성에 대해 잘 알고 있었고 데이
터 품질 관리는 내부 데이터 품질만 개선한다고 해결되지 않는다는 사실
도 알고 있었기에 고품질의 다양한 데이터가 있는 액시엄과 함께 데이터
품질 관리를 진행한 것이다.
데이터 품질 관리는 고품질의 외부 참고 데이터(reference data)가 반드
시 필요하다. 액시엄은 고품질 참고 데이터를 보유하고 있기 때문에
세계 최고의 자동차 회사 10곳 가운데 9곳을 고객으로 둘 수 있게 된 것
이다.
시 의 데이터 정제 정 살펴보기
원천 데이터는 고객의 이름이나 주소
ROBERT SMITH:
등이 되거나 잘못 기록된 상태로 통합 데이 ROBERTA SMIFF,
ROGER SMITS,
터베이스로 어온다. 예를 들면 오른 예시처
BERT SMITH,
럼 로버트 스미스(Robert Smith)라는 이름이 여러 RABURN SMUFF,
RODNEY SNIFF,
형태로 잘못 표기되어 부정확한 정보가 들어올 HOBART SNUF,
NORBERT SNITS,
수 있다. TREBOR THIMS
잘못 기재된 이름이나 주소 정보는 구분해서 Robert Smith의 표기 오류 예
124