Page 126 - 데이터과학 무엇을 하는가? 전자책
P. 126

의 프라이머리 키(Primary key)를 사용하고 있었다.
                     고객의 필요에 부합하는 상품과 서비스를 적당한 시기에 제시하고, 고

                   객과의 관계를 장기간 유지하는 데는 반드시 좋은 품질의 데이터가 필요

                   하다(좋은 품질로 보강된 데이터는 최신 상태로 업데이트되어 정확한 정보를 제공한

                   다). GM 마케팅 은 데이터 품질의 중요성에 대해 잘 알고 있었고 데이
                   터 품질 관리는 내부 데이터 품질만 개선한다고 해결되지 않는다는 사실

                   도 알고 있었기에 고품질의 다양한 데이터가 있는 액시엄과 함께 데이터

                   품질 관리를 진행한 것이다.

                     데이터 품질 관리는 고품질의 외부 참고 데이터(reference data)가 반드
                   시 필요하다. 액시엄은 고품질 참고 데이터를 보유하고 있기 때문에

                   세계 최고의 자동차 회사 10곳 가운데 9곳을 고객으로 둘 수 있게 된 것

                   이다.





                             시 의    데이터 정제  정 살펴보기


                            원천 데이터는 고객의 이름이나 주소
                                                                ROBERT SMITH:
                   등이   되거나 잘못 기록된 상태로 통합 데이                    ROBERTA SMIFF,
                                                                ROGER SMITS,
                   터베이스로  어온다. 예를 들면 오른  예시처
                                                                BERT SMITH,
                   럼 로버트 스미스(Robert Smith)라는 이름이 여러             RABURN SMUFF,
                                                                RODNEY SNIFF,
                   형태로 잘못 표기되어 부정확한 정보가 들어올                     HOBART SNUF,
                                                                NORBERT SNITS,
                   수 있다.                                        TREBOR THIMS

                     잘못 기재된 이름이나 주소 정보는 구분해서                  Robert Smith의 표기 오류 예


               124
   121   122   123   124   125   126   127   128   129   130   131