Page 143 - 데이터과학 무엇을 하는가? 전자책
P. 143

을 타기팅할 수 있도록 신용과 상관없이 사용할 수 있게 만들었다. 이 지
                     수는 우편번호 코드 기준으로 구분할 수 있으며, 부동산 대출이나 유통

                     판매와 같은 다른 정보들을 합산하여 신용 평가 점수 300점 이상으로만

                     산출한 점수이다.

                       초기에 샘플 데이터로 만들었을 때는 통계 모델이 잘 맞는 듯했으나,
                     원천 데이터인 인포베이스에 결측 (missing value, 데이터가 없는 정보)이

                     무 많아서 현업에 적용하려니 어려움이 많았다. 시간이  러 정보가

                     이면  더 좋아지겠지만 필자가 작업할 당시에 어떤 지역은 판매하기 곤

                     란할 정도로 형편없는 지수가 나왔다. 우리  은 시범  러를 선정하고
                     DM(Direct Mail) 캠페인을 한 달에 한 번  3개월 동안 진행하면서 반응

                     테스트 작업도 했다. 테스트 초기에는 고객이 우리가 보낸 DM을 받아

                     보고 자동차  러를 찾아왔다는 표시를 해두도록 하는 걸 빠 려 마케팅

                     캠페인 효과를 추적하지 못하는 실수도 범했고, 생각보다 반응이 좋지
                     않아 마음고생도 많았던 통계 모델이었다. 반응이 상대적으로 높지 않은

                     이유는 모델 문제일 수도 있지만 여러 가지 다른 문제일 수도 있다. 예를

                     들면 캠페인 수행 과정이나 캠페인 대상 고객을 관리하는  러에게 문제

                     가 있을 수도 있는 것이다. 문제의 원인을 정확히 파 하기 위해서는 여
                     러 가지 가능성을 열어 고 지속적으로 조사해야 한다.

                       이 프로젝트는 필자가 액시엄에서 진행한 마지막 프로젝트였다. 2008

                     년 9월 액시엄이 엑스 넷( SellNet)이라는 회사와 협력하여 자동차 관련

                     실시간 고객 데이터와 분석 데이터를  12라는 상품명으로 자동차  러
                     들에게 판매한다는 소식을 접하게 되었다. 이 자동차 통계 모델 분석 데



                                                                                 141
   138   139   140   141   142   143   144   145   146   147   148