Page 155 - 데이터과학 무엇을 하는가? 전자책
P. 155

정의하는 것이다. 어느 정도 신용카드를 사용하다 이탈하는 고객, 신규
                     고객 서비스만 몇 번 사용하고 이탈하는 고객, 다른 자사 카드로 이전하

                     는 고객, 고위험 고객 등 다양한 이탈 고객에 대한 비즈니스 규칙을 정의

                     하는 것을 우선시해야 한다.



                     이     개발  서


                                  •이  문제 및 이  정의
                                  •데이터 리  및 필요 데이터 선정
                        요  정의
                                  •데이터 기준 이  문제 정의
                                  •데이터 수집, 정리, 도식화




                                  •데이터 정제, 시간 기준에 민감한 데이터 정의
                                  •기  통계 분석
                      데이터 전 리     •종속 변수(목표 변수) 선정
                                  •민감도 분석,  보 독립 변수 선정
                                  • 플




                                  • 판별 분석  형 개발 :   the regression-based method   the tree-
                          개발 및     based method   the artificial neural network method   an
                                   ensemble of classi ers
                                  •   비교, 검증(K-S  스트, ROC 차트 사용)




                       모든 분석 모델 개발이 다 그렇지만, 시간과 노력이 가장 많이 드는 작

                     업이 데이터 전처리 과정이다. 데이터 전처리 작업이란 데이터를 선택하

                     고 정제하고 준비하고 가공하고 정리하는 과정을 통 어 말한다. 전처리
                     과정이  나면    변수 후보 선정에 들어간다.



                                                                                 153
   150   151   152   153   154   155   156   157   158   159   160