Page 155 - 데이터과학 무엇을 하는가? 전자책
P. 155
정의하는 것이다. 어느 정도 신용카드를 사용하다 이탈하는 고객, 신규
고객 서비스만 몇 번 사용하고 이탈하는 고객, 다른 자사 카드로 이전하
는 고객, 고위험 고객 등 다양한 이탈 고객에 대한 비즈니스 규칙을 정의
하는 것을 우선시해야 한다.
이 개발 서
•이 문제 및 이 정의
•데이터 리 및 필요 데이터 선정
요 정의
•데이터 기준 이 문제 정의
•데이터 수집, 정리, 도식화
•데이터 정제, 시간 기준에 민감한 데이터 정의
•기 통계 분석
데이터 전 리 •종속 변수(목표 변수) 선정
•민감도 분석, 보 독립 변수 선정
• 플
• 판별 분석 형 개발 : the regression-based method the tree-
개발 및 based method the artificial neural network method an
ensemble of classi ers
• 비교, 검증(K-S 스트, ROC 차트 사용)
모든 분석 모델 개발이 다 그렇지만, 시간과 노력이 가장 많이 드는 작
업이 데이터 전처리 과정이다. 데이터 전처리 작업이란 데이터를 선택하
고 정제하고 준비하고 가공하고 정리하는 과정을 통 어 말한다. 전처리
과정이 나면 변수 후보 선정에 들어간다.
153