Page 158 - 데이터과학 무엇을 하는가? 전자책
P. 158
서는 의사 결정 나무 모델(Decision Tree)의 성능이 로지스 모델보다 좋
다고 나타난다.
산출된 개인별 점수(score)는 등급화하여 실제 테스트 데이터를 이용
한 검증 작업을 거쳐 현업에 적용된다.
독립 변수 가중치 예시
현업에 적용된 모델은 지속적으로 관찰하여 전체 데이터에 큰 변화가
생기거나 비즈니스 규칙에 변화가 생기면 그에 맞게 수정하는 작업을 한
다. 마지막으로, 모니터링 리포트를 주기적으로 생성하게 해두면 모든
개발 작업이 완료된다.
비즈니스 상황이나 사용 변수 등이 다를 뿐 대부분의 분석 모델 개발은
이러한 절차를 거쳐 진행된다. 크 오브 아메리카의 모든 작업은 데이터
전체가 아니라 샘플링 작업으로 진행됐고, 각각의 진행 과정에 2~3명이
함께 작업하며 데이터와 프로세스, 개발 프로그 을 상호 확인했다.
156