Page 157 - 데이터과학 무엇을 하는가? 전자책
P. 157
보통의 이탈 모델은 대부분 로지스 회 모델을 많이 사용한다. 기
계학습 알고리즘은 원인관계를 설명하기가 쉽지 않으나 로지스 회
모델은 사용자가 임의로 모델 조정이 가능하고 원인을 설명하기 워 현
업 적용이 용이하다. 알고리즘 선정 요소는 비즈니스 여건이나 데이터
요건, 기술적인 요건 등에 제한을 받을 수 있기 때문에 상황에 맞게 선정
하는 것이 중요하다.
모델 개발 중에는 되도록 다른 모델도 함께 사용하여 모델의 성능을
비교해 보아야 한다. 모델의 성능 평가를 위해서는 수신자 조작 특성
(ROC: ReceiverOperatingCharacteristic) 차트를 많이 사용한다. 다음 차트는
고객 중 우량 누적 비율을 축에, 불량 누적 비율을 축에 나타낸 차트
인데 위로 록할수록, 즉 면적이 클수록 좋은 모델이다. 예시된 차트에
1.0000
0.9000
0.8000
0.7000 Sensitivity of Tree
Sensitivity of Logistic
0.6000 Sensitivity of Neural Network
0.5000
0.4000
0.3000
0.2000
0.1000
0.0000
0.00.1 0.2 0.3 0.4 0.5 0.60.7 0.8 0.9 1.0
1 Specificity
성능 비교 예시
155