Page 192 - 데이터과학 무엇을 하는가? 전자책
P. 192
측 알고리즘 모델을 GBDT(gradient boosted decision tree) 알고리즘으로
합한 모델이었다. 이 알고리즘은 예측력을 높이는 데 결정적인 역할
을 했다. 합 모델에는 회 분석(Linear Regression), 신경망 분석(Neural
Network), GBDT 알고리즘 등을 사용할 수 있다.
하지만 현업 운영을 고려하면 무 많은 알고리즘을 합하는 것은 적
합하지 않다. 몇 개의 알고리즘만 사용한 단순한 모델도 많은 알고리즘
을 사용한 모델의 90% 정도는 예측할 수 있다.
다음은 투입한 변수가 많을수록 RMSE(Residual Mean Square Error: 평균
제 근 편차. 정밀도(precision)를 표현하는 데 적합한 측도로 추정 이나 모델이 예측
한 과 실제 환경에서 관찰되는 의 차이를 다 때 흔히 사용한다)가 작아지는 것
을 보여주는 차트이다.
고리 의 변수 개수에 RMSE 변화 추이
Cinematch
0.94
Progress
0.93
0.92
0.91
RMSE 0.90
0.89
0.87
0.88
0.86
Grand Prize
0.85
0 25 50 75 100 125 150
190