Page 192 - 데이터과학 무엇을 하는가? 전자책
P. 192

측 알고리즘 모델을 GBDT(gradient boosted decision tree) 알고리즘으로
                    합한 모델이었다. 이 알고리즘은 예측력을 높이는 데 결정적인 역할

                   을 했다.  합 모델에는 회  분석(Linear Regression), 신경망 분석(Neural

                   Network), GBDT 알고리즘 등을 사용할 수 있다.

                     하지만 현업 운영을 고려하면  무 많은 알고리즘을  합하는 것은 적
                   합하지 않다. 몇 개의 알고리즘만 사용한 단순한 모델도 많은 알고리즘

                   을 사용한 모델의 90% 정도는 예측할 수 있다.

                     다음은 투입한 변수가 많을수록 RMSE(Residual Mean Square Error: 평균

                   제 근 편차. 정밀도(precision)를 표현하는 데 적합한 측도로 추정 이나 모델이 예측
                   한  과 실제 환경에서 관찰되는  의 차이를 다  때 흔히 사용한다)가 작아지는 것

                   을 보여주는 차트이다.



                    고리 의 변수 개수에    RMSE 변화 추이
                      Cinematch
                          0.94
                       Progress
                          0.93

                          0.92
                          0.91
                       RMSE  0.90


                          0.89
                          0.87
                          0.88
                          0.86
                     Grand Prize
                          0.85
                             0     25    50    75    100   125   150



               190
   187   188   189   190   191   192   193   194   195   196   197