Page 193 - 데이터과학 무엇을 하는가? 전자책
P. 193

이번엔 SVD 알고리즘의 변수 개수에 따라 RMSE가 작아지는 것을 보
                     여주는 또 다른 차트이다.



                     SVD의 변수 개수에    RMSE 변화 추이 예시

                        0.910
                                                               SVD
                        0.905                                  SVD
                               50
                                 100                           SVD   1
                        0.900        200                       SVD   2
                                                               SVD   3
                        0.895    50
                      RMSE  0.890  100  200
                                    50
                                       100  200  500
                        0.885          100
                                          200  500  50  100
                        0.880                         200 500 1000 1500
                        0.875
                           10        100       1000     10000    100000
                                             매개 변수



                       위의 두 차트를 통해 알 수 있듯이 단순히 모델의 오차를 나타내는
                     RMSE만 평가하는 것은 현업에 적용할 모델을 평가하는 데는 적당하지

                     않다. 지나치게 정교화, 특수화되어서 일반적 적용이  들어지는 과적합

                     (Overfitting) 문제도 존재하기 때문이다.

                       2009년에 우승한  코의 실용적     은 다른  과의 협업을 통해
                     데이터 현황과 사용자 및 영화에 대한 속성을 더  게 이해함으로  모

                     델의 예측력을 높일 수 있었다. 결국 경험과 비즈니스 영역에 대한 지식

                     이 중요하다는 것을 입증한  이다.

                       다음 표는 2007~2009년의 3년간 넷플 스 경연대회에서 1위에 오른


                                                                                 191
   188   189   190   191   192   193   194   195   196   197   198