Page 191 - 데이터과학 무엇을 하는가? 전자책
P. 191

다음 그림은 K-NN SVD  합 모델 순으로 예측력이 높다는 것을

                     보여준다. 2008년에는 2007년 모델에서 SVD를  고 대신 NNMF(Non-
                     negative matrix factori ation) 알고리즘을 추가해서 차원 축소를 하여  합

                     모델을 만들었다.



                     개별  고리 과  합  고리 의 성능 비  예시

                         0.50      합
                         0.45     SVD
                                  K NN 변형 2 WgtNabr
                         0.40
                                  K NN 변형 1 CorNgbr
                         0.35     영화      사용 Movie Avg
                         0.30
                        적 분포  0.25

                         0.20
                         0.15
                         0.10
                         0.05
                          0
                          0.00%  0.20%  0.40%  0.60%  0.80%  1.00%  1.20%  1.40%  1.60%  1.80%  2.20%
                                                     위



                       그리고 2009년에는 고객이 하루에 평점을 매기는  도와, 시간이
                     르면서 변하는 사용자의 선호도와 영화의 인기도를 모델에 적용했다. 일

                     일 평점  도는 고객이 하루에 평가하는  도가 그날의 평점에 영향을

                     끼치는 것을 반영하기 위한 것이었다. 예측 모델의 가설을 세울  , 먼

                     저 사용자로 인한 효과와 영화로 인한 효과를 분리하고 둘 사이의 관계
                     를 적용하는 것이 중요하다. 마지막으로 제출한 모델은 700개가  는 예



                                                                                 189
   186   187   188   189   190   191   192   193   194   195   196