Page 190 - 데이터과학 무엇을 하는가? 전자책
P. 190

균과  도를 활용하여 모델에 투입 가능한 후보 변수들을 새로 만들어
                   사용했다. 다음은 이  이 가공해서 만들어낸 변수들이다.



                    입  보 변수 예시


                    1. 영화 효과(movie effect)
                    2. 사용자 효과(user effect)
                    3. 사용자의   평가 시간

                    4. 사용자의   영화 평가 시간
                    5. 영화의   영화 평가 시간

                    6. 영화의   사용자 시간
                    7. 사용자의 영화 평  평
                    8. 사용자의 영화 평  합계 수

                    9. 영화의 사용자 효과(사용자 평  평 )
                    10. 영화의 사용자 평  합계 수



                     같은 해, 이  은 위의 변수들과 K-NN 알고리즘을 사용해서 테스트를

                   했는데, 아이템이나 사용자의 그룹 수(K ), 표준화 방법에 따라 다양한

                   예측 결과가 나왔다. 이후 K-NN, RBM(Restricted Bolt mann Machine, 일종
                   의 신경망 분석), SVD(Singular Value decomposition)를 분석 알고리즘으로 사

                   용하고  합 모델에는 선형 회  방법을 사용해서 마지막 결과를 제출했

                   다. K-NN 알고리즘은 서로 근접해 있는 그룹들에 대해서는 예측력이 높

                   으나 멀리  어져 있는 그룹에 대한 예측력은  어지기 때문에 이를 보

                   완하기 위해 SVD를 사용했다.



               188
   185   186   187   188   189   190   191   192   193   194   195