Page 190 - 데이터과학 무엇을 하는가? 전자책
P. 190
균과 도를 활용하여 모델에 투입 가능한 후보 변수들을 새로 만들어
사용했다. 다음은 이 이 가공해서 만들어낸 변수들이다.
입 보 변수 예시
1. 영화 효과(movie effect)
2. 사용자 효과(user effect)
3. 사용자의 평가 시간
4. 사용자의 영화 평가 시간
5. 영화의 영화 평가 시간
6. 영화의 사용자 시간
7. 사용자의 영화 평 평
8. 사용자의 영화 평 합계 수
9. 영화의 사용자 효과(사용자 평 평 )
10. 영화의 사용자 평 합계 수
같은 해, 이 은 위의 변수들과 K-NN 알고리즘을 사용해서 테스트를
했는데, 아이템이나 사용자의 그룹 수(K ), 표준화 방법에 따라 다양한
예측 결과가 나왔다. 이후 K-NN, RBM(Restricted Bolt mann Machine, 일종
의 신경망 분석), SVD(Singular Value decomposition)를 분석 알고리즘으로 사
용하고 합 모델에는 선형 회 방법을 사용해서 마지막 결과를 제출했
다. K-NN 알고리즘은 서로 근접해 있는 그룹들에 대해서는 예측력이 높
으나 멀리 어져 있는 그룹에 대한 예측력은 어지기 때문에 이를 보
완하기 위해 SVD를 사용했다.
188