Page 193 - 데이터과학 무엇을 하는가? 전자책
P. 193
이번엔 SVD 알고리즘의 변수 개수에 따라 RMSE가 작아지는 것을 보
여주는 또 다른 차트이다.
SVD의 변수 개수에 RMSE 변화 추이 예시
0.910
SVD
0.905 SVD
50
100 SVD 1
0.900 200 SVD 2
SVD 3
0.895 50
RMSE 0.890 100 200
50
100 200 500
0.885 100
200 500 50 100
0.880 200 500 1000 1500
0.875
10 100 1000 10000 100000
매개 변수
위의 두 차트를 통해 알 수 있듯이 단순히 모델의 오차를 나타내는
RMSE만 평가하는 것은 현업에 적용할 모델을 평가하는 데는 적당하지
않다. 지나치게 정교화, 특수화되어서 일반적 적용이 들어지는 과적합
(Overfitting) 문제도 존재하기 때문이다.
2009년에 우승한 코의 실용적 은 다른 과의 협업을 통해
데이터 현황과 사용자 및 영화에 대한 속성을 더 게 이해함으로 모
델의 예측력을 높일 수 있었다. 결국 경험과 비즈니스 영역에 대한 지식
이 중요하다는 것을 입증한 이다.
다음 표는 2007~2009년의 3년간 넷플 스 경연대회에서 1위에 오른
191