Page 194 - 데이터과학 무엇을 하는가? 전자책
P. 194
들이 사용한 주요 알고리즘과 예측력을 추정하는 RMSE를 연도별로
정리한 것이다.
플 스 분석 연대회 우 이 사용한 주요 고리
RMSE
연도 주 사용 고리
시 매 기 0.9514
K-NN(Nearest Neighbors) ,
2007 SVD(Singular value decomposition), 0.8712(8.43 up),
107개 의 합
RBM(Restricted Boltzmann Machine)
0.8616(9.44 up),
K-NN, RBM,
2008 2007년 과 합한 100개
Non-negativematrix factorization (NNMF)
이상 의 합
NNMF, RBM 0.8567(10.06 up),
2009
Gradient boosted decision trees (GBDT) 2008년 과 합 병행
기 대하
넷플 스 분석 경연대회에서 주로 사용된 알고리즘은 최근에
발전한 기계학습 알고리즘들이었다. 통계와 기계학습의 차이는 무엇일
까 통계는 정해진 분포나 가정( )을 가지고 엄격하게 규칙이 적용되
는 설문 조사나 실험 계획에 많이 사용되는 반면, 기계학습은 대용량 데
이터의 분석이나 을 찾는 데 많이 사용된다. 하지만 현업에서 때
는 기계학습이든 통계든 직면한 문제를 해결하는 데 잘 맞고 적합한 방
법을 찾는 게 가장 중요하다.
기계학습은 주로 분류, 예측, 차원(변수) 축소, 그룹화 그리고 데이터를
비교할 때 사용할 수 있다.
192