Page 194 - 데이터과학 무엇을 하는가? 전자책
P. 194

들이 사용한 주요 알고리즘과 예측력을 추정하는 RMSE를 연도별로
                   정리한 것이다.



                    플 스 분석  연대회 우  이 사용한 주요  고리

                                                                 RMSE
                     연도            주 사용  고리
                                                            시 매  기    0.9514
                          K-NN(Nearest Neighbors) ,
                    2007  SVD(Singular value decomposition),  0.8712(8.43  up),
                                                         107개   의  합
                          RBM(Restricted Boltzmann Machine)
                                                         0.8616(9.44  up),
                          K-NN, RBM,
                    2008                                 2007년   과  합한 100개
                          Non-negativematrix factorization (NNMF)
                                                         이상   의  합
                          NNMF, RBM                      0.8567(10.06  up),
                    2009
                          Gradient boosted decision trees   (GBDT)  2008년   과  합 병행




                            기     대하


                            넷플 스 분석 경연대회에서 주로 사용된 알고리즘은 최근에
                   발전한 기계학습 알고리즘들이었다. 통계와 기계학습의 차이는 무엇일

                   까  통계는 정해진 분포나 가정(  )을 가지고 엄격하게 규칙이 적용되

                   는 설문 조사나 실험 계획에 많이 사용되는 반면, 기계학습은 대용량 데

                   이터의 분석이나   을 찾는 데 많이 사용된다. 하지만 현업에서   때
                   는 기계학습이든 통계든 직면한 문제를 해결하는 데 잘 맞고 적합한 방

                   법을 찾는 게 가장 중요하다.

                     기계학습은 주로 분류, 예측, 차원(변수) 축소, 그룹화 그리고 데이터를

                   비교할 때 사용할 수 있다.


               192
   189   190   191   192   193   194   195   196   197   198   199