Page 197 - 데이터과학 무엇을 하는가? 전자책
P. 197

고 간결성이다. 현업에 적용할 때는 늘 정확도와 나머지 요소들(속도, 설
                     명력, 간결성) 사이에서 타협을 해야 한다. 모든 것이 좋으면 좋겠지만 대

                     부분 그렇지가 못하다. 예를 들어 마케팅 캠페인의 경우 분석 모델은 고

                     객들을 상대적으로 평가하기 위해서 활용할 때가 많아 정확도보다는 운

                     영 측면에서의 관리와 설득력이 더 필요하다. 그래서 속도, 설명력, 간결
                     성이 더 고려되어야 한다. 대부분의 기계학습은 예측력은 높지만 속도,

                     설명력, 간결성이 다소 낮다. 또한 이상치에 대한 민감성, 실측치(   ,

                     Missing Value),      터 데이터(Non-Vector Data), 클래스 임 런스(Class

                     Imbalance)와 고차원(High Dimension)의 효율성 문제들도 고려해야 한다.
                     이 문제들은 넷플 스 분석 경연
                                                         분석 형의 가 와   성의 관계
                     대회에서도 이미 제기됐었다.                 가

                       분석 방법과 알고리즘의 복

                     성은 그 가치에 정비례하지 않는
                     다. 그러 로 최적의 조합을 찾아
                                                                               도
                     내는 것이 중요하다.





                             10        , 현   용    한 이유는?


                             2012년 넷플 스는 분석 경연대회에서 100만 달러의 상금을

                     받은 우승 의 알고리즘을 현업에 적용하지 못했다는 안타까운 소식을

                     발표했다. 최종 우승 의 알고리즘은 현업에 적용하기에는  무 복

                     했던 것이다.


                                                                                 195
   192   193   194   195   196   197   198   199   200   201   202