Page 197 - 데이터과학 무엇을 하는가? 전자책
P. 197
고 간결성이다. 현업에 적용할 때는 늘 정확도와 나머지 요소들(속도, 설
명력, 간결성) 사이에서 타협을 해야 한다. 모든 것이 좋으면 좋겠지만 대
부분 그렇지가 못하다. 예를 들어 마케팅 캠페인의 경우 분석 모델은 고
객들을 상대적으로 평가하기 위해서 활용할 때가 많아 정확도보다는 운
영 측면에서의 관리와 설득력이 더 필요하다. 그래서 속도, 설명력, 간결
성이 더 고려되어야 한다. 대부분의 기계학습은 예측력은 높지만 속도,
설명력, 간결성이 다소 낮다. 또한 이상치에 대한 민감성, 실측치( ,
Missing Value), 터 데이터(Non-Vector Data), 클래스 임 런스(Class
Imbalance)와 고차원(High Dimension)의 효율성 문제들도 고려해야 한다.
이 문제들은 넷플 스 분석 경연
분석 형의 가 와 성의 관계
대회에서도 이미 제기됐었다. 가
분석 방법과 알고리즘의 복
성은 그 가치에 정비례하지 않는
다. 그러 로 최적의 조합을 찾아
도
내는 것이 중요하다.
10 , 현 용 한 이유는?
2012년 넷플 스는 분석 경연대회에서 100만 달러의 상금을
받은 우승 의 알고리즘을 현업에 적용하지 못했다는 안타까운 소식을
발표했다. 최종 우승 의 알고리즘은 현업에 적용하기에는 무 복
했던 것이다.
195