Page 36 - 데이터과학 무엇을 하는가? 전자책
P. 36
고 있는 것이 중요하다.
커뮤니케이션 기술의 중요성은 2014년에 미국 라바스 애널리 스
(Lavastorm Analytic) 사에서 데이터 과학자들을 대상으로 실시한 설문 조
사에서도 확인된다. “분석 과정에서 가장 큰 도전이 무엇인가”라는 질문
에 가장 많이 나온 응답은 “데이터에서 얻은 인사이트에 대한 신 를 얻
는 것”이었다. 이를 통해 알 수 있듯이 데이터 과학자에게 가장 큰 도전
은 분석이 아니라 분석에서 찾아낸 인사이트를 설득을 통해 현업에 적용
하고 기업이나 기관에 도움이 될 만한 성과를 내는 것이다.
데이터 과학자로서 분석 과정에서 가장 도전은 인가
분석 요구 사항 수집 3.2%
자료 습
9.7%
인사이트에 대한
신 를 는
25.8%
데이터 통합 및 가공
11.3%
데이터에서 인사이트 발
12.9% 인사이트를
현업에 적용하는
22.6%
데이터 14.5%
자료: Lavastorm Analytic, 2014년 6월
다음 그림은 데이터 분석가와 데이터 과학자의 분석 범위 차이를 정리
한 것이다. 그림에서 보듯이 데이터 분석가는 데이터 정제 및 원인 분석
과 결과 분석 작업(현황 분석)을 주로 하고, 일부 경험 있는 분석가는 드물
게 추정 작업(예측 분석)도 한다. 반면 데이터 과학자는 현황 분석보다는
34