Page 27 - 데이터과학 무엇을 하는가? 전자책
P. 27
데이터 빅데이터
빅데이터로 인해 데이터 과학이 사람들과 기업들로부터 전에
없던 관심을 받고 많은 영역으로 활용 범위를 넓 가고 있다. 하지만 데
이터 과학이나 데이터 마이 이 기존의 데이터 분석과 비교해서 크게 변
화되었는가는 생각해 문제다. 케이디 컴(KDneggets.com)
의 설문에 따르면 단지 21%의 응답자만이 빅데이터가 데이터 과학을 크
게 변화시 다고 대답했고, 절반 이상은 부분적으로만 영향을 미 다고
답했다.
실제로 대부분의 데이터 과학자들은 빅데이터라 하더라도 기존에 해
오던 일과 속성 자체는 크게 다르지 않다고 느 다. 이는 목수가 아무리
규모가 큰 작업을 한다 해도 기본적으로는 나무를 자르고 고 다 고
모양을 내는 일들을 하는 것과 비슷하다. 그러나 작은 소품을 만드는 일
과 대목장이 큰 건물을 는 작업이 같다고 생각하는 사람은 아무도 없
을 것이다. 아주 단순하게는 연장의 문제도 있지만 목수의 기술과 경험
또는 그 일의 목적에 따라 완성도나 결과가 달라지기 때문이다.
어느 한 데이터 과학자는 이런 말을 했다. “빅데이터는 데이터 과학이
필요하나, 데이터 과학은 빅데이터가 있어야 하는 것은 아니다” (Big Data
needs Data Science but Data Science does not). 많은 빅데이터 프로젝트에서
데이터 과학을 활용하고 있지만, 모든 데이터 과학자가 빅데이터만을 다
루지는 않는다. 실제로 대용량 데이터는 분석 과정에서 비효율적인 경우
가 많아 다루기 용이한 크기로 나누어 분석하는 경우가 더 많다. 원천 그
25