Page 47 - 데이터과학 무엇을 하는가? 전자책
P. 47
데이터 자의 다양한
데이터를 가공하려면 분석용 소프트웨어가 필요하고, 분석 모
델을 만들기 위해서는 알고리즘이나 기초 통계가 필요하다. 기초 통계
(Descriptive Statistics)는 데이터 과학의 나침반이다. 데이터의 색적 현황
파 을 가능하게 하고 분석 방향을 설정하는 데 기본이 되기 때문에 기
초 통계의 중요성은 아무리 강조해도 부족함이 없다.
분석 프트웨어
목수가 일을 잘하려면 뭐니 뭐니 해도 기술과 실력이 있어야 한다. 좋
은 도구를 구입하여 사용법을 잘 익히는 것은 그다음이다. 데이터 과학
자가 분석 소프트웨어를 잘 배우고 익히는 것도 마찬가지이다. 간혹 분
석 도구만 잘 사용해도 데이터 과학자라고 생각하는 사람들이 있는데,
그런 사람은 데이터 과학자가 아니라 프로그래머(Programmer)이다. 예를
들면 R 또는 SAS 프로그래머인 것이다. 이들은 분석 도구를 이용해 데
이터에서 원하는 결과를 아주기만 하면 된다. 데이터 과학자는 분석
도구를 잘 다루어야 하는 것은 필수이고 기업이나 조직의 데이터 활용
조건에 맞 분석 도구를 선별할 수 있는 경험적 지식도 가지고 있어야
한다.
데이터 과학자가 많이 사용하는 소프트웨어로, 예전부터 금융 분야나
의료 분야 또는 다국적기업에서 주로 사용했던 SAS가 있고, 최근엔 오픈
소스 위주의 래피드마이 (RapidMiner)와 R 언어도 많이 사용한다.
45