Page 47 - 데이터과학 무엇을 하는가? 전자책
P. 47

데이터   자의 다양한

                             데이터를 가공하려면 분석용 소프트웨어가 필요하고, 분석 모

                     델을 만들기 위해서는 알고리즘이나 기초 통계가 필요하다. 기초 통계

                     (Descriptive Statistics)는 데이터 과학의 나침반이다. 데이터의  색적 현황

                     파 을 가능하게 하고 분석 방향을 설정하는 데 기본이 되기 때문에 기

                     초 통계의 중요성은 아무리 강조해도 부족함이 없다.


                       분석  프트웨어

                       목수가 일을 잘하려면 뭐니 뭐니 해도 기술과 실력이 있어야 한다. 좋

                     은 도구를 구입하여 사용법을 잘 익히는 것은 그다음이다. 데이터 과학

                     자가 분석 소프트웨어를 잘 배우고 익히는 것도 마찬가지이다. 간혹 분
                     석 도구만 잘 사용해도 데이터 과학자라고 생각하는 사람들이 있는데,

                     그런 사람은 데이터 과학자가 아니라 프로그래머(Programmer)이다. 예를

                     들면 R 또는 SAS 프로그래머인 것이다. 이들은 분석 도구를 이용해 데

                     이터에서 원하는 결과를  아주기만 하면 된다. 데이터 과학자는 분석
                     도구를 잘 다루어야 하는 것은 필수이고 기업이나 조직의 데이터 활용

                     조건에 맞  분석 도구를 선별할 수 있는 경험적 지식도 가지고 있어야

                     한다.

                       데이터 과학자가 많이 사용하는 소프트웨어로, 예전부터 금융 분야나
                     의료 분야 또는 다국적기업에서 주로 사용했던 SAS가 있고, 최근엔 오픈

                     소스 위주의 래피드마이 (RapidMiner)와 R 언어도 많이 사용한다.





                                                                                  45
   42   43   44   45   46   47   48   49   50   51   52