Page 48 - 데이터과학 무엇을 하는가? 전자책
P. 48

래피드마이 는 R을  더 사용하기 쉽게 만든 분석 도구로, 프로그
                   이 필요 없으며 오픈 소스와 상용 버전이 있다. 이중 오픈 소스 소프트웨

                   어는 빅데이터용은 아니다. SAS는 다양한 플랫폼에서 안정적으로 사용

                   할 수 있지만 비 다는 게  이다. 필자도 대학 시절부터 지금까지 SAS

                   를 사용해 왔는데, 최근 들어 오픈 소스나 다른 도구도 조금  사용하고
                   있다. 오픈 소스는 다양한 알고리즘을 사용할 수 있고 저 하다는 장점

                   이 있다. 이 때문에 요즘 나오는 데이터 활용 프로젝트는 오픈 소스를 많

                   이 선호한다.

                     2013년에 SAS, 테라데이터(TeraData), 호  스(Hortonworks)가 함께
                   출시한 하둡용 고급 분석 도구(Analytics Advantage Program with Hadoop)는

                   빅데이터용 분석 도구다. 이 제품은 어떤 환경에서도 다양한 종류의 데

                   이터를 준실시간(Near real-time)으로 빠르게 분석한다고 한다. 이것이 사

                   실이라면  장히  나는 도구다. 또한, 빅데이터 예측 분석과 기계학습
                   알고리즘을 오픈 소스로 제공하는  스데이터(0xdata)는 H 2O라는 빅데

                   이터용 인메모리(in-memory) 분석 엔진을 출시했다. H 2O는 통계나 기계

                   학습, 복 한 수학을 하둡뿐만 아니라 데스크 이나 클라우드(아마존 EC2

                   등)에서도 사용할 수 있게 해준다. R, 엑 (Excel), JSON(자바스크 트 표준
                   객체) 등과의 호환도 수월해 다양한 고급 분석이 가능하다고 한다. 현재

                   온라인 영화 대여 회사인 넷플 스(Netflix)에서 빅데이터 고급 분석 베타

                   버전으로 테스트 중이라고 하니 결과가 기다려진다.  스데이터  페이

                   지(http://0xdata.com/h2o-2/)에서 H 2O 시험 버전을 다운로드받아 사용할
                   수 있다.



               46
   43   44   45   46   47   48   49   50   51   52   53