Page 48 - 데이터과학 무엇을 하는가? 전자책
P. 48
래피드마이 는 R을 더 사용하기 쉽게 만든 분석 도구로, 프로그
이 필요 없으며 오픈 소스와 상용 버전이 있다. 이중 오픈 소스 소프트웨
어는 빅데이터용은 아니다. SAS는 다양한 플랫폼에서 안정적으로 사용
할 수 있지만 비 다는 게 이다. 필자도 대학 시절부터 지금까지 SAS
를 사용해 왔는데, 최근 들어 오픈 소스나 다른 도구도 조금 사용하고
있다. 오픈 소스는 다양한 알고리즘을 사용할 수 있고 저 하다는 장점
이 있다. 이 때문에 요즘 나오는 데이터 활용 프로젝트는 오픈 소스를 많
이 선호한다.
2013년에 SAS, 테라데이터(TeraData), 호 스(Hortonworks)가 함께
출시한 하둡용 고급 분석 도구(Analytics Advantage Program with Hadoop)는
빅데이터용 분석 도구다. 이 제품은 어떤 환경에서도 다양한 종류의 데
이터를 준실시간(Near real-time)으로 빠르게 분석한다고 한다. 이것이 사
실이라면 장히 나는 도구다. 또한, 빅데이터 예측 분석과 기계학습
알고리즘을 오픈 소스로 제공하는 스데이터(0xdata)는 H 2O라는 빅데
이터용 인메모리(in-memory) 분석 엔진을 출시했다. H 2O는 통계나 기계
학습, 복 한 수학을 하둡뿐만 아니라 데스크 이나 클라우드(아마존 EC2
등)에서도 사용할 수 있게 해준다. R, 엑 (Excel), JSON(자바스크 트 표준
객체) 등과의 호환도 수월해 다양한 고급 분석이 가능하다고 한다. 현재
온라인 영화 대여 회사인 넷플 스(Netflix)에서 빅데이터 고급 분석 베타
버전으로 테스트 중이라고 하니 결과가 기다려진다. 스데이터 페이
지(http://0xdata.com/h2o-2/)에서 H 2O 시험 버전을 다운로드받아 사용할
수 있다.
46