Page 76 - 데이터과학 무엇을 하는가? 전자책
P. 76
하둡은 분명 빅데이터 문제의 좋은 해결책이 될 수 있으나, 어떤 경우
에는 잘못 사용하여 인력과 자원만 비하게 될 수도 있다. 글로벌 기술
컨설팅 회사인 소우 스(ThoughWorks)에서 하둡 사용이 적합한지 아닌
지를 판단하는 데 도움이 될 몇 가지 기준을 제시했다. 다음은 그 기준들
을 정리한 것이다.
하 을 하기 전에 고려해 할 들
1. 빅데이터가 존재하는가
빅데이터를 보유하고 있다고 믿는 회사가 아주 많은데 실제로는 그렇
지 않은 경우가 많다. 다음은 빅데이터를 실제로 보유하고 있는지 확인
해 수 있는 진단 질문이다.
빅데이터 보유 인을 위한
• 라 이트 이상의 데이터가 존재하는가
• 주기적으로 대 의 데이터가 유입되는가
• 얼마나 은 데이터를 비즈니스에 활용할 예정인가
미국 내 하둡 사용자들은 500~1,000TB를 저장하는 경우도 된다.
필자의 생각으로는 전체 데이터 사이즈가 10TB 이상이라면 하둡 사용
KDnuggets guest bloged By Anand Krishnaswamy, ThoughtWorks, 2013. 10. 4.
74