Page 76 - 데이터과학 무엇을 하는가? 전자책
P. 76

하둡은 분명 빅데이터 문제의 좋은 해결책이 될 수 있으나, 어떤 경우
                   에는 잘못 사용하여 인력과 자원만  비하게 될 수도 있다. 글로벌 기술

                   컨설팅 회사인 소우 스(ThoughWorks)에서 하둡 사용이 적합한지 아닌

                   지를 판단하는 데 도움이 될 몇 가지 기준을 제시했다. 다음은 그 기준들

                   을 정리한 것이다.


                     하 을   하기 전에 고려해  할  들




                     1. 빅데이터가 존재하는가

                     빅데이터를 보유하고 있다고 믿는 회사가 아주 많은데 실제로는 그렇

                   지 않은 경우가 많다. 다음은 빅데이터를 실제로 보유하고 있는지 확인
                   해   수 있는 진단 질문이다.





                      빅데이터 보유  인을 위한

                      •    라 이트 이상의 데이터가 존재하는가
                      • 주기적으로 대 의 데이터가 유입되는가
                      • 얼마나  은 데이터를 비즈니스에 활용할 예정인가




                     미국 내 하둡 사용자들은 500~1,000TB를 저장하는 경우도   된다.

                   필자의 생각으로는 전체 데이터 사이즈가 10TB 이상이라면 하둡 사용




                       KDnuggets guest bloged By Anand Krishnaswamy, ThoughtWorks, 2013. 10. 4.


               74
   71   72   73   74   75   76   77   78   79   80   81