Page 29 - 데이터과학 무엇을 하는가? 전자책
P. 29

으로 빅데이터라고 얘기하는 10테라바이트 이상의 데이터를 분석한 응
                     답자는 10%도 안 되었고, 80% 이상이 1테라바이트 이하의 데이터를 분

                     석했다고 응답했다. 이는 아직까지 일반 현업에서 실제 빅데이터를 분석

                     할 기회는 흔하지 않다는 것을 말해 준다.



                        분석한 데이터 중 가장   데이터 사이즈는

                       100PB 이상                                        2013
                       11    100PB                                     2012
                       1.1    10PB
                      101TB    1PB
                       11    100TB
                        1.1    10TB
                      101GB    1TB
                       11    100GB
                       1.1    10GB
                     101MB    1GB
                       11    100MB
                       1.1    10MB
                        1MB 이하
                               0%       5%      10%       15%      20%      25%
                                                          케이디  츠 컴의 2013년 설문 조사 비교


                       실제로 구글이나 페이스  같은 SNS 기업의 웹 스케일(Web scale) 데

                     이터나 다국적기업 또는 정부 데이터가 아닌 이상 몇백 테라바이트나

                     페타바이트(PB)급 데이터를 만나기는 아직 어렵다. 특히 한국에서는 더
                     욱 그러하다. 필자가 한국에서 접한 가장 큰 데이터는 한 통신사의 웹로

                     그 데이터와 통화 데이터(CDR: Call Detail Record. 통화 내역 기록)였다. 모바




                                                                                  27
   24   25   26   27   28   29   30   31   32   33   34