Page 29 - 데이터과학 무엇을 하는가? 전자책
P. 29
으로 빅데이터라고 얘기하는 10테라바이트 이상의 데이터를 분석한 응
답자는 10%도 안 되었고, 80% 이상이 1테라바이트 이하의 데이터를 분
석했다고 응답했다. 이는 아직까지 일반 현업에서 실제 빅데이터를 분석
할 기회는 흔하지 않다는 것을 말해 준다.
분석한 데이터 중 가장 데이터 사이즈는
100PB 이상 2013
11 100PB 2012
1.1 10PB
101TB 1PB
11 100TB
1.1 10TB
101GB 1TB
11 100GB
1.1 10GB
101MB 1GB
11 100MB
1.1 10MB
1MB 이하
0% 5% 10% 15% 20% 25%
케이디 츠 컴의 2013년 설문 조사 비교
실제로 구글이나 페이스 같은 SNS 기업의 웹 스케일(Web scale) 데
이터나 다국적기업 또는 정부 데이터가 아닌 이상 몇백 테라바이트나
페타바이트(PB)급 데이터를 만나기는 아직 어렵다. 특히 한국에서는 더
욱 그러하다. 필자가 한국에서 접한 가장 큰 데이터는 한 통신사의 웹로
그 데이터와 통화 데이터(CDR: Call Detail Record. 통화 내역 기록)였다. 모바
27