Page 303 - 데이터과학 무엇을 하는가? 전자책
P. 303
빅데이터의 가치
빅데이터의 새로운 기술인 ETL + 3T 빅데이터 플랫폼 프로세스를 적
용하면 데이터 허브(또는 데이터 스토어)의 기본 개념은 특별히 새로울 게
없지만, 그 내용은 획기적이다. 즉 기존의 RDBMS나 EDW 개념에서 한
걸음 더 나아가 하둡 에코시스템을 기초로 기존의 ETL(Extract, Transform,
Load: 추출, 변환, 탑재)과 3T(Transfer, Transform, Translate: 전달, 변환, 해석) 프
로세스를 동시에 적용하면 부분적 사일로(silo), 즉 중간 단계의 허브에서
전사적 데이터센터가 가능한 전사적 데이터 허브가 가능하다.
레거시 빅데이터
시스템
데이터베이스 전달
저장 TRANSFER
추출
가공
빅데이터 TRANSFORAM 변환
중간 단계 변환 플랫폼
데이터베이스
탑재 TRANSLATE
데이터 분석
웨어하우스 해석
하둡 플랫폼 시스템에서는 일차적으로 기존의 전사적 데이터 웨어하
우스인 ETL 방식을 포함하고, 모든 데이터를 수집하는 즉시 의무적으로
301