Page 69 - 데이터과학 무엇을 하는가? 전자책
P. 69
플랫폼 기본 구성 요
먼저 빅데이터 플랫폼에 필요한 주요 구성 요소를 정리해 보면, 데이
터 영역, 빅데이터 에코시스템(Ecosystem), 전사 기업 정보 관리 그리고
분석 및 인사이트 영역으로 나 수 있다. 이중 전사 기업 정보 관리 영역
은 빅데이터 플랫폼에서 처음부터 빠져 있기 일 거나 기획 과정에 고려
했더라도 실제 진행 과정에서 소홀하게 취급되는 경우가 대부분이라 더
집중적으로 관심을 두어야 한다. 전사 기업 정보 관리 영역의 데이터 거
버 스, 데이터 통합, 데이터 품질 그리고 마스터 데이터 관리가 빅데이
터 활용의 중요한 성공 요인이라는 것은 앞에서 이미 언급한 바 있다.
빅데이터 플랫폼 구성 요
하 , 빅데이터
데이터 영 전사 기업 BI 플랫폼, 분석
에 시스템
정형, 비정형 정보 관리 , 인사이트
Ecosystem
•인메 리 •검색 및 시각화 •데이터 거 스 •기계학
(In Memory (Lucene) •데이터 통합 ( 발 )
Appliance) •데이터 지 •데이터 품질 •추정, 추 데이터시각화
•데이터베이스 (Flume, •데이터 시각화 •예
(Database Zookeeper) •마스터 데이터 관리 (Forecasting,
Appliance) •데이터 접근 What if,
•기업 전사 데이터 (Pig, Hive, Simulation)
어하우스 Sqoop) •기 통계
(Enterprise Data •하 (Basic Statistics,
Warehouse) (HDFS, Historical)
•로 데이터 MapReduce) •보고서, 스코어
어하우스 •NoSQL 데이터 카드, 대시보드
(Local Data 베이스
Warehouse) (Hbase,
•데이터 마트 MongoDB,
(Data Mart) Couch)
67