Page 71 - 데이터과학 무엇을 하는가? 전자책
P. 71
빅데이터 플랫폼 구성도
Operational Systems
Structured data 비즈니스 분석가 영
Extract, Transform, Load
Operational Batch, near real time, or
System real time Streaming/
CEP Engine Reports, Dashboards
Alerts
Operational
System BI
Server Casual User
Data
Machine Hadoop Cluster Warehouse Dept
Data
Data Mart Top down Architecture
Virtual Sandboxes
Bottom up Architecture
Web Data In memory
BI Sandbox
Ad hoc query
Upload & query
Audio/video Query & report Power User
Data Free
Standing Ad hoc query
Sandbox
External Analytic platform or Ad hoc query
Data non relational 데이터 과학자 영
database
Documents & Text
빅데이터 분석의 름을 살펴보면, 우선 데이터 과학자들은 애플리케
이션 개발자나 데이터 공학자(Data Engineer) 또는 플랫폼 개발자들이 구
축해 은 빅데이터 플랫폼의 데이터 스토어(Data Store, Enterprise Data
Warehouse)에서 데이터를 정제하고 분석 모델을 개발한다. 그리고 비즈
니스 분석가가 사용할 정제 데이터나 분석 모델을 프로세스에 맞 세팅
하고 이들이 사용하는 이나 문제점을 지속적으로 모니터링한다.
모니터링 도중 비즈니스 데이터 에서 특이 사항이나 문제점을 발
견하면, 단 배치 빅데이터 분석 플랫폼에서 데이터를 이 있게 분석
하고 원인과 결과 관계를 파 한다. 그리고 개선된 조치를 현업 프로세
스에 적용한다. 빅데이터 플랫폼을 오프라인, 준실시간, 실시간으로 구
69