Page 71 - 데이터과학 무엇을 하는가? 전자책
P. 71

빅데이터 플랫폼 구성도
                      Operational Systems
                         Structured data                            비즈니스 분석가 영
                              Extract, Transform, Load
                      Operational   Batch, near real time, or
                        System     real time   Streaming/
                                              CEP Engine             Reports, Dashboards
                                                       Alerts
                      Operational
                        System                                    BI
                                                                 Server   Casual User
                                               Data
                       Machine  Hadoop Cluster  Warehouse  Dept
                                                         Data
                        Data                             Mart     Top down Architecture
                                            Virtual Sandboxes
                                                                 Bottom up Architecture
                      Web Data                                     In memory
                                                                   BI Sandbox
                                                        Ad hoc query
                                                     Upload & query
                      Audio/video                    Query & report       Power User
                        Data                   Free
                                              Standing  Ad hoc query
                                              Sandbox
                       External             Analytic platform or  Ad hoc query
                        Data                 non relational          데이터 과학자 영
                                               database
                      Documents & Text
                       빅데이터 분석의  름을 살펴보면, 우선 데이터 과학자들은 애플리케

                     이션 개발자나 데이터 공학자(Data Engineer) 또는 플랫폼 개발자들이 구

                     축해  은 빅데이터 플랫폼의 데이터 스토어(Data Store, Enterprise Data

                     Warehouse)에서 데이터를 정제하고 분석 모델을 개발한다. 그리고 비즈
                     니스 분석가가 사용할 정제 데이터나 분석 모델을 프로세스에 맞  세팅

                     하고 이들이 사용하는   이나 문제점을 지속적으로 모니터링한다.

                       모니터링 도중 비즈니스 데이터   에서 특이 사항이나 문제점을 발

                     견하면, 단  배치 빅데이터 분석 플랫폼에서 데이터를  이 있게 분석
                     하고 원인과 결과 관계를 파 한다. 그리고 개선된 조치를 현업 프로세

                     스에 적용한다. 빅데이터 플랫폼을 오프라인, 준실시간, 실시간으로 구




                                                                                  69
   66   67   68   69   70   71   72   73   74   75   76