Page 303 - 데이터과학 무엇을 하는가? 전자책
P. 303

빅데이터의 가치

                       빅데이터의 새로운 기술인 ETL + 3T 빅데이터 플랫폼 프로세스를 적

                     용하면 데이터 허브(또는 데이터 스토어)의 기본 개념은 특별히 새로울 게

                     없지만, 그 내용은 획기적이다. 즉 기존의 RDBMS나 EDW 개념에서 한

                     걸음 더 나아가 하둡 에코시스템을 기초로 기존의 ETL(Extract, Transform,

                     Load: 추출, 변환, 탑재)과 3T(Transfer, Transform, Translate: 전달, 변환, 해석) 프
                     로세스를 동시에 적용하면 부분적 사일로(silo), 즉 중간 단계의 허브에서

                     전사적 데이터센터가 가능한 전사적 데이터 허브가 가능하다.







                         레거시    빅데이터
                         시스템
                       데이터베이스                         전달
                                                      저장   TRANSFER
                            추출
                                                                             가공
                                                               빅데이터     TRANSFORAM  변환
                        중간 단계    변환                             플랫폼
                       데이터베이스

                            탑재                                    TRANSLATE


                         데이터                                분석
                        웨어하우스                               해석




                       하둡 플랫폼 시스템에서는 일차적으로 기존의 전사적 데이터 웨어하

                     우스인 ETL 방식을 포함하고, 모든 데이터를 수집하는 즉시 의무적으로



                                                                                 301
   298   299   300   301   302   303   304   305   306   307   308