Page 151 - 데이터과학 무엇을 하는가? 전자책
P. 151

보고서를 생성하면서 가장 중요한 작업은 각각의 수치가 올바른 계산
                     방식에 따라 정확히 산출되었는지 확인하는 것이다. 각 사업부나 지사에

                     서 보내온 데이터를 통합하여 작성하는 일이기 때문에, 일일이 확인하는

                     작업이 무엇보다 중요하다. 또한 이 작업은 품질 관리 과정에서 해당 분

                     야의 지식이 필요한 작업이기도 하다. 즉 은행이라면 금융 지식이 필요
                     한 작업인 것이다.

                        크 오브 아메리카를 위한 금융 성과 보고서 생성 과정에서도 가장

                     중요한 작업은 과거 데이터와 최근 데이터를 통합하는 것이었다. 데이터

                     통합 작업은 프로그  코 을 필요로 하는데, 보고서는 주로 SAS 작업으
                     로 이루어졌고, 데이터 가공은 주로 코 이나 C++ 작업으로 이루어졌다.

                     기존 데이터가 IBM 메인 프레임 테이프(tape)로 저장되어 있어서 1차 통

                     합 작업이 코 로 이루어진 후에 2차로 최종 보고서가 메인 프레임 SAS

                     로 완성되었다. 완성된 보고서는 매월 말 고객들
                                                               ▶분석 경 력 발전 5단계는
                     에게 우편으로 전달되었는데, 마지막 인  작업                  단계: 데이터 품질 미비, 개
                                                               별적 보고서 작성   2단계:
                     까지 확인하면 모든 임무가 종결된다. 당시에는                 일반 보고서, 개별적 생성
                                                               3단계: 부분    접근, 전사적
                     보고서를 이메일로 보내기에는 파일 크기가                    부재 데이터, 보고서 사일로
                                                               현상    단계: 전사 데이터
                     무 커서 주로 인  작업을 했다.  크 오브 아메               통합, 품질 관리, 보고서
                                                               5단계: 외부 데이터 활용, 고
                     리카는 이때가 일반 보고서를 개별 생성 분석하
                                                               급 통계 분석,  적화이다.
                     는 단계, 즉 분석 경 력 2단계에서 3단계로

                     어가는 과정이었다.

                        크 오브 아메리카의 분석 보고서를 생성하여 활용하던 중에 액시엄
                     금융 영업 이 로  데이터 웨어하우스를 구축하고 BI 리포팅  을 갖



                                                                                 149
   146   147   148   149   150   151   152   153   154   155   156