Page 151 - 데이터과학 무엇을 하는가? 전자책
P. 151
보고서를 생성하면서 가장 중요한 작업은 각각의 수치가 올바른 계산
방식에 따라 정확히 산출되었는지 확인하는 것이다. 각 사업부나 지사에
서 보내온 데이터를 통합하여 작성하는 일이기 때문에, 일일이 확인하는
작업이 무엇보다 중요하다. 또한 이 작업은 품질 관리 과정에서 해당 분
야의 지식이 필요한 작업이기도 하다. 즉 은행이라면 금융 지식이 필요
한 작업인 것이다.
크 오브 아메리카를 위한 금융 성과 보고서 생성 과정에서도 가장
중요한 작업은 과거 데이터와 최근 데이터를 통합하는 것이었다. 데이터
통합 작업은 프로그 코 을 필요로 하는데, 보고서는 주로 SAS 작업으
로 이루어졌고, 데이터 가공은 주로 코 이나 C++ 작업으로 이루어졌다.
기존 데이터가 IBM 메인 프레임 테이프(tape)로 저장되어 있어서 1차 통
합 작업이 코 로 이루어진 후에 2차로 최종 보고서가 메인 프레임 SAS
로 완성되었다. 완성된 보고서는 매월 말 고객들
▶분석 경 력 발전 5단계는
에게 우편으로 전달되었는데, 마지막 인 작업 단계: 데이터 품질 미비, 개
별적 보고서 작성 2단계:
까지 확인하면 모든 임무가 종결된다. 당시에는 일반 보고서, 개별적 생성
3단계: 부분 접근, 전사적
보고서를 이메일로 보내기에는 파일 크기가 부재 데이터, 보고서 사일로
현상 단계: 전사 데이터
무 커서 주로 인 작업을 했다. 크 오브 아메 통합, 품질 관리, 보고서
5단계: 외부 데이터 활용, 고
리카는 이때가 일반 보고서를 개별 생성 분석하
급 통계 분석, 적화이다.
는 단계, 즉 분석 경 력 2단계에서 3단계로
어가는 과정이었다.
크 오브 아메리카의 분석 보고서를 생성하여 활용하던 중에 액시엄
금융 영업 이 로 데이터 웨어하우스를 구축하고 BI 리포팅 을 갖
149