Page 72 - 데이터과학 무엇을 하는가? 전자책
P. 72
분하는 이유도 비즈니스 분석가와 데이터 과학자들의 플랫폼 영역을 구
분하여 데이터 활용의 효율성과 안정성을 높이기 위해서다. 세계적인 기
업들이 시행하고 있는 방식을 그대로 따라할 수는 없어도 기업의 규모에
맞게 구축하고 분석 영역을 분리하여 문제가 발생할 여지를 사전에 차단
하는 것이 현명하다.
빅데이터 플랫폼 구
빅데이터 플랫폼을 구축할 때는 기획 단계에서 전체 통합 요소를 이해
하고 단계별로 로드맵을 그려야 한다. 빅데이터 플랫폼은 크게 데이
터 수집 단계, 저장 단계, 데이터의 신호 분석 단계, 현업 적용 및
활용 단계로 이루어진다. 각 단계마다 데이터의 속성과 크기, 처리 속도
에 따라 적당한 애플리케이션과 인프라를 선택해야 하는데, 그러자면 고
도의 기술과 경험이 요구된다. 어설프게 설계한 플랫폼 구성도는 단
추를 잘못 채운 것처럼 중간에 아무리 고쳐도 전체 시스템을 다시 설계
하지 않는 한 해결되지 않는다.
데이터 과학자가 데이터 플랫폼까지 설계하고 구축하는 것은 현실적
으로 불가능하다. 그러나 실제 플랫폼 사용자는 데이터 과학자이기 때문
에 플랫폼 개발자, 데이터 공학자들과 같이 플랫폼 프로젝트에 참여하여
구성 요소와 구축 과정 정도는 이해하고 있어야 한다.
70