Page 46 - 데이터과학 무엇을 하는가? 전자책
P. 46
레거시 데이터를 정형 빅데이터로 관리해 온 금융 기업들은 아직도 데이
터를 테이프에 저장하는 경우가 많다. 데이터 과학자들은 이종( ) 시
스템의 데이터들을 더 편리하게 사용할 수 있게 해주는 클라우드와 시스
템 가상화 환경에 대해서도 폭넓게 알아야 한다. 필자가 일했던 액시엄
에서도 2000년 초부터 클라우드와 시스템 가상화 환경이 구축되어, 서
로 다른 환경의 플랫폼에 쉽게 접근할 수 있어 편리했다. 요즘은 다양한
클라우드 환경에서 일할 기회가 더 많아졌다. 클라우드 종류에는 인프라
에 관여하는 IaaS(Infra as a service), 플랫폼에 관여하는 PaaS(Platform as a
service) 그리고 애플리케이션에 관여하는 SaaS(Software as a service) 등이
있다. 플랫폼 운영 시스템에 따라 데이터 과학자가 사용하는 소프트웨어
가 달라져야 하는 경우도 자주 있다. 따라서 빅데이터 인프라나 플랫폼
의 내부 구성에 대한 이해는 물론이고 데이터 통합, 분석 및 활용 전반에
대한 경험적 지식도 갖추어야 한다.
우 종류와 활용 단계
우 고 Cloud Clients
웹 브라우저, 일 , 고객, 터미널 사용, 애플리케이션
SaaS 프트웨어 서비스
고객 관리, 이메일, 가상 데스크 , 통신, 게임, 플랫폼
PaaS 플랫폼 서비스
운영 시간 관리, 데이터베이스, 웹 서 , 개발 , 인프라 구조
IaaS 인프 스트 서비스
가상 기계, 서 , 저장, 재, 트 크
44