Page 67 - 데이터과학 무엇을 하는가? 전자책
P. 67
가능한지, 사용할 수 있도록 법으로 허락되고 있는지, 데이터 구조나 내
용에 관련된 문서가 존재하는지, 정형 · 반정형 · 비정형 데이터인지, 다른
데이터와 결합은 가능한지, 사전 검증을 위해 일부 데이터를 사용할 수
있는지 등이다.
3. 테스트와 투자를 위한 빅데이터 전략을 세운다. 즉 마나 빠르게
원천 데이터 소스를 얻을 수 있는지, 언제 어 게 사용하기 위해서 원천
데이터를 분석해야 하는지, 어 게 신속하고 효율적으로 데이터를 운영
할 수 있는지, 어떤 데이터가 시스템에 문제를 일으 것인지, 어떤 데이
터를 버려야 하는지, 빅데이터의 다양성과 속도에 적응하기 위해 무엇을
자동화해야 하는지, 모든 프로세스가 개인정보보호 아래에서 프로세스
되는지 등에 대한 상세 계획을 세운다.
4. 빅데이터 활용 계획은 테스트와 검증(proof of concept)을 통해 나온
다. 빅데이터 활용 환경을 조성하기 위해서는 하드웨어뿐만 아니라 기
술이나 인력에도 상당한 투자가 요구되는 만 사업 관련 부분에서 투자
대비 이익(ROI, 투자수익률)도 필수적으로 따라주어야 한다. 갖고 있는 데
이터가 빅데이터라고 해서 무조건 투자할 수도 없는 일이다. 기존의 IT 환
경을 효율적으로 사용하여 빅데이터를 무리 없이 활용하는 것이 기업 입
장에서는 더 효율적이다. 테스트와 검증 과정에 포함되어야 할 것들은 다
음과 같다.
65