Page 309 - 데이터과학 무엇을 하는가? 전자책
P. 309
이외에도 주요하게 고려할 사항이 있다. 각기 다른 기관과 부처에서 생
성된 사일로(silo) 데이터를 통합하여 융·복합된 인사이트를 찾기 위해서
는 무엇보다 데이터 통합이 필요한데, 통합 과정에서 각각의 데이터들을
연결하는 식별 번호(key)도 반드시 기획 과정에서 고려해야 할 사항이다.
기관이나 기업에서는 지금껏 주민등록번호를 사용해 왔으나 주민번호
사용이 법으로 금지된 상황에서 이를 대체할 식별 번호를 찾아야 한다.
설문 조사 기관인 포레스터의 기업 조사에서, 빅데이터를 어느 분야에
활용할 것이냐는 질문에 응답자의 45%가 마케팅에 활용하고, 43%가 기
업 운영에, 38%가 영업에 활용할 것이라고 답했다. 대다수 기업이 일순
위로 꼽은 마케팅 분야의 가장 큰 염원은 데이터를 활용한 1대1 마케팅,
360도 시각의 개인 고객 분석 마케팅이다. 영업과 고객 관리도 마찬가지
다. 그런데 현업 활용 과정에서 최소 가구 단위조차도 식별이 되지 않은
데이터를 사용할 경우 마이크로 타기팅(Micro Targeting)이 아닌 대중 마
케팅(Mass Marketing)이 될 수밖에 없다.
산업별 활용도가 높은 데이터는 금융, 통신, 정부, 교육, 소매 등 주로
단위 식별이 필요한 데이터들이다. 예를 들어 통계청 공공 데이터를 적
절히 활용하기 위해서는 읍, 면, 동을 평균 30개 정도로 나눈 크기인 집계
구 단위를 조사구 단위로 더 세분화하는 것도 가능해야 하고, 정제 과정
에서는 가구 단위로도 활용할 수 있어야 한다. 사실 조사구 단위도 평균
60가구 정도를 포함한 단위라서 마이크로 타기팅 마케팅에 활용하기에
는 역부족이다. 그리고 개방된 공공 데이터라도 일단 가공이 되면 통합
과정에서 문제가 된다. 따라서 원천 데이터를 가공한 분석 과정에 대한
307