Page 233 - 데이터과학 무엇을 하는가? 전자책
P. 233
고, 전화 통화만 오간 경우에는 통화 타입을 생 ▶타임 스 프: 어 시 에
데이터가 존재했다는 사실
략하기도 한다. 을 증명하기 위해 특정 위치
에 표시하는 시각을 한다.
위치 데이터는 고객이 무선 데이터나 통화 서 공통적으로 고하는 시각에
대해 시간의 기 을 표시하
비스를 사용한 시간대별로 위도와 경도 정보가 는 시간 변위 매개 변수이다.
한 세트로 여 개별 식별 번호와 함께 저장된
다. 위치 데이터와 통화 데이터가 동시에 같은 시스템에서 지속적으로
생성되지 않는다면 두 파일을 매치하는 과정도 주의를 기울여야 할 부분
이지만, 이와는 별개로 데이터의 일관성을 위해 회사 차원에서 비즈니스
규정을 사전에 정해 아야 할 것이다.
데이터 매치 과정에서 개별 식별 번호는 중요한 역할을 한다. 예를 들
어 어느 날 한 고객이 버스를 타고 이동하면서 하루 종일 10차례 통화를
했다면, 10회라는 통화 수는 그날의 개별 식별 번호의 발신 도로 산
정이 되고, 각각의 통화 위치는 위치 데이터베이스와 통화 데이터베이스
의 개별 식별 번호와 통화 시간대, 위치 시간대를 서로 매치하여 파 한
다. 따라서 위치 데이터베이스에서 통화 데이터베이스의 시간대와 매치
되지 않는 개별 식별 번호 데이터는 단순히 모바일 데이터 사용 시간만
나타내는 위치 데이터들이다.
통화 데이터와 위치 데이터의 정 살펴보기
CDR, 즉 통화 데이터를 기간을 정해 추출하여 활용한다고 해
도 워 데이터가 크기 때문에 샘플링 작업을 통해 분석해야 한다. 이때
231