Page 233 - 데이터과학 무엇을 하는가? 전자책
P. 233

고, 전화 통화만 오간 경우에는 통화 타입을 생                ▶타임 스 프: 어  시 에
                                                               데이터가  존재했다는  사실
                     략하기도 한다.                                  을 증명하기 위해 특정 위치
                                                               에 표시하는 시각을  한다.
                       위치 데이터는 고객이 무선 데이터나 통화 서                공통적으로  고하는 시각에
                                                               대해 시간의 기 을 표시하
                     비스를 사용한 시간대별로 위도와 경도 정보가                  는 시간 변위 매개 변수이다.

                     한 세트로  여 개별 식별 번호와 함께 저장된
                     다. 위치 데이터와 통화 데이터가 동시에 같은 시스템에서 지속적으로

                     생성되지 않는다면 두 파일을 매치하는 과정도 주의를 기울여야 할 부분

                     이지만, 이와는 별개로 데이터의 일관성을 위해 회사 차원에서 비즈니스

                     규정을 사전에 정해  아야 할 것이다.
                       데이터 매치 과정에서 개별 식별 번호는 중요한 역할을 한다. 예를 들

                     어 어느 날 한 고객이 버스를 타고 이동하면서 하루 종일 10차례 통화를

                     했다면, 10회라는 통화  수는 그날의 개별 식별 번호의 발신  도로 산

                     정이 되고, 각각의 통화 위치는 위치 데이터베이스와 통화 데이터베이스
                     의 개별 식별 번호와 통화 시간대, 위치 시간대를 서로 매치하여 파 한

                     다. 따라서 위치 데이터베이스에서 통화 데이터베이스의 시간대와 매치

                     되지 않는 개별 식별 번호 데이터는 단순히 모바일 데이터 사용 시간만

                     나타내는 위치 데이터들이다.





                             통화 데이터와 위치 데이터의      정 살펴보기


                             CDR, 즉 통화 데이터를 기간을 정해 추출하여 활용한다고 해

                     도 워  데이터가 크기 때문에 샘플링 작업을 통해 분석해야 한다. 이때


                                                                                 231
   228   229   230   231   232   233   234   235   236   237   238