Page 113 - 데이터과학 무엇을 하는가? 전자책
P. 113

인 소비자 데이터를 가공 통합한다.



                          를 위한 어 리
                       액시엄은 개인 식별 번호인 사회보장번호(Social Security, 한국의 주민등록

                     번호)를 그대로 사용하는 것은 개인정보 유출의 위험이 있고 데이터 정제

                     과정에서도 효율적이지 못하다는 것을   고 1999년부터 어빌리테크
                     키(Abilitec Key)라는 자체 식별 번호를 생성하여 내부 활용 및 외부 컨설

                     팅과 판매도 하고 있다. 데이터 통합 과정에서 식별 번호의 중요성을 일

                      감치 인식하고 90년대부터 개발해 왔던 것이다. 이 식별 번호는 개인

                     또는 가구 단위 식별 데이터 품질 관리에서 중복 데이터를 제거하기 위

                     해 반드시 필요한, 기본 식별 번호(primary key)이다.


                           스

                       액시엄은 인포베이스를 가지고 데이터를 그룹화(clustering)해서  소

                      엑스(Personic )라고 이름  였고, 데이터 품질 관리 과정을   엑스

                     (Optic )라 이름  여 내부 데이터 품질뿐만 아니라 고객 데이터 품질 컨
                     설팅과 데이터 활용 컨설팅을 한다.  소 엑스는 개인 소비자를 70개

                     그룹으로 나누어 생애 주기에 따른 20가지 유형으로 구분하고, 필요에

                     따라서는 산업별 특성에 따라 더 세분화하여 사용한다. 각각의 그룹은

                     일반적으로 다음과 같이 코드가 부여된다. 예를 들어  G  3 15’라는 그
                     룹의 경우 G 는 생애 주기 코드, 3은 소득 수준 코드, 15는 그룹 클러스

                     터 코드를 의미한다.




                                                                                 111
   108   109   110   111   112   113   114   115   116   117   118