Page 140 - 데이터과학 무엇을 하는가? 전자책
P. 140
시 자동 관련 매 데이터
데이터 고유 데이터 내용
9047 Vehicle Veri cation Date(자동차 등록 날 ) 1st Vehicle(1번째 차)
9057 Vehicle Veri cation Date(자동차 등록 날 ) 2nd Vehicle(2번째 차)
9180 Vehicle Type(자동차 종류) 1st Vehicle(1번째 차)
9181 Vehicle Type(자동차 종류) 2nd Vehicle(2번째 차)
액시엄 자동차 은 자동차 분류 데이터와 고객 프로파일 데이터를
가지고 고객이 선호하는 자동차 그룹을 선정하는 통계 모델을 만들
었다.
우선 자동차 종류를 분류하여 통계 모델의 종속 변수를 선정하였고,
변수는 나이, 가족 수, 자녀 나이, 소득, 주거 지역, 소유 부동산 가치,
취미, 교육 등 차량 모델 선택과 관련 있는 변수들을 임의로 선정했다.
자동차 선호 그룹 (나이, 가족 수, 성별, 자 나이, 소득, 주거 지역, 취미, 교육 등)
알고리즘은 다변량 로 모델(multinomial logit model)을 사용했고,
변수는 액시엄의 인포베이스에서 관련 있는 변수들을 1차 선정하
고 상세 선정 작업은 원인 분석(factor analysis)과 주성분 분석(principle
component analysis) 알고리즘을 사용해서 했다. 샘플이 작으면 자동차 그
룹별 차이를 명확하게 하기 위해 분산 분석(ANOVA) 테스트를 해야 하나,
인포베이스의 방대한 데이터 분에 자동차 그룹별로 한 차이를 보
138