Page 127 - 데이터과학 무엇을 하는가? 전자책
P. 127
수정하고 식별되어야 비로소 사용할 수 있다.
우선 이름 데이터부터 각각의 단어 분리 작업(Parsing)을 하고 중복 제
거 작업(merge/purge process)을 한다. 이 작업이 나면 주소 정제와 주소
중복 제거, 수신 거부 프로세스를 진행하는데, 주소 데이터는 미국 우체
국의 주소 정제 제품을 사용해 먼저 정제한다.
다음은 주소가 정제된 예시이다. 주소 표준이나 번지수가 잘못 표기되
었거나 번지수가 빠진 것을 수정하고 보충한다.
주 정제 내용 예시
준화 Standardization Robert T. Jones
Susan P Leones 124 S. Oak St.
7203 South Grove Street Bryant, AR 72022-2184
Mission Grove, Utah 30279
정보 Missing Information
Susan P Leones Susan Hines
7203 SGroveSt. 458 Pleasant Ridge Road
Mission Grove, UT 30279-1234 Little Rock, AR 72212
경 Change of Address Susan Hines
Daniel R Garvey 458 Pleasant Ridge Rd, Apt 518
13417 Williston Road Little Rock, AR 72212-3438
Elma, New York 14059
번호 Incorrect Street Number
Daniel R Garvey Alexander Nicholas
16 Rosebud Ln. 1806 Parkway
Burnt Store, FL 33951-2890 Memphis, TN 38113
기 Misunderstood Alexander Nicholas
Address) 1860Parkway
Robert T. Jones Memphis, TN 38113-1234
1245 Oak St
Bryant, AR 72022 ▶색 씨 부분이 수정된 주소이다.
125