Page 250 - 데이터과학 무엇을 하는가? 전자책
P. 250

가는 시간과 비용도 감안하여 목표 작업을 선정한다.
                     앞에서도 언급했지만 데이터의 특성상 어떤 하나의 방법만 사용해서

                   는 만족할 만한 예측을 얻기 어렵다. 리처드  러(Richard Wheeler)와 스

                    어트 에이컨(Stuart Aiken)의  불법 감지를 위한 결합 알고리즘’ (Multiple

                   Algorithms for Fraud Detection)에 의하면 한 가지 알고리즘만을 사용한 예
                   측보다 몇 개의 알고리즘을 결합한 알고리즘이 16% 이상 예측률이 더

                   높게 나타난다고 한다. 각각의 방법에 따른 장단점이 있기에 이들을 서

                   로 보완하는 방법을 선택하는 것이 최선이다.

                     주로 사용하는 방법에는, 규칙을 기준으로 감지하는 방법(Rule Based)

                   과 분석 모델을 활용하는 방법 그리고 이상치 감지 방법(Anomaly
                   detection)이 있다. 최근엔 이상치 감지 방법 중 하나인 소  네트워크 분

                   석 방법(Social network analysis)을 많이 활용하기도 한다.



                        기  감지 방법
                     규칙 기준 감지 방법(Rule Based)은 과거 부정 이력에 대한 전문적인 지

                   식이 필요하고 이미 잘 알려진 형태의 사건을 찾아내는 데 아주 효과적

                   이다. 그 한 예가 바로  KT ENS 거래 업체 대출 사기’ 사건 적발이다. 요

                   컨대 금융감 원(금감원)의 저축은행 상시 감시 시스템에 BS저축은행의

                   동일 차주(대출인) 한도 초과 정황이 포   사기 대출의 전모가 드러난
                   사건이다. 동일 대출인(차주)에게는 자기자본의 25%를 초과해 대출해 줄

                   수 없는데 KT ENS에서 회사 이름만 다른 복수의 SPC(특수목적법인)를 내

                   세워 한도 이상의 대출을 받아간 것이 저축은행 상시 감시 시스템에 포



               248
   245   246   247   248   249   250   251   252   253   254   255