Page 248 - 데이터과학 무엇을 하는가? 전자책
P. 248
기술을 활용해 영리하고 창의적인 방법으로 데이터 분석을 한다면 효율
적인 결과를 얻을 수 있을 것이다.
일반적으로 부정이나 불법 감지 방법을 개발하는 데는 여러 가지 어려
움이 있다. 감지된 데이터의 결과를 입수하기 어렵고, 실제 운영 데이터
는 큰 데 비해 감지된 데이터는 무 작고 투입해야 할 변수들도 무 많
다. 가장 큰 문제는 부정, 불법의 방법이 계속해서 진화한다는 것이다. 한
번 사용한 방법을 또 사용하지 않는 경우가 많고 운영 시스템도 계속해
서 발전하기 때문에 그때마다 업데이트해야 하는 어려움이 따른다. 그뿐
만이 아니다. 데이터의 타입도 자뿐만 아니라 이미지나 신호, 스트
또는 네트워크일 수도 있다. 데이터 소스도 다양한 곳에서 통합한 데이
터를 사용해야 하는 경우가 많다. 이런 점에서 때 부정 불법 부분은 빅
데이터 기술의 혜택을 많이 수 있는 영역이라 할 수 있다.
가트 는 2013년에 보안 및 부정 불법 감지에 약 8%의 회사만이 빅데
이터를 활용하고 있으나 2016년에는 25%의 글로벌 회사들이 빅데이터
와 데이터 과학을 활용할 것이라 예측했고, 현업 적용 후 6개월 안에
정적인 효과를 것이라고 예견했다.
정 를 위한 데이터 4가
남의 눈에 지 않기 위해서 온갖 노력을 다하는 부정 불법 관
련 데이터의 특성상 부정 불법과 정상(Fraud/Non fraud)을 구분하기 쉽지
않은 경우가 많다. 또한 데이터 구조가 비선형에 오염되어 있는 경우가
246