Page 73 - 데이터과학 무엇을 하는가? 전자책
P. 73
빅데이터 플랫폼 통합 구성 1
조 시각화, 대시보드, 시 레이션 Score, Decision, Alerts, Curricula
Action (Human Action) (Machine Action)
브라우저, 일 디 이스, 치 작업 웹 서비스, FTP, Sockets
분석 과 대 데이터의
OLAP, RDBMS, Mem/Cashed
데이터베이스 적화 접근
(Model) 의사 정을 위한
분석 형 합(Ensembles)
적용, 수행 비즈니스
분석 , SVM, Neural Nets, Regression, K-NN, SVD, Matrix
기계학 개발 Factorization, GEO-Distance 등
데이터 신호, PCA, Decision tree, Chart, Clustering, 감성 분석,
분석
선택 Regression, Outlier 등
정제된 데이터 접근의 NoSQL, 인메 리, RDBMS
데이터베이스 적화
데이터 신호, 신호 생성 시계 , 통계, 이 트, 지리 위치 등
구별 알고리
신 성
데이터 저장 현업에 는 Hadoop, 인메 리, RDBMS
(data store) 환경 구축
데이터 가공 데이터에 는 SAS, Hadoop, 구매 ETL 도구,
(Transform) 도구 사용 자체 개발 도구
ETL 융통성 있는
데이터 수집 웹 서비스. Sockets, FTP, SQL,
데이터 수집
(Extract) SAP
인터페이스
전사 운영 데이터: 구매 데이터: 기계, 위치 데이터:
웹 데이터: 정형,
고객, 오라클, 실시간 구매, 비정형 데이터 정형, 비정형
데이터 스 SAP 등 치 구매 데이터
1 빅데이터 전문 컨설팅 회사 오페라 루션(Opera Solution) 참고.
71