Page 207 - 데이터과학 무엇을 하는가? 전자책
P. 207
여기에서 말하는 데이터와 이 트는 조금 다르다. 이 트는 아주 작은
단위의 시간, 이른바 찰나에 일어나는 정보들이다. 즉 고객이 취한 행동을
준실시간으로 업데이트해야 하는 작은 사건들을 말한다. 반면에 데이터
는 저장 가능한 작은 단위의 정보들을 뜻하며, 프로세스상의 속도보다는
품질이나 수량이 더 중요하다. 물론 고객에 대한 프로파일 이 트는 이
트와 데이터 둘 다 해당될 수 있다. 넷플 스의 준실시간 프로세스는 해
(Manhattan)이라는 내부 인프라에서 추천 알고리즘을 위해 구성된다.
준실시간 데이터는 카산드라, 이브이캐시(EVCache), 그리고 MyS L에
저장한다. 여기에서 어디에 저장하느냐는 중요하지 않다. 그보다는 복
한 리, 대량의 기/쓰기 그리고 운영상의 지속성을 최적으로 유지
하는 것이 중요하다.
상품 추 결과 데이터
산 MySQL 이브이 시
기계학습
고리
고리 서비스
인 계산
UI 고
추
버 고
출처: 넷플 스 로그 페이지
205