Page 207 - 데이터과학 무엇을 하는가? 전자책
P. 207

여기에서 말하는 데이터와 이 트는 조금 다르다. 이 트는 아주 작은
                     단위의 시간, 이른바 찰나에 일어나는 정보들이다. 즉 고객이 취한 행동을

                     준실시간으로 업데이트해야 하는 작은 사건들을 말한다. 반면에 데이터

                     는 저장 가능한 작은 단위의 정보들을 뜻하며, 프로세스상의 속도보다는

                     품질이나 수량이 더 중요하다. 물론 고객에 대한 프로파일 이 트는 이
                     트와 데이터 둘 다 해당될 수 있다. 넷플 스의 준실시간 프로세스는  해

                      (Manhattan)이라는 내부 인프라에서 추천 알고리즘을 위해 구성된다.

                       준실시간 데이터는 카산드라, 이브이캐시(EVCache), 그리고 MyS L에

                     저장한다. 여기에서 어디에 저장하느냐는 중요하지 않다. 그보다는 복
                      한  리, 대량의  기/쓰기 그리고 운영상의 지속성을 최적으로 유지

                     하는 것이 중요하다.



                     상품 추  결과 데이터

                                산       MySQL  이브이 시



                                                         기계학습
                                                          고리
                                      고리  서비스
                                                          인 계산

                                        UI 고

                                           추




                                        버 고
                                                         출처: 넷플 스  로그 페이지


                                                                                 205
   202   203   204   205   206   207   208   209   210   211   212