Page 204 - 데이터과학 무엇을 하는가? 전자책
P. 204

다. 오프라인은 데이터 저장, 데이터 전처리, 대용량 데이터의 접근 등을
                   가능하게 만드는 인프라인데, 여기에서 실제 온라인 운영에 필요한 알고

                   리즘이나 프로세스를 수없이 테스트한다.

                     다음은 오프라인, 준실시간, 실시간으로 모 을 나눈 넷플 스 플랫폼

                   구상도이다.
                     오프라인에는 최신 데이터가 반영되지 않지만, 최신 데이터를 반영하

                   는 개인 맞 형 추천 시스템의 특성상 온라인과 오프라인이 아무 문제

                   없이 연결되는 것이 중요하다. 그러기 위해서는 중간에 준실시간이 필요

                   하다. 준실시간은 온라인을 요구하지는 않지만, 온라인에 가까운 작업을
                   수행한다.

                     준실시간은 온라인에서 고객이 요구하는  더 복 한 이 트를 오프

                   라인과 온라인의 중간 작업으로 해결한다. 예를 들어 고객이 추천 영화

                   를 보면 이를 바로 반영하여 새로운 영화를 추천할 준비를 한다. 그리고



                   오프 인 작업


                                                   학습

                                                 기계학습
                              하이브                 고리
                                      플 스  미스

                                                           오프 인 계산
                                        리 결과
                                                             기계학습
                       하                                      고리
                               그
                                                                출처 : 넷플 스  로그 페이지

               202
   199   200   201   202   203   204   205   206   207   208   209