Page 77 - 데이터과학 무엇을 하는가? 전자책
P. 77

을 고려해 보는 것도 좋다고 본다.


                       2. 런타임이 길다는 것을 알고 있는가

                       하둡은 런타임(Running Time), 즉 실행 시간이 길다. 프로그  실행 결

                     과가 나오기까지 지연 시간이 긴 것을 고려해야 한다.




                           시   대한

                        • 사용자가 얼마나    런타임(실행 시간) 반  시간을 기대하는가
                        • 어  일 을  치(batch)로 처리할 수 있는가





                       3. 온라인, 실시간으로 운영해야 하는가

                       하둡은 배치 모드(batch mode) 환경이다. 즉 새로운 데이터가 유입되면
                     전체 데이터를 처음부터 다시 작업해야 해서 계속 분석 시간이 늘어난

                     다. 따라서 실시간 환경에는 적용하기 어렵다.





                         시
                        •   데이터의 상호 교환 수준이 어  정도 되기를 사용자가 요구하는가

                        •   사용자가  라 이트급의 대  데이터를 상호 교환하며 수행하기를 원하는가,
                          아니면 부분 데이터(subset)를 사용하기 원하는가











                                                                                  75
   72   73   74   75   76   77   78   79   80   81   82