Page 77 - 데이터과학 무엇을 하는가? 전자책
P. 77
을 고려해 보는 것도 좋다고 본다.
2. 런타임이 길다는 것을 알고 있는가
하둡은 런타임(Running Time), 즉 실행 시간이 길다. 프로그 실행 결
과가 나오기까지 지연 시간이 긴 것을 고려해야 한다.
시 대한
• 사용자가 얼마나 런타임(실행 시간) 반 시간을 기대하는가
• 어 일 을 치(batch)로 처리할 수 있는가
3. 온라인, 실시간으로 운영해야 하는가
하둡은 배치 모드(batch mode) 환경이다. 즉 새로운 데이터가 유입되면
전체 데이터를 처음부터 다시 작업해야 해서 계속 분석 시간이 늘어난
다. 따라서 실시간 환경에는 적용하기 어렵다.
시
• 데이터의 상호 교환 수준이 어 정도 되기를 사용자가 요구하는가
• 사용자가 라 이트급의 대 데이터를 상호 교환하며 수행하기를 원하는가,
아니면 부분 데이터(subset)를 사용하기 원하는가
75