Page 4 - ITReseller_3-4_2015
P. 4

» WYDARZENIA
Ben Werther – COE Platfora
Hadoop – pieniądze z wielkich danych
Wojciech Urbanek
Jak uporać się z lawinowym przyrostem danych?
W Dolinie Krzemowej coraz bardziej liczą na Hadoopa
Zjednej strony dane stanowią dla biznesu nieocenioną wartość, z drugiej zaś przysparzają mnó- stwo kłopotów. Do tej pory niko- mu nie udało się znaleźć złotego środ- ka, który pozwoliłby ujarzmić cyfro- we zasoby. Czy będzie nim platforma Hadoop? Tego scenariusza nie można wykluczyć, tym bardziej że takie tuzy, jak Amazon, Facebook czy Linkedin, z powodzeniem stosują to rozwiąza- nie. Może już wkrótce ich śladami po- dążą inne przedsiębiorstwa?
Słoń robi furorę
Żółty, sympatyczny słoń o imieniu Ha- doop, niegdyś ulubiona zabawka syna Douga Coutinga, autora projektu, szyb- ko zyskuje zwolenników wśród specja- listów od analizy i gromadzenia data. Dlaczego polubili słonika? Platforma otwiera szerokie możliwości w zakre- sie pracy z dużymi zasobami, poza tym należy do systemów open-source i pra- cuje na standardowych serwerach. To wszystko sprawia, że wdrożenie syste- mu nie wiąże się z horrendalnymi kosz- tami. Wreszcie Hadoop staje się pro- duktem coraz bardziej dopracowanym, którym interesują się nie tylko pasjona-
Tom Reilly – CEO Cloudera
Hadoop posiada rozproszoną struk- turę przechowywania (Hadoop Distri- buted Files System – HDFS) oraz prze- twarzania (map reduce), dzięki czemu bardzo dobrze radzi sobie z obsługą wielkich zbiorów danych. Klaster HDFS składa się z węzła zarządzającego Na- meNode oraz jednostek DataNodes, na których przechowywane są cyfro- we zasoby. Zaletą systemu jest ela- styczność i skalowalność. Ilość węzłów tworzących klaster może dochodzić do kilku tysięcy, co pozwala budować systemy gromadzące petabajty da- nych. Hadoop funkcjonuje, nawet kie- dy niektóre węzły klastra ulegną awa- rii. Trzeba jednak wiedzieć, że system tworzy aż trzy kopie danych, w związ- ku z tym wymaga dużej powierzchni dyskowej. To zła informacja dla szefów IT oraz administratorów, ale jest też i dobra – Hadoop działa na standardo- wych serwerach, użytkownik nie mu- si zatem inwestować w superwydajne maszyny czy macierze SAN.
Zastrzyk od Intela
O ile Linux doczekał się ponad 400 dystrybucji, o tyle Hadoop posiada ich zaledwie kilka, a do najbardziej popu-
ci, ale również wielkie koncerny. Warto przypomnieć, że pierwsza stabilna wer- sja platformy ujrzała światło dzienne w grudniu 2011 roku, niemniej prace nad nią trwają od niemal dekady.
larnych należą Cloudera, Hortonworks oraz MapR Techologies. Wymienione firmy pracują nad rozwojem produk- tu, realizując własne strategie zwią- zane z jego komercjalizacją. Najwię-
4 iT Reseller nr 3-4 (261-262) • marzec 2015


































































































   2   3   4   5   6