Page 26 - ITReseller_kwiecien_2016
P. 26
» WIELKIE ZBIORY DANYCH
Słoń
w centrum
danych
Wojciech Urbanek
Żółty słoń na dobre zadomowił się na Zachodnim Wybrzeżu USA. Czy zaaklimatyzuje się również w Europie?
26 iT Reseller
nr 7-8 (285-286) • kwiecień 2016
Jak poskromić terabajty danych bez wydawania fortuny na systemy high-end? Dostawcy podsuwają różne pomysły, jak zwykle lepsze i gorsze. Do tej pierwszej grupy zalicza się Apache Hadoop. To otwarta platfor- ma programistyczna przeznaczona do równoległego przetwarzania wielkich zbiorów danych, która po raz pierwszy pojawiła się w 2005 r. w Yahoo. Od te- go czasu żółty słonik, symbol platformy, wydoroślał i dojrzał, stając się obiektem pożądania wielu rm. Czym tłumaczyć jego rosnącą popularność?
Biznes od pewnego czasu przejawia spo- re zainteresowanie otwartym oprogra- mowaniem, czego klasycznym przykła- dem jest OpenStack. Niewykluczone, że Hadoop osiągnie zbliżony sukces. Użyt- kownicy platformy nie muszą inwesto- wać w drogi sprzęt, bowiem dane mogą być przetwarzane na zwykłych serwe- rach x86 połączonych w klastry. Hadoop całkiem dobrze radzi sobie z błędami, bowiem każdy plik znajduje się zazwy- czaj w kilku węzłach. Nie bez znaczenia jest fakt, iż słonik korzysta z najlepszych wzorców. Moduły MapReduce i HDFS bazują na architekturze opracowanej i używanej przez Google’a.
Wady? Specjaliści przyznają, że wdro- żenie i uruchomienie systemu nie nale- ży do zajęć łatwych i przyjemnych. Nie- mniej najbardziej popularne dystrybucje dostarczają klientowi przyjazny interfejs i prosty dostęp do rozszerzeń usprawnia- jących przetwarzanie danych. Większość analityków, poza Gartne- rem, widzi przyszłość platformy w ja- snych barwach. W 2012 r. wartość glo- balnego rynku związanego z Apache Hadoop wyniosła 1,5 mld dolarów. Nie jest to wartość, która rzuca na kolana, aczkolwiek według danych Transpa- rency Market Research w 2018 r. przy- chody ze sprzedaży Hadoopa osiągną wartość 21 mld dolarów. Jak łatwo się domyślić, popyt będzie stymulować wzrost danych niestrukturyzowanych generowanych przez gospodarstwa domowe i biznes.
Transparency Market Research zauwa- ża, iż jak do tej pory Hadoop największą popularnością cieszy się za oceanem. Zresztą trzej najwięksi dystrybutorzy Hadoopa – Cloudera, Hortonworks oraz MapR Technologies – wywodzą się właśnie ze Stanów Zjednoczonych.
W Dolinie Krzemowej działa wiele inte- resujących rm wykorzystujących słoni- ka. W marcu spotkałem się z przedsta- wicielami rm Hortonworks, Datame- er oraz Trifacta. Pierwsza z wymienio- nych rm jest dystrybutorem Apache Hadoop, dwie pozostałe udostępniają narzędzia analityczne. Jak postrzegają przyszłość platformy? Jakie są ich plany w zakresie rozwoju oprogramowania? Czy wybierają się do Europy?
Hortonworks łączy dwie platformy
Hortonworks obok Cloudery należy do największych dystrybutorów Hadoopa. W grudniu 2014 r. rma tra ła na giełdę NASDAQ, a w dniu debiutu wyceniono ją na 1,1 mld dolarów. Obecnie jej war- tość oscyluje wokół 638 mln dolarów. Czyżby Hortonworks dopadła zadysz- ka? Zdania w tej materii są podzielone. Część analityków uważa, że model biz- nesowy forsowany przez Hortonworks na dłuższą metę nie zdaje do egzami- nu. Firma nie oferuje płatnych dystry- bucji premium, tak jak najwięksi konku- renci – Cloudera i MapR. Ale nie braku- je też kontrargumentów. Hortonworks potrzebował znacznie mniej czasu niż Red Hat, a nawet Salesforce, żeby prze- kroczyć pułap 100 mln dolarów. Herb Kunitz, prezydent, oraz Justin Sears, dyrektor marketingu, podczas niemal dwugodzinnego spotkania prezen- tują plany dotyczące rozwoju platfor- my oraz liczne przykłady wdrożeń. Biz- nes najwyraźniej się kręci. Herb Kunitz szczególnie dużo miejsca poświęca in- ternetowi rzeczy.
W 2015 r. Hortonworks przejął rmę Onyara, specjalizującą się w groma- dzenia i przesyłaniu w czasie rzeczywi- stym danych pochodzących z różnych źródeł – sensorów, maszyn, urządzeń geolokacyjnych. Pozyskanie start-upu umożliwiło stworzenie unikalnego roz- wiązania łączącego Hortonworks Data Flow 1.2 (należącego do Onyara) i Hor- tonworks Data Platform. Zuni kowana platforma zarządza danymi znajdują- cymi się w ruchu, czyli pochodzącymi z sensorów itp., a także danymi w sta- nie spoczynku. Wymiana różnych ro- dzajów informacji w czasie rzeczywi- stym otwiera nowe możliwości przed branżą przemysłową. Herb Kunitz przy- wołuje przykład z motoryzacji. – Sys- tem pozwala na błyskawiczną analizę