Page 28 - ITReseller_kwiecien_2016
P. 28
» WIELKIE ZBIORY DANYCH
Naszą rolą jest zbudowanie mostu łączącego surowe dane z zasobami gotowymi
do analizy
i konsumpcji – tłumaczy Adam Wilson, CEO firmy Trifacta
pu produktów korzystają nieliczni, oce- nia się, że jest to około 5 proc. poten- cjalnych użytkowników. Trifacta obsłu- guje ponad 10 tys. osób w 3 tys. rm, w tym PepsiCo, Orange, EMC, Linkedin czy GoPro. – Ciekawym przykładem jest PepsiCo, rma z bogatą ofertą produk- tów i ogromną ilością detalistów, rozsia- nych po całym świecie. Dużą część ich pracy stanowi przewidywanie popytu. Muszą obserwować zmiany pogodo- we, ekonomiczne, uwzględniać specjal- ne wydarzenia itp. PepsiCo wykorzysty- wało do tego celu Excel, Access i Table- au, zbierając informacje z POS, które jak łatwo się domyślić, występowały w róż- nych formatach. Po wdrożeniu naszego systemu czas raportowania skrócił się o 70 proc., a tworzenia analiz o 90 proc. – opowiada Adam Wilson. Ile kosztu- ją takie porządki? Trifacta sprzedaje oprogramowanie w modelu subskryp- cyjnym, a ceny zaczynają się od 20 tys. dolarów rocznie. Niemniej rma oferu-
programiści z Niemiec, Czech oraz Pol- ski – dodaje Groschupf. Start-up, funk- cjonujący od 2009 r., posiada też biu- ra w San Francisco, Nowym Jorku, Sin- gapurze, Istambule, Londynie i Berlinie. W sumie rma zatrudnia 175 osób.
Trifacta czyści dane
– Osiemdziesiąt procent czasu zwią-
dużego banku, który wykorzystuje 136 różnych systemów BI oraz rozwiązań do raportowania.
Wprawdzie istnieją tradycyjne narzę- dzia ETL, aczkolwiek coraz częściej spo- tykają się one z krytyką ze strony start- -upów. Młodzi producenci Datame- er, Tamr, Paxata czy Trifacta, aby przy- spieszyć proces czyszczenia, stosują
28 iT Reseller
nr 7-8 (285-286) • kwiecień 2016
zanego z analizą danych pochłania ich przygotowanie – przyznaje Adam Wil- son, CEO rmy Trifacta, konkurującej z Datameer. W epoce wielkich zbiorów danych wiele mówi się o niepokoją- cym wzroście cyfrowych zasobów. Ale tak naprawdę to tylko jedno z wielu wy- zwań stojących przed działami IT. Nie mniej ważną kwestią jest oddzielenie ziaren od plew, czyli wyodrębnienie da- nych z zewnętrznych źródeł, a następ- nie ich analiza. W sytuacji kiedy znajdu- ją się na różnych systemach, występują w rozmaitych formatach, ich uporząd- kowanie, a następnie połączenie i uży- teczne wykorzystanie może być praw- dziwą drogą przez mękę. Adam Wilson podaje przykład jednego z klientów –
tzw. maszynowe uczenie (machine le- arning). Natomiast Hadoop jest wyko- rzystywany jako repozytorium danych. – Naszą rolą jest zbudowanie mostu łą- czącego surowe dane z zasobami go- towymi do analizy i konsumpcji – tłu- maczy Adam Wilson. Oprogramowanie Trifacta Wrangler wyławia dane z sys- temów, następnie przeprowadza ich strukturyzację, czyszczenie, wzbogaca- nie, walidację.
Według Gartnera najbliższe lata przy- niosą wzrost zapotrzebowania na opro- gramowanie służące do przygotowania danych. W 2019 r. ten segment rynku osiągnie wartość 1 mld dolarów, a sku- mulowany roczny wskaźnik wzrostu wyniesie 16,6 proc. Obecnie z tego ty-
je także bezpłatną, okrojoną wersję na desktop.
Przyjechali do Europy
Młodzi gracze zza oceanu poważ- nie myślą o Europie. Każda z trzech wymienionych firm może się już po- chwalić wdrożeniami na Starym Kon- tynencie. Niewykluczone, że wkrót- ce zawitają do Polski, choć nie ma co ukrywać, że na razie bardziej interesu- ją ich klienci z zachodniej części na- szego kontynentu. Warto dodać, że w połowie kwietnia firmy Datameer, Hortonworks i Trifacta były uczestni- kami Hadoop Summit w Dublinie. Kto wie, może słonik na dobre zadomowi się w Europie. w