Page 24 - ITReseller_kwiecien_2016
P. 24
» WIELKIE ZBIORY DANYCH
główną rolę odgrywa informacja i do- stęp do danych, z których trzeba wydo- być wartość biznesową. To właśnie da- ne są nową ropą naftową – jak w 2006 r. ładnie ujął to Clive Humby.
– Pracownicy sektora big data są spe- cjalistami od pozyskiwania, analizowa- nia, segmentowania i interpretowania informacji, jakie internauci pozosta- wiają po sobie w witrynach. Ich wiedza jest kombinatem wiadomości z zakresu ekonomii, matematyki, statystyki oraz nowych technologii. Właśnie do tych nauk nawiązuje termin „scientist” (na- ukowiec, badacz) używany w nazwie tego zawodu – tłumaczy Piotr Prajsnar, CEO Cloud Technologies.
Jak wynika z raportu McKinsey Global In- stitute, badacz danych już teraz jest jed- nym z najbardziej pożądanych zawodów nie tylko w USA, ale na całym świecie. Do 2020 r. na amerykańskim rynku pracy 1,5 mln wolnych stanowisk będzie cze- kać na obsadzenie przez specjalistów od big data, a cały de cyt stanowisk związa- nych z rozwiązaniami big data może się- gnąć nawet ponad 4 mln.
Magister big data
Brak analityków danych dostrzegły już amerykańskie uczelnie wyższe. W od- powiedzi na alarmujące sygnały wysy- łane ze środowisk biznesowych włączy- ły do swojej oferty edukacyjnej studia dedykowane zagadnieniom big data. I tak na przykład Uniwersytet w Iowa uruchomił w 2013 r. kierunek Analityka biznesowa i systemy informacyjne. Na pierwszy rok studiów zapisało się po- nad 170 słuchaczy.
Na polskim rynku, który mimo wszyst- ko jeszcze raczkuje w tej dziedzinie, również odczuwalny jest brak bada- czy danych. Już obecnie na portalach z ogłoszeniami o pracę coraz częściej poszukiwane są osoby z doświadcze- niem w zakresie rozwiązań big data. Zapotrzebowanie zgłasza sam biznes. Według badania InsightExpress 8 na 10 polskich menedżerów IT sądzi, że big data będzie stanowiło trzon strate- gii ich przedsiębiorstw w ciągu najbliż- szych pięciu lat.
W polskiej nauce pierwsze oznaki za- interesowania potencjałem tej branży są już widoczne. Szkoła Główna Han- dlowa w październiku ub.r. uruchomi- ła pierwszą edycję dwusemestralnych
studiów podyplomowych: Inżynieria danych – big data. Koło Statystyki i De- mogra i SGH organizuje konferencje przybliżające tę tematykę zaintereso- wanym studentom. Podobnie Instytut Podstaw Informatyki PAN zachęca do podjęcia studiów podyplomowych na kierunku Metody i narzędzia nowocze- snej analizy danych w biznesie. Z kolei Politechnika Warszawska od 2012 r. or- ganizuje seminaria poświęcone tej te- matyce.
Big data = big money?
Oprócz obiecujących perspektyw za- wodowych kuszą także zarobki. Frank J. Ohlhorst, dziennikarz IT, zaczął zajmo- wać się tematyką big data, zanim jesz- cze stało się to modne. W książce Tur- ning Big Data into Big Money przywo- łał zasadę 4V, za której sprawą big data może (ale wcale nie musi) generować wielkie pieniądze (big money).
– Te 4V to: volume (ogromna ilość da- nych), variety (ogromna ich różnorod- ność), veracity (wiarygodność danych) oraz velocity (zawrotna szybkość ich generowania). Te cztery czynniki skła- dają się na wartość danych zarówno w sensie merytorycznym, jak i czysto nansowym – tłumaczy Łukasz Kapu- śniak, Chief Big Data O cer w Cloud Technologies.
Ohlhorst jednak nie odpowiedział wprost na pytanie – ile można zarobić na danych. Pokazuje raczej, na czym należy się skupić, żeby móc na nich za- robić. O oszacowanie średnich wyna- grodzeń badaczy danych w USA po- kusił się portal DataJobs. Według jego analityków zarobki specjalisty ds. big data w USA wahają się w granicach 50– 75 tys. dolarów rocznie. W przypadku doświadczonych analityków mówimy już o widełkach 65–110 tys. dolarów. Z kolei według Burtch Works mediana zarobków badacza danych ze stażem do trzech lat, który może pochwalić się dyplomem uniwersyteckim, dobrą znajomością języków programowania oraz metod statystycznych, wynosi 80 tys. dolarów. Pracujący w branży dłu- żej mogą liczyć nawet na 150 tys. dola- rów. W USA są to już zarobki porówny- walne do pensji lekarzy czy prawników, a także wyspecjalizowanych programi- stów. W kraju nad Wisłą w dostępnych raportach płacowych takie zawody, jak
big data scientist czy big data architect, praktycznie nie występują i dlatego trudno na razie określić wynagrodzenia badaczy danych, których często kwali- kuje się do tej samej grupy wynagro- dzeń co np. programistów.
Epoka big (i smart) data
Przed nami implozja big data, rosną- cych dziś w tempie dwucyfrowym, zaś dynamika ich wzrostu przekracza 40 proc. w skali roku. Wikibon prognozu- je, że do 2017 r. wartość całego rynku osiągnie 47 mld dolarów. Już dziś nale- żałoby mówić może nie tyle o „big”, co o „huge data”. Jak przewiduje Oracle, do 2020 r. sieć będzie dziewięciokrot- nie większa niż obecnie – wygeneruje- my ponad 45 zetabajtów danych (obec- nie to około 6 ZB). IDC przelicza, że na jednego mieszkańca ziemi przypadnie wówczas ponad 5,2 GB danych. Obec- nie wykorzystujemy stosunkowo nie- wielką część danych, średnio 20 proc. całego wolumenu big data. Według IDC do 2020 r. będzie to już 30 proc. Według prezesa Google w 48 godzin produkujemy w internecie więcej da- nych niż od początku powstania cywili- zacji do 2003 r.
Dark & Dirty Data – ciemna strona danych
Ciemne (dark) i brudne (dirty) dane zalewające dziś internet spędzają sen z powiek analitykom i marketerom. We- dług szacunków IDC około 90 proc. da- nych w internecie to dark data, a blisko 10 proc. wszystkich danych w mediach społecznościowych – dirty data. Ciemna strona tych danych polega nie tylko na tym, że są zbiorem pełnym cha- osu, lecz również na dobrą sprawę nie wiadomo, co w sobie kryją. Mogą być jak puszka Pandory, ale także okazać się żyłą złota, zawierając informacje, któ- re z powodzeniem organizacje mogą zmonetyzować bądź wykorzystać do uzyskania pełnego pro lu klienta.
Dark data liczy się już w zetabajtach. Według obliczeń IDC w 2015 r. aż 90 proc. danych wygenerowanych w sie- ci stanowiły chaotyczne i nieuporząd- kowane dane. Niepodjęcie wysiłku ich analizy i próby odczytania zakodowa- nych w nich informacji dla biznesu mo- że oznaczać utratę szansy na lepsze poznanie swojego klienta, a co za tym
24 iT Reseller
nr 7-8 (285-286) • kwiecień 2016