Page 25 - ITReseller_kwiecien_2016
P. 25
MEGAEKSPLOZJA DANYCH I APLIKACJI
v 277 RAZY WIĘCEJ DANYCH będzie generowanych przez przedmioty podłączone do IoT niż przez użytkowników
v 30 MLN NOWYCH URZĄDZEŃ podłączanych do sieci co tydzień v 180 MLD MOBILNYCH APLIKACJI zostało pobranych w 2015 r. v 78 PROC. OBCIĄŻEŃ będzie przetwarzanych w chmurowych
centrach danych do 2018 r.
v PONAD 5 TB DANYCH na osobę będzie przypadać do 2020 r. v 500 MLD PRZEDMIOTÓW będzie podłączonych do sieci
do 2020 r.
idzie – możliwości wery kacji bizne- sowej strategii rmy czy wzmocnienia działań CRM-owych.
Żeby nie utonąć i poradzić sobie z za- lewem dirty i dark data, warto poprosić o pomoc właśnie badaczy danych, po- sługujących się specjalistycznymi narzę- dziami analitycznymi, takimi jak np. sil- niki behawioralne, które analizują ano- nimowe dane o użytkownikach wielo- płaszczyznowo i z wielu źródeł.
Więcej o dark & dirty data zalewają- cych dziś internet można przeczytać na blogu it- lolog.pl: http://it- lolog. pl/dark-dirty-data-czyli-ciemna-stro- na-danych/.
Digital dark age?
W kwietniu 2015 r. Vinton Gray Cerf, „ojciec internetu” i wiceprezydent Go- ogle, przemawiając do zgromadzonych w San Jose członków American Asso- ciation for the Advancement of Scien- ce, ostrzegał przed nadchodzącymi „cy- frowymi ponurymi wiekami”. Jako głów- ny katalizator Digital Dark Age wymienił implozję danych (big data), zdominowa- nych przez dark data, czyli dane nieupo- rządkowane, nieustrukturyzowane, nie- przetworzone i surowe. Podkreślał, że to właśnie inwazja dark data jest dziś naj- większym wyzwaniem stojącym przed analitykami danych. Od wyniku tej kon- frontacji będzie zależała przyszłość wie- lu cyfrowych biznesów.
Dark data to wciąż stosunkowo słabo eksplorowany obszar, nie tylko w sen- sie praktycznym, ale i teoretycznym, stąd pojawia się wiele różnych de nicji tego rodzaju danych. Gartner w swoim słowniku IT (Gartner IT Glossary) określa je jako: „Zasoby informacyjne, groma- dzone i przetwarzane przez organiza- cje podczas ich codziennej aktywno- ści biznesowej, które na ogół nie nada-
ją się do wykorzystania w żadnym sen- sownym celu”. Natomiast Cory Janssen w Techopedii pisze: „Dark data to ro- dzaj nieustrukturyzowanych, nieotago- wanych i niewykorzystanych danych, które zalegają w repozytoriach danych i nie są analizowane ani przetwarzane. Można je znaleźć w plikach dziennika (log les) oraz archiwach danych, prze- chowywanych w dużych przedsiębior- stwach”.
O ile dark data można by określić ja- ko „zmarnowany potencjał”, o tyle już dirty data można porównać do inter- netowego trolla big data marketingu. Jeżeli ze zbiorów dark data za pomocą odpowiednich narzędzi analitycznych można wydobyć informacje, wzorce i zależności, to w przypadku dirty data mamy do czynienia z totalnym cyfro- wym bezładem. Media społecznościo- we (głównie Facebook) to największe generatory i kopalnie danych o inter- nautach.
Według analiz Networked Insights bli- sko 10 proc. takich danych nadaje się do wyrzucenia, ponieważ nie pocho- dzą od realnych użytkowników. Są generowane przez sztuczne boty (53 proc.), ruch wytwarzany przez spame- rów lub osoby opłacane przez konku- rencyjne firmy (23 proc.) bądź przez nieaktywne konta (11 proc.). W wy- niku takiego „zatruwania danych” po- wstają dirty data, które wprowadzają w błąd przede wszystkim marketerów, dostarczając im bezużyteczne infor- macje.
Już teraz od 50 do nawet 80 proc. cza- su, jaki badacze danych spędzają w r- mach nad analizą dużych zbiorów da- nych (big data), pochłania „oczyszcza- nie danych z dirty data”. W żargonie analitycznym określa się to jako janitor work, czyli pracę „dozorcy” lub „woźne-
go” danych, choć pasowałoby tu raczej określenie „dirty job”.
Niepokojące jest też to, że udział dirty data w ogólnym strumieniu big data w sieci w ostatnim roku wzrósł aż o 658 proc. Niektóre rmy przyznają wprost, że nawet 90 proc. postów na ich fanpa- ge’ach w mediach społecznościowych spokojnie mogą zaklasy kować jako śmieciowe. Dirty data zanieczyszczają wartościowe big data, które stanowią dla marketerów najważniejsze źródło informacji o klientach, ponieważ doty- czą ich intencji, gustów i zachowań.
Dane – nowa waluta epoki cyfrowej
Wartość anonimowych danych zgro- madzonych o internautach z Unii Eu- ropejskiej w 2020 r. zbliży się do okrą- głego biliona euro – szacują eksperci Boston Consulting Group w swoim ra- porcie The Value of Our Digital Identity. Oznacza to, że wartość cyfrowych śla- dów pozostawionych przez Europejczy- ków w sieci będzie odpowiadała około 8 proc. PKB krajów całej Unii.
Według badań Gartnera wydatki na analitykę danych już teraz rosną w tem- pie dwucyfrowym. Do 2017 r. 30 proc. danych, jakimi będą dysponowały przedsiębiorstwa, będzie pochodzi- ło z hurtowni big data. IDC podaje, że już teraz 70 proc. dużych rm korzy- sta z danych o użytkownikach groma- dzonych i przetwarzanych przez ze- wnętrzne platformy big data. Zdaniem analityków IDC do 2019 r. tym tropem pójdą wszystkie duże organizacje. Co- raz więcej rm będzie także monety- zować własne zbiory danych, podwa- jając inwestycje w analitykę big data oraz wyszukując unikatowe dane, które pozwolą im na uzyskanie biznesowej przewagi nad konkurencją.
– Obecnie dostępne narzędzia big data są niewystarczające, by móc dostatecz- nie dobrze biznesowo wykorzystywać mocno rozproszone dane i aplikacje. Potrzebne są nowe rozwiązania, łączą- ce pełne możliwości centrów danych, chmury, narzędzi big data oraz interne- tu rzeczy, które pozwolą uporządkować hiperrozproszone procesy biznesowe – przekonywał podczas konferencji Ne- tApp Insight 2015 Peder Ulander, wice- prezes ds. portfolio i strategii w zakresie rozwiązań chmurowych Cisco. w
nr 7-8 (285-286) • kwiecień 2016
iT Reseller 25