Page 29 - ITReseller_luty_2016
P. 29

Skalowalne systemy
przechowywania danych
w data center
Krzysztof Sprawnik
Skalowalne systemy (scale-out) składowania danych to koncepcja tworzenia i rozbudowy przestrzeni dyskowej, zakładająca zwiększanie pojemności z jednoczesnym powiększaniem pojemności systemu przez dokładanie kolejnych bloków tworzących macierz. Każdy z bloków tworzących macierz posiada swoje zasoby procesorowe, pamięciowe oraz dyski i przyłącza wejścia/wyjścia, które są ze sobą połączone przy użyciu szerokopasmowych sieci o niskim opóźnieniu.
Systemy typu scale-out są odpo- wiedzią na przyrost danych po- chodzących z najprzeróżniej- szych źródeł, używających różno-
rodnych protokołów dostępu czy nie- ustrukturalizowanych formatów da- nych. Na przykład macierz plikowa po- winna umożliwiać łatwą rozbudowę, automatyczne dostosowanie obciąże- nia do zmiennych warunków pracy oraz umożliwiać wymianę informacji między różnorodnymi systemami.
Przykładem takiej macierzy jest EMC Isilon – macierz, która dzięki unikatowe- mu systemowi plików OneFS umożliwia składowanie danych w ogromnych ilo- ściach, przy użyciu różnorodnych proto- kołów dostępu – nfs, rest api, smb, fttp, http czy hdfs. Dzięki zastosowaniu takie- go podejścia dzielenie się wiedzą i infor- macjami w organizacji staje się łatwiej- sze – EMC definiuje takie rozwiązanie ja- ko „Data Lake”. Jest to rezerwuar danych, który można dopasować w elastyczny sposób przy jednoczesnym zachowaniu spójności i bezpieczeństwa przechowy- wanych informacji. Rozbudowa takiego systemu odbywa się przez dołączanie kolejnych elementów, które razem two- rzą jeden ciągły system plików. Zarządzanie systemem odbywa się za pomocą łatwego do opanowania gra- ficznego interfejsu użytkownika lub przy użyciu rest api, który umożliwia za- równo integrację z innymi systemami
(integracja zarządzania), jak i dostęp do danych składowanych na macierzy. Ca- łość jest połączona przy użyciu sieci In- finiband, zapewniającej szybki transfer informacji między węzłami klastra przy jednoczesnym zminimalizowaniu opóź- nień wynikających z rozproszonej archi- tektury systemu.
Macierz Isilon produkcji EMC jest świet- nym przykładem skalowalnego syste- mu przechowywania plikowego. Nie oznacza to, że nie istnieją blokowe systemy przechowywania informacji. Sztandarowym przykładem skalowalnej macierzy blokowej jest XtremIO – wy- sokowydajna, automatycznie strojąca się macierz dyskowa, wykorzystująca wyłącznie nośniki flash.
EMC XtremIO to innowacyjna koncep- cja zapisu danych na dyskach półprze- wodnikowych, których konstrukcja i sposób wykorzystania są inne niż zwy- kłych dysków obrotowych. Pod uwagę należy wziąć przede wszystkim sposób kasowania danych – przy użyciu stron – oraz brak opóźnień związanych z obra- cającym się dyskiem. Macierz XtremIO wykorzystuje unikalny sposób organi- zacji danych na dyskach – przy użyciu zaawansowanych i zoptymalizowanych pod kątem pracy z dyskami SSD algo- rytmów deduplikacyjnych i kompre- sji. Urządzenie analizuje przychodzące bloki danych i jednocześnie zapisuje na dyskach wyłącznie unikalne porcje da-
nych, przy równomiernym zapisie da- nych pomiędzy wszystkimi dostępnymi dyskami w macierzy.
XtremIO jest zbudowana z użyciem blo- ków, zwanych X-Brick. W każdym z ta- kich bloków znajduje się półka dyskowa, dwa kontrolery oparte na otwartym sys- temie operacyjnym Linux oraz zestaw baterii podtrzymujących pamięć kon- trolerów. Każdy z kontrolerów jest wy- posażony w przyłącza FC, iSCSI, RDMA do komunikacji wewnątrz X-Brick oraz Infiniband do realizacji połączeń w ra- mach macierzy. Rozbudowa pojemno- ści i wydajności odbywa się przez do- danie kolejnego modułu i podłączenie go do infrastruktury. Dane zostają auto- matycznie rozlokowane tak, aby maksy- malnie zwiększyć wielościeżkowość do- stępu zarówno po stronie dysków, jak i przyłączy. Taka konstrukcja macierzy umożliwia osiąganie wysokiej wydaj- ności przy jednoczesnym przewidywal- nym czasie odpowiedzi i zwiększonym czasie życia dysków SSD.
Jednym z aspektów, które piszący te sło- wa bardzo docenia w skalowalnych sys- temach przechowywania danych, jest ich modularność. S4E często wypożycza sprzęt do różnorodnych testów – trze- ba przyznać, iż logistyka kilku standar- dowych pudełek EMC Isilon (2U wyso- kości) jest zdecydowanie łatwiejsza niż jednego dużego pudła z klasyczną ma- cierzą Unified. w
nr 3–4 (281–282) • luty 2016
iT Reseller 29


































































































   27   28   29   30   31