Nejčastější příčiny výpadků datových center a jak jim předcházet



Význam datových center roste ruku v ruce s tím, jak roste význam elektronického byznysu, telekomunikací, mobilního přístupu k datům, využívání velkých objemů dat nebo práce v cloudu. Každý neplánovaný výpadek tak znamená konkrétní ztráty, a to nejen finanční, někdy i zcela zásadního rázu. Za poslední tři toky se přitom výše finančních ztrát přepočítaná na jednu minutu výpadku zvýšila o více než 40 %.

Uvedený údaj vyplývá z průzkumu, který pro společnost Emerson Network Power vypracoval Ponemon Institute. Zkoumáno bylo 67 datových center v USA o minimální velikosti 232 čtvrečních metrů. Jakkoli tedy údaj o finančních ztrátách bude v našich podmínkách pouze orientační, další zjištění už mohou být přímou inspirací.

Počty výpadků a objemy ztrát


Ztráty, resp. vícenáklady spojené s výpadkem datového centra zahrnují jak přímé, tak i nepřímé náklady a náklady ztracené příležitosti; roli hrají mimo jiné zničení zásadních dat, dopad výpadku na produktuvitu organizace, poškození vybavení, právní dopady a dopady spojené s nesplněním regulatorních požadavků nebo ztráta důvěryhodnosti v očích partnerů či zákazníků.

Repondenti výše zmíněného průzkumu zaznamenali za uplynulých 24 měsíců v průměru dva kompletní výpadky datového centra. Částečných výpadků, někdy omezených třeba jen na jednu skříň s vybavením, pak průměrně šest.

83 % respondentů uvedlo, že znají příčinu neplánovaného výpadku. Tři nejčastější příčiny se za poslední tři roky nezměnily: Na prvním místě je s 55 % selhání baterie záložního zdroje, na druhém se 48 % lidská chyba spolu s náhodným nouzovým vypnutím vybavení (EPO) a na třetím překročení kapacity UPS (46 %). Více než třetina tázaných (34 %) uvedla jako příčinu kybernetický útok a 30 % příčinu spojenou s počasím. Více než polovina tázaných (52 %) pak uvedla, že se výpadku dalo předejít.

Nutno dodat že takřka ke zdvojnásobení došlo za poslední tři roky u kybernetických útoků. Tento údaj je varovný pro všechny, kteří ještě takovou příčinu zásadního výpadku podceňují a nepřijímají odpovídající opatření.

Jak výpadkům předcházet 

Některým výpadkům je možné zabránit pečlivějším plánováním a sledováním provozu datového centra. Lidských chyb se pak lze do značné míry vyvarovat vyšší mírou automatizace provozu těchto center. A to především na logické úrovni – maximálně automatizovaným řízením technologií využívaných v rámci cloud computingu - virtualizace, vyvažování zátěže apod.

Současně je třeba přijmout organizační opatření, která mohou zabránit další „populární“ příčině výpadku – chybné překonfiguraci systémů. A automatizovat lze rovněž procesy fyzické vrstvy, u nichž to dává smysl. Do budoucna se hovoří třeba o využití robotů, kteří by místo lidské obsluhy mohli provádět například opravy vadných dílů nebo instalaci nového vybavení.

Příkladem již realizované automatizace datových center mohou být ta společnosti Facebook. Její zástupci se pochlubili, že tu jeden zaměstnanec spravuje nejméně 20 tisíc serverů. K tomu jim pomáhá mimo jiné automatizační software s názvem Cyborg, který sleduje chování jednotlivých serverů a v případě problémů se je snaží automaticky řešit, a to zřejmě poměrně úspěšně. Pokud se mu to nepodaří, informuje správce o situaci, aby mohl problém řešit on.

Analytici si hodně slibují i od řízení jednotlivých součástí infrastruktury prostřednictvím technologií SDx (Software-defined anything , Softwarově definované cokoli); ty by měly znamenat příchod programovatelné IT infrastruktury, takže její funkčnost je pak do značné míry definována otevřeným softwarem. Mohou to být SDN (Software-defined network), SDS (Software-defined storage), SDI (Software-defined infrastructure) nebo konečně i SDDC (Software-defined data center).

Výše ztrát při výpadku datového centra

I když následující data nejsou přímo aplikovatelná v ČR, pro zajímavost je uvádíme: Podle uvedeného průzkumu činí průměrné náklady na výpadek datového centra v USA 7900 dolarů za minutu (jde o 41% nárůst oproti roku 2010). Průměrná délka výpadku činila 86 minut, což znamená průměrné náklady na jeden výpadek ve výši přes 690 000 dolarů. Nejdražší zaznamenaný výpadek pak podle průzkumu přišel příslušnou organizaci na více než 1,7 milionu amerických dolarů.

  


(leden 2014 | redakce2)


Předcházející článek: <<< Optimalizujte počet svých datových center <<<
Následující článek: >>> Efektivnější datová centra: Jak ušetřit na chlazení >>>

Tento článek je součástí speciálu:

Efektivní datová centra: Spolehlivá, úsporná a nepřemnožená


Tentokrát se ve speciálu BusinessIT zaměřeném na datová centra podíváme především na jejich efektivitu, a to z různých úhlů. Bude nás zajímat, jak ušetřit na jejich provozu, ale i to, jaké jsou nejčastější příčiny výpadků a jak jim případně předcházet. Protože podmínkou efektivity datového centra je pochopitelně nejen to, aby nepolykalo zbytečné náklady, ale i to, aby spolehlivě plnilo svěřené úkoly.



Partneři speciálu:








Komentáře, názory a rady

Zatím sem nikdo nevložil žádný komentář. Buďte první...

>>> Číst a vkládat komentáře <<<

Tip - Konference: Firemní informační systémy - 25.5.2017!


Otázky a odpovědi z IT: Diskusní portál Bizio.cz
Pozoruhodné IT produkty pro rok 2017
Věříme, že v tomto přehledu pozoruhodných produktů najdete ty, které vám pomohou ve vaší práci v IT.




Anketa


©2011-2017 BusinessIT.cz, ISSN 1805-0522 | Názvy použité v textech mohou být ochrannými známkami příslušných vlastníků.
Provozovatel: Bispiral, s.r.o., kontakt: BusinessIT(at)Bispiral.com | Inzerce: Best Online Media, s.r.o., zuzana@online-media.cz
Používáme účetní program Money S3
O vydavateli | Pravidla webu BusinessIT.cz a ochrana soukromí | pg(1957)