O nás     Inzerce     KontaktSpolehlivé informace o IT již od roku 2011
Hledat
Nepřehlédněte: Nejlepší IT: Pozoruhodné IT produkty pro rok 2024 podruhé
Správa dokumentů
Digitální transformace
Informační systémy
Hlavní rubriky: Informační systémy, Mobilní technologie, Datová centra, Sítě, IT bezpečnost, Software, Hardware, Zkušenosti a názory, Speciály

Pozoruhodné IT produkty 2024 podruhé
E-knihy o IT zdarma
Manuál Linux

Zapomeňte na BI i na datové sklady tak, jak je znáte

Ještě před několika lety se zdálo, že datový sklad a Business intelligence jsou zlatým grálem IT velkých a úspěšných firem. V důsledku využívání informačních systémů v běžných agendách nejrůznějších organizací vzniklo totiž velké množství dat, u nichž se zdálo být hříchem je dostatečně nevyužít – a datový sklad s BI se zdály dobrým řešením. Touha vytěžit data je tu samozřejmě dodnes – jen prostředky se mění. Z dobrých důvodů.

Když rozvoj technologií posunul IT do takové úrovně, díky níž bylo možné příslušný objem dat efektivně zpracovávat, zdálo se, že řešení je opravdu nadosah. Mnozí se tak rozhodli posbírat data ze všech stran, uložit je do jedné velké jímky a na ni aplikovat dostatečný výpočetní výkon. Tak vznikly datové sklady. Světlo světa spatřila řada technologií určených speciálně pro datawarhousing, datový sklad byl najednou chápán jako jakýsi magický cíl všeho snažení a metodou pokus/omyl se k němu řada firem blížila. Nebo si to alespoň myslela.

Potom ale přišel zásadní zvrat: Vývoj technologií dal IT prostředky do rukou běžným firemním uživatelům - a těm najednou přestalo stačit, že systémy někde nějak pracují, ale začalo je zajímat, k čemu jim budou. Tím správným cílem tak dnes už není mít všechna data ve skladu a objevit jednu verzi pravdy. Manažeři i zaměstnanci na nižších úrovních teď chtějí získat kdykoli a rychle konkrétní informaci, která jim umožní lépe dělat jejich práci.

Cílem tedy není vznik datového skladu. Ten je jenom prostředkem, vlastně jedním z možných prostředků. Cílem je nyní dostat se k užitečné informaci. K takové, která v dané chvíli pomůže. Jen za takovou jsou firmy ochotny vydat peníze.

Demokratizace IT

Jakmile byla překročena hranice, za kterou se začaly informační technologie využívat skutečně masově, objem generovaných či získávaných dat zaznamenal explozivní růst. Internet je samozřejmostí, stejně jako mobilní technologie, chytrá zařízení ve výrobě, v dopravě, v obchodu, v medicíně a dokonce i ve státní správě. Nové informace dnes vznikají a šíří se rychleji, než kdykoli dříve.

Ale to s sebou nutně přináší změnu pohledu na ně. Myšlenka, že je budeme moci pořádně využít teprve tehdy, až je všechny dostaneme do jednoho obrovského skladu, a to poté, co je předtím proženeme čím dál tím komplikovanějšími integračními, ETL a kdovíjakými dalšími systémy a procesy, je zoufale zastaralá. Je to totiž zdlouhavé a dat je navíc už tolik, že to snad ani není možné. Nejen kvůli potřebné kapacitě, ale i kvůli množství jejich forem, formátů, syntaxí, životních cyklů či kvality.

Takže na rovinu: Představa, že jedna technologická platforma obsáhne vše, je zcela iluzorní. Znamenalo by to obrovské náklady s omezeným užitkem.

Hybridní ukládání a inteligentní BI

Až dosud jsme problém definovali, teď se ale pojďme podívat na jeho možná řešení. A začněme u dvou konceptů, které se týkají přístupu k architektuře Business intelligence: Tím prvním je koncept hybridní architektury ukládání dat, která bývá označována také jako postmoderní ukládání dat - post-modern BI storage. Tím druhým pak architektura předsunuté inteligence. Oč jde?

Idea hybridní architektury Business intelligence vychází z přístupu, který zjednodušeně říká, že s bouřlivým vývojem dat nemá cenu bojovat, ale naopak je třeba se snažit z něj vytěžit maximum. Je to podobné, jako se záplavami: Můžete se snažit zadržovat vodu obrovskými přehradami ve zregulovaných řečištích, ale zřejmě to nakonec povede k povodním ještě ničivějším a ještě překvapivějším. Přírodní opatření - suché poldry, pásy vegetace nebo chytré obdělávání půdy - nám umožňují naučit se s hrozbou přicházející velké vody žít a občas ji ještě využít - třeba k udržení vláhy v krajině. A podobně je tomu se záplavou dat.

Nejprve je třeba smířit se s faktem, že jednu verzi pravdy nezískáme díky nacpání všech dat do jednoho všeobjímajícího datového skladu. Existující warehousy není třeba rušit, jako nebudeme bourat přehrady, ale zkusíme je smysluplně využívat. Kromě nich ale budou součástí datové infrastruktury i jiná úložiště, využívající různé metody ukládání a zpřístupňování dat. Ta se budou vzájemně lišit použitými technologiemi a metodami, optimalizovanými pro konkrétní typy dat.

A nadefinujeme si správné priority. Pokročilou technologii, využívající masivního paralelismu a umožňující agresivní mobilizaci výkonu, použijeme pro ukládání těch dat, z nichž se v reálném čase generují informace kritické povahy intenzivně využívané velkým počtem uživatelů. Zde se drahé řešení vyplatí. Data, jež jsou zpracovávána kampaňovitě v měsíčních či kvartálních periodách a nejsou masivně sdílena, necháme klidně na jednodušších platformách, třeba v off-line módu. Pro semistrukturovaná a nestrukturovaná data pak použijeme speciální databáze pracující s texty.

A vypořádat se budeme muset i s celou škálou analytických systémů, které pro svou práci vyžadují přizpůsobené formáty a struktury dat, nebo dokonce pracují s vlastními úložišti. Určitě také budeme muset zachytávat a analyzovat informace z dat jen tak proplouvajících mezi procesy, takzvaných on-line data-streams.

Jak tedy na ukládání dat

Systém ukládání dat, jež je součástí infrastruktury řešení Business intelligence, musí být výsledkem inteligentního procesu návrhu architektury. Na jeho začátku jsou business požadavky, jež se promítnou do požadovaných výstupů řešení. Za nimi pak metody, pomocí nichž budou výstupy určeny (vypočítány), dále požadavky těchto výstupů na data a způsob zpřístupnění těchto dat, který do značné míry definuje způsob jejich uložení. Ten pak bude navržen tak, aby byla v rovnováze informační potřeba s efektivitou vztaženou na přínosy a náklady použité metody.

Výše uvedený přístup se nazývá Informacemi řízený přístup k budování Business intelligence (Information-driven approach, někdy také Analytics-driven approach). A stojí proti klasickému daty řízenému přístupu (Data-driven approach), jenž spočívá ve snaze nejprve posbírat data a pak k nim přidat metody a nástroje - a následně vytvořit informaci, která je předložena uživatelům.

I nový přístup ale samozřejmě má svá úskalí. Opuštěním bezpečí monolitického řešení a uložením dat na více místech jsme se vzdali relativně jednoduchého prostředku udržení konsistence informací, tedy oné slavné jedné verze pravdy. A současně rezignací na možnost umístit do warehousu všechna data vzniká riziko, že uživatele ošidíme o nějakou důležitou informaci, která pak bude navždy ztracena.

Problémy jsou řešitelné

První problém lze řešit takzvaným řízením koordinovanými procesy (Agreed processes), jež je známo jako hlavní princip pro udržení konzistence informací v distribuovaných architekturách datových skladů (jmenovitě sběrnicové architektuře - Bus architecture). Opírá se o konsolidovanou vrstvu metadat a koordinované řízení datových toků (ETL) s podporou kolaborativních technik a technologií i řízení znalostí.

Druhý problém lze řešit za pomoci konceptu předsunuté inteligence. Díky ní bude odfiltrován balast a data ohodnocena podle jejich důležitosti a relevance předtím, než se v hybridní architektuře uloží na určené místo. Jde vlastně o předsunutí části inteligence před datový sklad, byť zde tímto pojmem již neoznačujeme ono jedno všeobjímající úložné místo.

Business intelligence bývá mnohdy chápána jako jakási nadstavba nad datovým skladem a pokročilé analýzy jako jistá třešnička na dortu. Pokud se vám zdá, že nastíněný koncept do jisté míry bourá tradiční paradigma, vězte, že jde jen o zdání: Ve skutečnosti je blíž již dlouho proklamované snaze vytěžit ono bohatství skryté v datech. Zaměřuje se totiž na skutečná data, skutečné uživatele a skutečně potřebné informace.

Autorem článku je Vladimír Kyjonka, BI Business Advisor SAS ČR.

(Partnerský příspěvek.)


(1. 6. 2012 | redakce2)


Tento článek je součástí speciálu:

Podnikový software: Řízení podniku a systémová integrace

Dosáhnout růstu a současně úspor. V organizaci jako celku, ale i v jejím IT. Zdánlivě jsou tyto cíle neslučitelné, ale...


Facebook Twitter
Komentáře, názory a rady

Zatím sem nikdo nevložil žádný komentář. Buďte první...

>>> Číst a vkládat komentáře <<<
©2011-2024 BusinessIT.cz, ISSN 1805-0522 | Názvy použité v textech mohou být ochrannými známkami příslušných vlastníků.
Provozovatel: Bispiral, s.r.o., kontakt: BusinessIT(at)Bispiral.com | Inzerce: Best Online Media, s.r.o., zuzana@online-media.cz
O vydavateli | Pravidla webu BusinessIT.cz a ochrana soukromí | Používáme účetní program Money S3 | pg(469)