S pojmem Business Intelligence (BI) se v průběhu posledních let setkáváme čím dál tím častěji a s trochou nadsázky se dá říct, že už nám téměř zlidověl. Ohánějí se jím nejen dodavatelé nejrůznějších informačních systémů a zástupci konzultačních firem, ale také výše či níže postavený management společností téměř libovolné velikosti. I přesto je pro spoustu lidí problematika BI zahalena rouškou tajemství a oni pouze tuší, k čemu je celá ta věc dobrá, jak vlastně funguje a jaký užitek by právě jim mohla přinést.
Co je to BI
Snad každá společnost či organizace dnes používá jeden či více informačních systémů, které jim pomáhají automatizovat každodenní činnosti z oblasti jejich podnikání. Jako příklad bychom mohli uvést třeba řízení a monitorování technologických procesů, výrobu, nákup a prodej zboží, mzdovou a účetní agendu či skladové hospodářství. Informační systémy ukládají data do transakčních databází označovaných často zkratkou OLTP (z anglického On-Line Transaction Processing), které jsou určeny pro zpracování velkého množství současně probíhajících transakcí (operací nad daty). Hlavním úkolem provozních informačních systémů je zajistit chod nejrůznějších procesů potřebných pro danou oblast podnikání. Bez informačního systému propojeného s transakční databází by třeba obchodní řetězec neprodal ani rohlík, banka by neprovedla žádnou finanční transakci a letecká společnost by nepřepravila žádného pasažéra. Denně se tak generuje nepředstavitelné množství dat, přičemž historická data obvykle nejsou pro zajištění běhu procesů potřebná. Abychom mohli prodat výrobek, nepotřebujeme znát jeho skladové zásoby, ani cenu před rokem, ale musíme mít k dispozici čísla aktuálně platná.
Historická data však skrývají velice cenné informace, díky kterým můžeme sledovat, jak naše podnikání prosperuje a plní očekávání, odhalit skryté rezervy, pochopit, co se děje a proč tomu tak je. Cesta k těmto informacím však není jednoduchá a přímá. Pro jejich získání a následné využití je třeba velký objem dat nashromážděných v nejrůznějších informačních systémech organizace důkladně zpracovat a analyzovat.
Tím se dostáváme k vlastní podstatě Business Intelligence. Pod tímto pojmem se skrývá aplikace poznatků a znalostí získaných analýzou dat ke zkvalitnění procesu rozhodování v rámci celé organizace, zlepšení výsledků její činnosti a zvýšení konkurenceschopnosti na trhu. Jedná se o relativně mladou disciplínu zahrnující širokou škálu aplikačních programů a technologií pro získání, uložení, analýzu a zpřístupnění informací uživatelům. Do oblasti BI můžeme zahrnout nejrůznější formy reportování, online analýzy, statistické analýzy, predikce a dolování dat – tedy aktivity, které obecně podporují strategické rozhodování v organizaci.
K čemu se BI používá
Oblastí, ve kterých je možné technologii BI nasadit a následně z ní profitovat, je opravdu mnoho. S trochou nadsázky lze říci, že její použití může své ovoce přinést všude tam, kde se vyskytují nějaká smysluplná data. Ze širokého spektra možných aplikací BI bychom jako typické příklady mohli uvést sledování nejrůznějších výkonnostních ukazatelů organizace, optimalizaci vnitrofiremních procesů, analýzu výroby a prodeje, stanovení sortimentu a cen pro maximalizaci zisku, finanční analýzy, vyhodnocení míry plnění stanovených cílů, monitorování skladového hospodářství, kontrolu výkonu zaměstnanců a jejich odměňování, zaměření reklamní kampaně na nejvhodnější segment trhu, její následné vyhodnocení a mnohé další.
Jedním z praktických příkladů aplikace BI může být sledování profitability výrobků. Vžijme se na chvíli do role analytika pracujícího v obchodní firmě, která prodává výrobky nakoupené od různých dodavatelů. Naším úkolem je zjistit, na kterých výrobcích a kolik vyděláváme. Na první pohled jednoduchý úkol – stačí z podnikového informačního systému zjistit, za kolik daný výrobek nakupujeme a za kolik jej prodáváme. Zjistíme ale, že na daný výrobek máme více faktur od různých dodavatelů a přitom každou s jinou jednotkovou cenou! No nevadí, vezmeme tedy cenu průměrnou. Jenže pak tu máme fakturu za dopravu. Rozpočítáme ji tedy dle počtu kusů na jednotlivé výrobky v dodávce. Dále je tu clo, které musíme do nákladů také zahrnout. Teď už zbývá jenom zohlednit náklady na zaúčtování faktur, naskladnění a skladování. Nesmíme také zapomenout rozpočítat poplatky za energie a konečně jsme snad dospěli k celkovým nákladům na pořízení výrobku. Nyní je potřeba vzít částku na straně příjmů, tedy cenu fakturovanou zákazníkovi, a ponížit ji o náklady související s vyskladněním a doručením zboží, odměnami prodejců, fakturací a podobně. Po několika hodinách usilovné práce setřeme pot z čela, neboť s jedním výrobkem jsme hotoví a můžeme se pustit do dalšího... Pro existující BI řešení je ale takový úkol hračka. Profitabilitu výrobků sledujeme pomocí grafického indikátoru zobrazeného v reportu a ihned jedním pohledem zjistíme, je-li daný výrobek ziskový a jestli se jeho ziskovost pohybuje ve stanovených mezích. Díky všem potřebným informacím na jednom místě bude příště snadné správně se rozhodnout, zdali se výrobek vyplatí za konkrétní cenu nakoupit.
Další ilustrativní příklad přínosu BI bychom nalezli třeba v oblasti pojišťovnictví při odhalování pojišťovacích podvodů. Na základě charakteristik již prokázaných případů dokáže BI pro nové pojistné události rychle určit, zda se jedná o další podvod či nikoliv.
Jak BI pracuje
Z pohledu architektury se tradiční BI řešení skládá z několika základních komponent. Jejich vazby přehledně zobrazuje následující schéma.
Data ze zdrojových systémů jsou pomocí procesů ETL plněna do datového skladu, nad kterým je pro zrychlení analýzy postavena databáze OLAP. Interakci BI řešení s koncovým uživatelem pak zprostředkovávají klientské aplikace. Podívejme se teď blíže na jednotlivé stavební kameny řešení.
Zdrojové systémy
Jak již bylo řečeno, data z informačních systémů jsou typicky ukládána v transakčních databázích. Jejich struktura není ale k analýze dat vhodná, protože je optimalizovaná pro zpracování velkého množství transakcí. Data jsou v databázích OLTP z důvodu odstranění redundancí typicky ukládána ve značném počtu vzájemně provázaných tabulek. Získat z takové databáze například odpověď na otázku: Jaký byl objem prodeje v daném regionu v daném časovém období ve srovnání s předešlým rokem?, znamená propojit řadu tabulek a agregovat velmi mnoho záznamů. Dnešní relační databázové stroje si sice s takovým úkolem poradí; na odpověď však budeme muset dlouho čekat a navíc výsledek bude databázový server počítat na úkor ostatních úloh, tedy transakcí zajišťujících skutečný chod podnikových procesů. To může vést k jejich zpomalení nebo dokonce dočasnému zastavení, což je z pochopitelných důvodů v lepším případě nežádoucí, v tom horším nepřípustné.
Krom toho jsou data ve většině organizací uložena v nejrůznějších systémech, které využívají rozmanitých platforem a mezi nimiž typicky není žádná přímá vazba. Data získaná z těchto systémů nejsou proto bez dalšího zpracování konzistentní a lze je jen obtížně použít pro získání správných a smysluplných informací.
Datové sklady
Řešením odstraňujícím problémy s různorodými zdroji je spolehlivé centrální úložiště konzistentních a důvěryhodných dat, známé jako datový sklad (označovaný zkratkou DW z anglického Data Warehouse). Ten je základem architektury BI, protože poskytuje „jednu verzi pravdy“ pro celou organizaci.
Datový sklad typicky obsahuje veškerá data dostupná v podniku, a to jak aktuální, tak i historická. Jedná se sice o relační databázi, její struktura je však optimalizovaná pro datové analýzy. Aby bylo možné informace z datového skladu získávat rychle, jsou tabulky organizované ve strukturách připomínajících hvězdu. Tato struktura umožňuje získat potřebné informace bez nutnosti spojení velkého množství tabulek. Uprostřed hvězdy je takzvaná faktová tabulka obsahující sledované číselné hodnoty určené k analýze, kterým říkáme měřítka. Měřítkem může být například počet prodaných kusů, obrat prodeje, zisk nebo třeba zůstatek prostředků na účtu. Na faktovou tabulku jsou navázané další tabulky, takzvané dimenze. Každá dimenze popisuje některou z entit vyskytujících se v daném oboru podnikání, jako je třeba produkt, čas nebo region. Dimenze dávají význam jednotlivým číselným hodnotám uloženým v tabulce faktů. Ke konkrétnímu počtu prodaných kusů tak z dimenzí vyčteme informaci jakého produktu, v jakém časovém období a ve kterém regionu se daný počet kusů prodal.
Data v datových skladech se na rozdíl od databází OLTP nemění a používají se jen ke čtení. Výjimkou z tohoto pravidla je plnění nových dat, které se provádí v pravidelných intervalech tak často, aby byly splněny požadavky na aktuálnost informací pro účely analýzy. Zdaleka nejčastěji používané je plnění na denní bázi, kdy je možné analyzovat data z předešlého dne.
Procesy ETL
Pro automatizované plnění datového skladu daty z heterogenních datových zdrojů se používají nástroje označované zkratkou ETL (Extract, Transform and Load). Zdrojové systémy velice často dostatečně nekontrolují, zda zadané údaje splňují nutné podmínky pro platnost, jestli jsou vzájemně konzistentní nebo zda nejsou duplicitní. Úlohou procesů ETL je tak nejen načtení dat ze zdrojových systémů a jejich uložení do centrálního datového skladu, ale zejména jejich konsolidace a integrace, validace, čištění a transformace tak, aby datový sklad obsahoval pouze správná a důvěryhodná data. Ta jsou klíčem k získávání přesných výstupů z BI řešení a jedině na jejich základě lze pak přijímat správná rozhodnutí. U složitějších procesů ETL se můžeme často setkat s dočasným úložištěm dat označovaným většinou jako staging area, ve kterém probíhá část transformací. Toto úložiště mimo jiné umožňuje jednou načtená data opětovně v transformacích využít bez nutnosti zatěžovat opakovaně zdrojové systémy OLTP.
Databáze OLAP
Pro rychlé vyhodnocení komplexních a jednorázových analytických dotazů jsou data z datového skladu ukládána v OLAP databázi (z anglického On-Line Analytical Processing), někdy též označované jako multidimenzionální. Jádrem databáze OLAP je jedna nebo více datových kostek, které modelují data z tabulek faktů a dimenzí do logického vícerozměrného prostoru, ve kterém je během analýz možné se snadno a intuitivně pohybovat a měřitelné jednotky obchodování zkoumat z nejrůznějších pohledů.
Odezva databáze OLAP při dotazování bývá typicky o několik řádů rychlejší než vyhodnocení odpovídajícího dotazu v relační databázi. Je to především díky tomu, že datová kostka v sobě uchovává již agregované hodnoty a informace ukládá v optimalizovaném formátu. Při dotazu na počet prodaných kusů daného produktu v daném časovém období se tak nemusí agregovat velké množství hodnot z jednotlivých obchodních transakcí, neboť kostka v sobě uchovává „předpočítaný“ výsledek a je tak schopna dotaz okamžitě zodpovědět.
Klientské nástroje
Posledním pilířem úspěšné implementace BI je zpřístupnění všech relevantních dat a informací všem, kdo z nich mohou těžit. Přístup ke správným informacím v pravou dobu a k analytickým nástrojům odpovídajícím jejich potřebám umožní lidem získat hlubší náhled na data, správně jim porozumět a správně je interpretovat. BI k tomuto účelu obsahuje nástroje pro kvalitní a přehledné reportování společně s nástroji pro online analýzy, které uživatelům a zejména pak analytikům umožní nahlížet na data z nejrůznějších perspektiv a transformovat je na informace a znalosti.
Nástroje BI mohou využívat uživatelé na všech úrovních rozhodování, přičemž analytické sestavy mohou být dostupné v rámci portálových řešení, prostřednictvím webu, z aplikací Microsoft Office či mobilních zařízení.
BI a SQL Server
Microsoft SQL Server představuje komplexní platformu pro vybudování celého BI řešení – obsahuje všechny nástroje a komponenty k tomu potřebné. Relační databázový stroj umožňuje vytvářet a spravovat datové sklady libovolné velikosti. O jejich plnění se postarají integrační služby, nástroj ETL schopný konzumovat data z libovolného zdroje s širokými možnostmi datových transformací. Analytické služby slouží pro tvorbu databází OLAP a datových kostek, k definici klíčových indikátorů výkonu společnosti (KPI) a v neposlední řadě k dolování informací (známému pod pojmem data mining) pomocí prediktivních algoritmů. K prezentaci výsledků ve formě nejrůznějších panelů a sestav jsou v SQL Serveru k dispozici reportovací služby, které umožňují data zobrazovat v široké škále formátů s možností automatického doručování reportů koncovému uživateli.
BI a SQL Server 2008 R2
Nová verze SQL Serveru vychází z verze 2008 a i nadále tvoří ucelenou platformu pro BI řešení. Přináší novinku zvanou PowerPivot umožňující uživatelům provádět vlastní analýzy nad heterogenními datovými zdroji v prostředí Microsoft Excel. PowerPivot také boří limity v počtech řádků, které v Excelu stále existují, a v 64bitové variantě jsou jeho jediným omezením fyzické možnosti počítače. Velkých změn se dočkaly také reportovací služby. Přibyla podpora pro opakované využití částí reportu a datových sad. Nově je možné zobrazovat informace členěné geograficky na mapovém podkladě nebo využít celou řadu prvků pro lepší grafickou, a tudíž názornější, prezentaci informací. Významným prvkem nového SQL Serveru jsou jeho široké možnosti integrace se SharePoint Serverem 2010. Integrovaná platforma, kde je webový informační portál postavený nad technologiemi SharePoint Serveru, SQL Serveru a Office, nabízí unikátní možnosti jak v podobě prezentace dat, tak i v uživatelské přívětivosti a přístupnosti. Tím je nakročeno k mnohem lepšímu a častějšímu využívání skutečných pokladů, zhusta se skrývajících v nepřehledných podnikových datech.
Závěrem
Lidé, kteří mají díky BI přístup ke kvalitním informacím, se mohou snáze a lépe rozhodovat a současně svá rozhodnutí činit v souladu se strategickými cíli celé organizace. Implementace BI řešení představuje investici s vysokou návratností a je schopná pokrýt potřeby všech typů firem – od malých organizací až po opravdu velké korporace. Dle studie IDC vede implementace BI k jednoznačnému zefektivnění vnitrofiremních procesů a k zásadnímu vylepšení procesů obchodních.
Miloslav Peterka | BI Experts