Mnoho IT oddělení v současné době, která zrovna nepřeje navyšování rozpočtů, čelí výzvám, kam ukládat neustále rostoucí objemy dat. Vezmeme-li v úvahu, že tato data je nutno nejlépe v několika verzích a kopiích ještě zálohovat, může se jejich nárůst stát noční můrou nejednoho IT manažera. Naštěstí se v poslední době stále častěji setkáváme s technologiemi, které od ní pomáhají.
V poslední době je velmi často zmiňovaným pojmem deduplikace, což je jedna z technologií pomáhajících snížit objemy ukládaných dat. Stranou nelze ponechat ani archivaci – proces přesunu starých a nepoužívaných dat na levnější úložiště, což rovněž pomůže snížit náklady na uložení.
Deduplikace
Podívejme se nejprve na deduplikaci. Ta byla ještě v nedávné době doménou velkých podnikových řešení a od toho se také odvíjela cena. Postupem času se však na trhu začala objevovat řešení, která deduplikaci zpřístupnila i menším podnikům.
Deduplikace se může odehrávat na několika úrovních – na primárním diskovém úložišti, souborovém systému nebo v zálohovacím či archivačním řešení. V případě deduplikace na primárním úložišti lze mluvit o nejlepší formě poskytující nejvyšší efektivitu. Diskové technologie umožňují identifikaci bloků, obsah každého z nich je uložen pouze jedenkrát a další výskyty se na něj pouze odkazují. Tato deduplikace se zpravidla odehrává až po uložení dat na disky – tzv. post-processing.
Na druhé straně, co se efektivity týče, stojí deduplikace souborovým systémem, který umožňuje rozpoznat obsah jednotlivých souborů a v případě shody je soubor uložen pouze jednou. Pokud ale dojde ke změně byť jediného bitu v jedné z kopií, je celý soubor vnímán jako nová kopie a je celý uložen. Pro tuto deduplikaci se častěji používá název jednoinstanční ukládání (Single Instance Storage – SIS).
Někde uprostřed stojí deduplikace na úrovni segmentů. Tu využívají zálohovací nástroje pro snížení objemu uložených zálohovaných dat při zachování možnosti obnovit všechna data z kterékoliv zálohy. Každý soubor je během zálohování rozdělen na menší části – segmenty, kde pro každý segment je vypočten kontrolní součet (hash), který vychází z jeho obsahu. Ten je uložen v databázi, jež obsahuje informace definující umístění segmentu v jednotlivých souborech. Každý segment je v zálohovacím systému uložen pouze jednou. Deduplikace během zálohování může probíhat buď na zdroji (počítač, klient), který provádí rozdělení souboru na segmenty a zjišťuje jejich existenci na zálohovacím serveru, nebo na zálohovacím serveru. Deduplikace klientem nachází uplatnění všude tam, kde je potřeba zálohovat větší objemy dat, jež nejsou sítě schopny přenést z kapacitních důvodů. Typickým příkladem je třeba zálohování vzdálených poboček připojených pomocí technologie ADSL na centrálu. Je však důležité zmínit, že v tomto případě převážnou část procesu provádí samotný klient, což znamená zvýšené požadavky na výpočetní výkon.
Tam, kde tyto požadavky nelze uspokojit nebo kde je dostatečná síťová konektivita, lze s výhodou využít deduplikace na straně zálohovacího serveru, který přebere veškerou zátěž procesu. Zálohovaný počítač tak posílá všechna zálohovaná data po síti na server, který jednotlivé segmenty uloží v případě jejich neexistence v zálohovacím systému, nebo pouze uloží metadata, když segment v záloze je. Existují také zálohovací nástroje, které dokážou krom těchto dvou metod využít funkcionality diskového úložiště popsané výše. Jednou z výhod tohoto řešení je možnost posílat zálohovaná data z klienta přímo na zařízení při zachování možnosti spravovat a řídit tyto zálohy pomocí daného nástroje.
Archivace
Další možností, jak ušetřit náklady za datová úložiště, je archivace starých a mnohdy i nevyužívaných dat – jejich přesun na levnější úložiště. To navíc může snížit zátěž produkčních serverů a oddálit jejich případný upgrade. Archivace může také snížit objem dat uložených v archivu díky eliminaci duplicit v celém prostředí. Je-li archivován soubor ze souborového systému a tentýž soubor je jako příloha třeba i několika různých mailů na poštovním serveru nebo jako dokument SharePoint serveru, může být v archivu uložen pouze jedenkrát. Uživatelský přístup k archivovaným datům se podle použitého řešení může lišit. Nejzákladnější přístup může zajistit webový portál, kde uživatel může do archivu přistupovat a data si z něj stahovat. O něco rychlejší je použití hypertextových odkazů. Nejvyšší komfort však zajistí transparentní přístup původní aplikací do archivu. Uživatel tak může vidět archivované maily jako virtuální PST ve svém Outlooku a jednoduše k nim přistupovat a vyhledávat. Navíc lze toto virtuální PST nosit sebou a přistupovat do archivu bez nutnosti připojení do firemní sítě. Doba uložení dat může být definována pravidly daného archivačního nástroje a po uplynutí této doby budou data z archivu odstraněna. Alternativně lze archivní systém propojit s dalšími systémy – antispamovou ochranou, která může na základě obsahu přiřadit archivační pravidla, klasifikací, která tuto možnost poskytne také, systémy pro správu obsahu (CMS), které mohou řídit životní cyklus dat v archivu, data loss systémy, které označí archivovaná data pro jednodušší zpracování. Archiv může také zpřístupnit nadstavbové funkce – například eDiscovery – jiným oddělením (právním, obchodním, bezpečnostním), která by jinak vyžadovala při řešení svých kauz asistenci IT odborníků.
Jak vidno, existuje několik řešení, které napomohou IT oddělením vměstnat se do napnutých rozpočtů. Tato řešení již nejsou pouze doménou velkých podniků a najdou uplatnění i v menších firmách. Jediné, co je zapotřebí, je vybrat tu správnou technologii.
P e t r D a v i d | S y m a n t e c