Kontrola systémov
Naše očakávania dostupnosti služieb sú vysoké. Vždy požadujeme, aby to, čo je pre nás dôležité, alebo čo v danej chvíli chceme či potrebujeme, bolo na sto percent dostupné. Dostupnosť služieb sa dosahuje viacerými spôsobmi. Tým kľúčovým je aj pravidelná kontrola, čiže monitoring systémov, ktorej sa budeme venovať v tomto článku.
V texte sa tiež dozviete:
- Prečo je kontrola systémov dôležitá?
- Že nie je rozdiel medzi kontrolou a monitoringom
- V čom sú výhody manuálnej a nevýhody automatizovanej kontroly?
Úvod do problematiky
Predstavme si nasledovnú situáciu. Alica ráno vstane a teší sa, že dnes po práci pôjde konečne na prechádzku do lesa. Už dlhšie bolo škaredé počasie a preto sa veľmi potešila slnečnému dňu. V práci všetko prebiehalo ako hocijaký iný pracovný deň. Bol už čas obeda a Alica stihla dokončiť väčšinu svojej naplánovanej práce. Keď sa vrátila z obednej prestávky, prihlásila sa do svojho počítača a odrazu jej celý systém v ktorom pracovala, zlyhal. Alica počítač reštartovala a celú aplikáciu znovu spustila v domnienke, že to bolo iba niečo dočasné a nepodstatné. Systém však zlyhal opäť.
Jediný, na koho by sa vedela s týmto problémom obrátiť, je kolega Bob. Ale už pri písaní e-mailu Bobovi si všimla, že dnes nie je v práci. Úplne zabudla, že Bob má dnes dovolenku. Alica vedela, že bude musieť kontaktovať dodávateľa systému, ale nemala na neho kontakt a netušila aký je v tomto prípade postup. V strese sa jej podarilo nájsť kontakt na firemnom intranete a po dlhšom vyzváňaní jej na druhej strane telefonickej linky zdvihla veľmi milá a chápavá pani, ktorá si trpezlivo vypočula Alicin problém.
Operátorka jej následne vysvetlila proces a objasnila celú situáciu. Išlo o to, že Alicina firma nemala zazmluvnenú štandardnú technickú podporu, ale iba všeobecné konzultácie, ktoré majú všetci zákazníci automaticky. To znamená, že celý technický zásah si bude musieť jej firma zaplatiť v plnej cene, ale tiež bude musieť čakať, kým sa uvoľní potrebný technik. V tento deň mala totiž dodávateľská firma viacero žiadostí o technickú podporu a preto boli uprednostnení zákazníci, ktorí majú zazmluvnenú kontrolu systémov.
Alica z toho nebola nadšená, pred očami sa jej vzďaľovala vidina zeleného lesa. Namiesto toho tušila, že bude musieť ostať v práci do neskorých večerných hodín, aby stihla odovzdať dôležité podklady pre akcionárov. Po niekoľkých hodinách čakania zazvonil telefón a ozval sa technik z dodávateľskej spoločnosti. Tomu sa po analýze systému podarilo rýchlo identifikovať problém, ktorý následne obratom vyriešil.
Alica už v duchu cítila vôňu ihličia, ale predsa sa technika opýtala na dôvody poruchy. Vysvetlenie bolo jednoduché: absentovala pravidelná kontrola systémov. Systémové chyby, sa na serverovom prostredí objavovali už dlhší čas, ale kvôli absencii monitoringu si ich nikto nevšímal. Kontrola prostredia, či už manuálna alebo automatická pomáha predchádzať nielen veľkým problémom, ale aj množstvu malých, ktoré väčšinou tým veľkým predchádzajú. Ak sa neriešia, časom môžu spustí kaskádu, ktorá v najhorších prípadoch spôsobí nefunkčnosť celého systému.
Tento krátky príbeh ilustruje situáciu, ktorá sa môže vyskytnúť aj v reálnom živote. Nejde iba o kontrolu prostredia, ale celkovo prístup človeka a jeho uvedomenie si, ako sú nastavené štandardné procesy vo firmách a ako funguje poskytovanie podpory vo všeobecnosti. My sa teraz zameriame na službu kontrola systémov ako taká, s ktorou sa môžete stretnúť u každej firmy poskytujúcej technickú podporu v rámci dodávaných služieb či riešení.
Čo je vlastne kontrola systémov?
Ide o komplexnú kontrolu prostredí a služieb za účelom včasného predchádzania problémom a s cieľom zabezpečiť v čo najväčšej možnej miere neprerušovanú dostupnosť služieb pre používateľov. Môžeme sa tiež stretnúť aj s názvom monitoring, ktorý sa častejšie používa v technickej terminológií. Kontrola systémov alebo monitoring systémov je to isté.
Monitoring systémov pomáha problémy včas detegovať. Spočiatku môžu byť ešte malé a bezvýznamné, ale ak sa budú dlhodobo ignorovať, môžu spôsobiť vážne problémy ako napríklad nefunkčnosť nejakej služby alebo celého systému.
Monitoring kontroluje dostupnosť služieb, výkonnostné parametre prostredí, voľné zdroje ako aj analyzuje logy systémov pre prípad, že sa v nich nachádzajú chyby. Okrem toho, získané dáta z prostredí v značnej miere pomáhajú aj pri riešení príčin vzniknutých problémov a pomáhajú tiež pri návrhoch nových prostredí v období migrácii. Poznáme dva základné druhy vykonávania kontroly systémov: kontrola vykonávaná manuálne a automatizovane.
Manuálna kontrola systémov
Už z názvu vyplýva, že ide o aktivitu, ktorá je vykonávaná ručne, raz za určitý čas. Čas v tomto prípade chápeme ako interval medzi jednotlivými manuálnymi kontrolami – napríklad raz za týždeň, mesiac, pol roka alebo ročne. Zvyčajne ide o viac-menej pravidelnú aktivitu, ktorá sa opakuje v nejakom intervale, ale môže ísť aj o jednorazovú činnosť.
Manuálna kontrola systémov sa zvykne realizovať na prostrediach, ktoré bežia izolovane, či už z pohľadu bezpečnosti alebo štandardov samotného zákazníka. V praxi ide zvyčajne o zákaznícke prostredia mimo siete dodávateľa používaného riešenia, ktorý zabezpečuje vykonávanie takéhoto typu kontroly systému.
Výhody
- Nie je potrebné, aby monitorované prostredie, či služba boli dostupné v rámci siete dodávateľa. Na vykonanie manuálnej kontroly systému postačuje ľubovoľné vzdialené pripojenie na kontrolované prostredie.
Nevýhody
- Keďže sa kontrola systému vykonáva manuálne, stav prostredia či služby vždy zodpovedá konkrétnemu bodu v čase, kedy bola kontrola vykonaná. Ak by nastal problém po vykonaní kontroly, realizátor o ňom nevie až do času, kým opäť na základe časového intervalu nevykoná ďalšiu kontrolu prostredia alebo ak dôjde k vážnej situácii, ktorá by sa prejavila už na dostupnosti samotnej služby a o danom probléme by nás informoval samotný používateľ. Takýto typ kontroly neumožňuje ihneď reagovať na vzniknuté situácie. Problémy na prostrediach sa odhalia až pri ďalšom vykonaní kontroly alebo od samotného používateľa keď problém nahlási.
- Nie je k dispozícii stav prostredia v rôznom čase v rámci prevádzky, ktorý slúži na rýchlejšie hľadanie príčiny vzniknutých problémov ako aj na prípadnú výkonnostnú analýzu prostredia pre efektívnejšie využívanie zdrojov.
Automatizovaná kontrola systémov
Za človeka vie kontrolu systémov vykonať aj aplikácia (monitorovací nástroj), ktorý kontroluje stav služby či prostredia automaticky, v pravidelných niekoľkominútových intervaloch. To znamená, že na monitorovanom prostredí agent zbiera potrebné systémové dáta, ktoré posiela do centralizovaného monitorovacieho systému, na monitorovací server. Dáta z monitorovaných prostredí sa tak ukladajú na server monitorovacieho nástroja, odkiaľ sú okamžite dostupné k prípadnej analýze.
Dáta zozbierané z prostredí sú následne k dispozícii hlavne prostredníctvom vizuálnych nástrojov formou grafov či tabuliek. Zozbierané dáta pomáhajú riešiť funkčné ale aj výkonnostné problémy, alebo umožňujú zamerať sa na efektívne a optimálne využívanie zdrojov, keď napríklad jedno prostredie potrebuje zdroje navýšiť a iné má zbytočne veľa zdrojov, ktoré ani nevyužíva a bolo by možné ich z tohto prostredia odobrať. Daný nástroj umožňuje na základe nastavených prahových hodnôt poslať aj notifikáciu osobám v zozname. Ide väčšinou o osoby, ktoré sú za systém zodpovedné a tie osoby, ktoré potrebujú byť informované, že došlo k incidentu na sledovanom prostredí.
Výhody
- Existencia notifikačného systému. O vzniknutej situácii na prostredí je informovaná požadovaná skupina ľudí, ktorá na základe typu problému vie následne vykonať potrebný servisný zásah.
- Neustála kontrola prostredia v niekoľkominútových intervaloch.
- Interpretácia zozbieraných dát z prostredia v grafickej forme. Ide o grafické zobrazenie historických stavov systému, čiže ako sa systém správal v konkrétnom čase v porovnaní s inými časovými intervalmi.
Nevýhody
- Pre niektoré firmy je vzhľadom k firemným štandardom nereálne naplniť požiadavku na dostupnosť monitorovaného prostredia voči serveru, kde sa posielajú monitorovacie dáta, ktoré sa následne vyhodnocujú do grafickej podoby ako aj pomocou notifikačného systému.
Prečo je kontrola systémov
dôležitá?
Kontrola prostredí a služieb má svoj zmysel, hlavne ak ide o kritické a produkčné systémy, pri ktorých je požadovaná plná funkčnosť „24x7“ alebo funkčnosť počas pracovných dní „8x5“. Pre niekoho môže byť kritickým systémom aj testovacie alebo vývojové prostredie. V skutočnosti, každý systém a služba sú pre niekoho viac a pre niekoho menej dôležité. Vždy závisí na uhle pohľadu.
Po správnosti, monitorovať by sa mali všetky systémy a služby a až následne sa podľa ich dôležitosti určuje priorita. Zjednodušene ide o zisťovanie, ktorý problém sa bude riešiť ako prvý, a ktorý vie nejaký čas ešte počkať. Takto máme prehľad o problémoch na našich prostrediach, vieme ich riešiť a minimalizovať budúce výpadky, ako aj analyzovať výkon našich prostredí s cieľom optimalizácie a efektívneho využívania zdrojov.
Nemonitorovať systém znamená, že o danom systéme nemáme takmer žiadne informácie, čo výrazne komplikuje hľadanie príčiny vzniknutého problému. Tá mnohokrát nemusí byť ani odhalená a môže nám opäť v budúcnosti spôsobiť problémy na prostredí. Taktiež o problémoch nie sme proaktívne informovaní a skutočnosť, že sa so systémom niečo deje väčšinou zistíme, až keď prestane pracovať nejaká funkčnosť alebo celkový systém. To môže mať pre firmu ekonomické následky.
Potenciálnou nevýhodou kontroly systémov je potreba sprístupnenia firemného prostredia pre spoločnosť, od ktorej chceme, aby nám prostredie kontrolovala a starala sa oň. S tým môžu byť spojené bezpečnostné obavy. Treba si vždy premyslieť, koho do systému a s akými právami pustíme a to bez ohľadu na to, či je z externej alebo internej strany.
Kontrolu systémov, čiže monitoring, môžeme prirovnať napríklad k pravidelným prehliadkam auta. Technik nám ho pravidelne kontroluje a stará sa, aby bolo všetko v poriadku. Ale kontrola systémov má spoločné znaky aj s poistením domu či úrazu. Keď si pravidelne platíme poistenie, finančne sa zabezpečujeme pre prípad nežiadajúcej situácie. Potom pravidelne prehodnocujeme, či to má celé pre nás zmysel alebo nie. Ak sa nám niečo zlé prihodí, nevieme si následne poistku či pravidelný servis auta vynachváliť.
To isté platí aj v prípade kontroly serverových systémov. Či ide o manuálnu alebo automatizovanú kontrolu, základom je, aby sa vykonávala pravidelná kontrola v určitom časovom intervale s cieľom minimalizovať výpadky systému, ako aj mať prehľad o výkone samotného systému. To znamená, že o systém, ktorý dennodenne používame, má byť nadštandardne postarané a má byť zabezpečená jeho pravidelná kontrola a údržba s cieľom ochrániť prevádzku pred výpadkami.
Zhrnutie na záver
Kontrola, čiže monitoring prostredí, je kľúčový prvok zabezpečujúci funkčnosť a dostupnosť systému či služby. Optimálne by sa mali kontrolovať všetky prostredia a služby, ideálne za použitia automatizovaných nástrojov, ktoré nás vedia o probléme hneď informovať a umožňujú nám sledovať využitie pridelených zdrojov jednotlivým prostrediam a tak ich efektívne využívať vzhľadom k potrebám samotných systémov. Záleží aj na osobe, ktorá vykonáva kontrolu systémov a na tom, aký konkrétny nástroj je na tento monitoring použitý.
Ak sa rozhodneme pre výber tej istej dodávateľskej firmy, od ktorej máme aj podnikový systém, zvyčajne je s tým spojených viacero výhod. Nejde iba o dobrý pocit, že o systém sa nám stará samotný dodávateľ a nie tretia strana alebo interní zamestnanci, ktorí väčšinou nemajú porovnateľné informácie o systéme nasadenom na firemnom prostredí ako zamestnanci dodávateľa samotného systému. To môže znamenať, že nebudú vedieť vyriešiť všetky problémy a bude aj tak potrebné obrátiť sa so žiadosťou na dodávateľa. Ďalším rizikom pri modeli rôznych dodávateľov sú neodborné zásahy spôsobené treťou stranou na daných systémoch. Tie môžu viesť k závažnejším chybám alebo môže nastať situácia, keď dodávateľ odmietne vykonať servisný zásah na systéme, do ktorého bolo bez jeho vedomia neodborne zasahované.
Je na rozhodnutí každej firmy do akej miery ktorý systém kontroluje. Takisto spôsob vykonania kontroly manuálne alebo automatizovane. Rozhodnutie, či dané služby objednať u dodávateľa systému alebo vykonávať formou interných zdrojov alebo treťou stranou je vecou, ktorú si treba obzvlášť zvážiť. Každé takéto rozhodnutie má následne dopad na firemný systém a jeho dostupnosť.
Je optimálne mať systémy pravidelne monitorované a tak sa snažiť zabezpečiť ich dostupnosť v čo najväčšej možnej miere. Pri svojom rozhodovaní by sme mali zvážiť nielen náklady, ale aj to, aké dôsledky nám nefunkčnosť systému môže spôsobiť a ako vie ovplyvniť plnenie plánov a dostupnosť služieb pre našich zákazníkov. Cieľom každej firmy by mali byť systémy plne funkčné, dostupné, aktuálne a bezpečné.