Blogi | Cinia

IT-infran monitoroinnilla ennakoidaan ja rajataan viat ja mahdollistetaan liiketoiminnan jatkuvuus kiperässäkin tilanteessa

Kirjoittanut Jari Vallin | 10.11.2022 13:49

Kun liiketoimintaympäristöt ovat yhä digitalisoituneempia, suunnitelma mahdollisten häiriötilanteiden varalle on entistäkin tärkeämpää. IT-infran valvontatyökalut auttavat ennakoimaan vikatilanteita, ja mahdollistavat tehokkaan vian rajaamisen ja nopean paluun normaaliin arkeen. 

 Digipalveluiden jatkuvuudella monta uhkaa 

Nykypäivänä uhkia järjestelmien toiminnalle on monenlaisia, ja mitä pidemmälle digitalisaatio etenee, sitä enemmän kasvavat mahdollisuudet myös erilaisille poikkeamille ja vikatilanteille.  

Kybermaailman uhkat ja esimerkiksi palvelunestohyökkäykset ovat varmasti ilmeisimpiä uhkia digitaalisten palveluiden saatavuudelle ja luotettavuudelle. Liiketoiminnan pysäyttävä häiriö  voi kuitenkin johtua myös esimerkiksi tietoliikenneyhteyksien katkoista tai teknisistä ongelmista virtuaalialustoilla, joilla sovellukset toimivat. 

Testaamisesta huolimatta digitaaliset palvelut ja sovellukset ja etenkin niiden päivitykset ja uudet versiot saattavat käyttäytyä livetilanteessa eri tavoin kuin alun perin oli suunniteltu. Yli odotusten onnistunut verkkosivulle vievä kampanja voi jumauttaa digitaalisen palvelun odottamattomalla liikennepiikillä, johon ei etukäteen varauduttu.  

Digitaalisten palveluiden häiriöttömälle toiminnalle ja liiketoiminnan jatkuvuudelle uhkia tuottavissa vioissa oma lukunsa ovat pitkälle kehittyneet rajapinta- ja datan hakemisen ketjut, joissa digitaaliset palvelut hyödyntävät toisaalla olevaa tietoa ja hakevat sitä rajapintojen kautta muista järjestelmistä. Näiden välille ilmaantuvat ongelmat saattavat olla hankalasti identifioitavissa ja rajattavissa.   

Jatkuvuussuunnitelma takaa liiketoiminnan myös vikatilanteessa 

Liiketoiminnan jatkuvuussuunnitelmalla on entistä tärkeämpi merkitys, kun häiriötilanteet kuten tietojärjestelmien ja tietoliikenteen katkokset tai kriittisen infrastruktuurin pettäminen ovat suuria, koko toiminnan jatkuvuutta uhkaavia tekijöitä. 

ICT-toimintaympäristöt ovat usein varsin monimutkaisia monitoimittajakokonaisuuksia. Siksi on oleellista dokumentoida palvelut ja määritellä niiden kriittisyys yhdessä IT:n ja liiketoimintojen kesken. Tämä helpottaa toimenpiteiden priorisointia häiriötilanteissa. 

Ota nämä asiat huomioon kun suunnittelet varautumista liiketoiminnan jatkuvuutta uhkaaviin vikatilanteisiin:  

  • Miten varaudutaan ja valmistaudutaan ennakkoon yllättäviin häiriötilanteisiin? 
  • Incident response -suunnitelma – miten äkillisiin häiriöihin vastataan? 
  • Järjestelmien ja liiketoiminnan palauttamiseen liittyvien henkilöiden yhteystiedot sekä sovittu saavutettavuus, miten he ovat tavoitettavissa häiriötilanteen sattuessa? 
  • Suunnitelmalle kannattaa tehdä myös säännöllinen kirjoituspöytätestaus – miten suunnitelma toimii käytännössä, tietävätkö kaikki omat roolinsa? 
  • Mikäli äkillinen häiriötilanne yllättää, suunnitelmaan kannattaa myös kirjata opit tapahtuneesta – mitä voidaan hioa ja parantaa? 
  • Muista myös tekninen testaus – toimiiko esimerkiksi varmistusten palautus? 


Valvonnan avulla nopea paluu normaaliin arkeen
 

Ilman kattavaa näkyvyyttä it-infrastruktuuriin ja sen toimintaan vikatilanteet usein huomataan vasta käyttäjäpalautteen perusteella. Kun palvelun käyttäjät raportoivat vaikkapa siitä, että palvelu ei ole saatavilla, ollaan kuitenkin jo melko myöhässä vian määrittämisen kanssa. 

Riippuen siitä, minkälainen järjestelmät polvilleen laittava vika on, sen syytä lähdetään selvittämään yleensä osa-alueittain. Koska toimittajat usein pitävät huolta vain omasta palastaan it-infran kokonaisuudessa, voi käydä hyvin myös niin, että vikaa ei pystytä heti paikantamaan.  

Vasta vian rajauksen jälkeen voidaan selvitystyö ohjata oikealle taholle. Jos puolestaan rajausta ei saada tehtyä, alkaa herkästi soittorumba ICT-järjestelmäkokonaisuudesta vastaavien eri toimittajien suuntaan, ja aikaa sekä rahaa kuluu. 

Tämän välttämiseksi etenkin monitoimittajaympäristössä keskitetty IT-infran monitorointi mahdollistaa ongelman rajaamisen nopeasti ja tehokkaasti. Kun keskitetystä näkymästä voidaan valvoa ja mitata, mikä pala infrastruktuurin kokonaisuudessa ei toimi kuten pitäisi, vian määrityksessä päästään heti oikeille jäljille.  

Valvonnan avulla voidaan myös ennakoida häiriö- ja vikatilanteita. Esimerkiksi kapasiteettitasoja ja liikenteen trendejä seuraamalla voidaan havaita jo etukäteen, milloin tietoliikenneyhteyden kapasiteettia on syytä nostaa.  

ICT-ympäristön monitoroinnilla voidaan esimerkiksi :

  • Varmistua siitä, että palvelut toimivat liiketoiminnan vaatimalla tavalla  
  • Rajata ongelmat häiriötilanteissa nopeasti, ja siten palauttaa palvelun laatu mahdollisimman pian  
  • Nähdä miten palvelut aidosti toimivat milläkin ajan hetkellä - Mutusta mitattuun tietoon  
  • Vähentää ongelmien selvitykseen kuluvaa aikaa ja siitä koituvia kustannuksia  
  • Mitata, saatko sitä mistä on sopimuksissa sovittu ja valvoa eri toimittajien osa-alueita 

Rakenna monitorointi jatkuvuussuunnitelman rinnalla 

Digitaalisten palveluiden ja koko liiketoiminnan jatkuvuussuunnitelman tekninen puoli katttaa it-infrastruktuurin monitoroinnin sekä varmistukset ja varakonejärjestelyt. Mittaus ja monitorointi kannattaa rakentaa noudatellen suunnitelman toimenpiteitä ja priorisointeja., jolloin keskitetty näkymä tukee suunnitelman toimeenpanoa silloin kun järjestelmien toiminnassa havaitaan häiriöitä.  

Työkaluun kannattaa esimerkiksi rakentaa näkymä, jossa palveluiden suorituskykyä monitoroidaan toimittajittain. Tämä helpottaa vian rajaamista ja korjaamista, kun yhdestä näkymästä pystytään toteamaan, kenen vastuulla vikatilanteen selvitys on.  

Ennakoimalla mahdollisia häiriötilanteita pystytään varautumaan jo etukäteen – kun esimerkiksi tiedossa on, että tulossa on kävijäpiikki, voidaan kapasiteettia lisätä jo ennakkoon.  

Valvontatyökalussa ennakointia tukee etenkin trendien seuraaminen. Esimerkiksi vasteaikoja ja levyn täyttöasteiden trendejä seuraamalla voidaan näihin pureutua jo ennen kuin palvelu hidastuu tai on alhaalla.  

 

Vinkkejä ICT-ympäristön monitorointiin: 

1. Koosta näkymä toimittajittain ja eri osa-alueittain 

  • Konesalit 
  • Tietoliikenneyhteydet 
  • Sovellukset ja ohjelmistonäkymät 

2. Valvo tarkempia osa-alueita 

  • Palvelinkuormat 
  • CPU-kuormat 
  • Rajapinnat 
  • Muistinkuormat

3. Seuraa trendejä ja ennakoi 

  • Vasteaika 
  • Kapasiteetti 
  • Levyn täyttöaste 
  • Liikennevuodot