Succesvol datacenters exploiteren

Onderzoek van het Uptime Institute wijst uit dat zeventig procent van alle datacenterstoringen zijn terug te voeren op menselijke fouten. Dit onderstreept nog eens het belang van een doortimmerd beleidsplan voor de exploitatie en het onderhoud van elk datacenter. Robert Woolley en Patric Donovan, beiden verbonden aan het Data Center Science Center van Schneider Electric, schreven er een whitepaper over die u hier kunt downloaden.

Datacenter-Blue-300x210 Een altijd vlekkeloos 24x7 functionerend datacenter is voor steeds meer organisaties van levensbelang. ‘Plat gaan’ is geen optie meer. Dit betekent dat het onderhoud letterlijk ‘on the fly’ moet plaatsvinden. De vergelijking met het uitvoeren van onderhoudswerkzaamheden aan een vliegtuig terwijl het vliegt, is dan ook een treffende. Deze constatering alleen al toont de noodzaak aan van een effectief, goed doordacht plan van aanpak voor exploitatie en onderhoud van datacenters. Voor het opstellen van zo’n doortimmerd ‘operations & maintenance’-programma, zoals het in het Engelstalige vakjargon heet, zijn echter nog wel wat meer argumenten te bedenken. Woolley en Donovan wijzen in hun whitepaper getiteld ‘Essential Elements of Data Center Facility Operations’ ter illustratie op de volgende punten:

  • De meeste storingen binnen een datacenter, zo wijst onderzoek uit, zijn toe te schrijven aan menselijke fouten, waarvan er vele zijn terug te voeren op het ontbreken van degelijke richtlijnen voor exploitatie en onderhoud.
  • Het grootste deel van de TCO van een datacenterfaciliteit zit in de operationele kosten (OPEX in plaats van CAPEX). Op dat vlak zijn dus ook de grootste besparingen mogelijk.
  • Het grootste deel van de operationele kosten zijn energiekosten, en die stijgen.
  • Het streven datacenters energie-efficiënter in te richten gaat ten koste van veiligheidsmarges en het redundant uitvoeren van systemen. Het belang van proactief onderhoud en het gebruik van DCIM-systemen (Data Center Infrastructure Management) neemt daarmee toe.
  • Veel zaken binnen het datacenter kunnen op hoog niveau worden geautomatiseerd en geregistreerd. Dit biedt nieuwe mogelijkheden om het betrouwbaarheidsniveau op te krikken en tegelijkertijd de kosten te reduceren – mits de datacenterfaciliteit goed gemanaged wordt!

Mindset

Doel van de auteurs is om facilitymanagers te voorzien van de basisingrediënten voor het opstellen van een effectief operations & maintenance-programma (O&M). Ze voeren daartoe twaalf onderwerpen ten tonele die essentieel zijn voor een uitgebalanceerd O&M-programma. Voor het succesvol exploiteren van een datacenter zijn die twaalf punten weliswaar essentieel, maar er is nog net iets meer nodig. Het begint allemaal, zeggen Woolley en Donovan, met het bijeenbrengen van een managementteam dat opereert vanuit de juiste ‘mission critical mindset’.

Zo’n mindset is belangrijk omdat het beheer van een datacenter sterk verschilt van dat van een doorsnee commercieel gebouw. De kritieke functie van bedrijfsdatacenters, de complexiteit ervan en de frequentie waarmee veranderingen moeten worden doorgevoerd, maakt dat een facilityteam heel doordacht moet plannen en coördineren, waarbij de focus primair moet liggen op risicoreductie.

Twaalf kerngebieden

De twaalf zaken die essentieel zijn voor goed datacenter-facilitybeheer en dus deel moeten uitmaken van elk datacenter O&M-programma zijn achtereenvolgens: een veilige en gezonde omgeving, personeelsmanagement, voorbereid zijn op noodsituaties, onderhoudsbeheer, veranderingsmanagement, documentatiebeheer, training, infrastructuurmanagement, kwaliteitsmanagement, energiebeheer, financieel management en het monitoren en analyseren van de performance. We voorzien hier een drietal van deze ‘essentials’ van een beknopte toelichting, omdat hun belang nogal eens wordt onderschat.

De zorg voor een veilige en gezonde omgeving omvat dingen als het in kaart brengen van fysieke gevaren op gebied van bijvoorbeeld elektriciteit en chemicaliën, en het communiceren daarover. Maar het veiligheidsbeleid heeft ook oog voor wet- en regelgeving, zodat overheidsboetes tot een minimum worden beperkt. En het zorgt voor de noodzakelijke training van het personeel, of voorziet een ieder op het juiste moment van de juiste beschermingsmiddelen.

Goed personeelsmanagement is van groot belang gezien de eerdere constatering dat het merendeel van de storingen in datacenters is terug te voeren op menselijk falen. Het omvat het aantrekken van de juiste experts op zowel mechanisch als IT-gebied en alle planning daaromheen. En ook hier hoort training hoog op de agenda.

Goed documentmanagement is het derde onderwerp dat er in veel datacenters nog weleens bij inschiet. Vooral de zorg voor het up-to-date houden van alle documentatie is essentieel. Het klinkt simpel, maar wordt o zo vaak verwaarloosd: elk documentmanagementproces moet in ieder geval drie elementen bevatten. Ten eerste een catalogus met daarin alle documenten per categorie gerangschikt, plus de locatie waar het document zich bevindt. Ten tweede een versiecontrolesysteem waarin is terug te vinden: de auteur van het document, de huidige versie, de eigenaar, de revisiedata, de veranderingshistorie en de volgende controledatum. En ten derde een kwaliteitsgarantieprocedure voor peer- en management-review van documentveranderingen, aanvullingen en verwijderingen.

Veel gemaakte fouten

Woolley en Donovan sluiten hun schrijven af met een overzicht van veel voorkomende fouten bij de implementatie van een O&M-programma. Het gaat om:

  • Het onderhoudsprogramma wordt niet gestuurd door metingen. Vaak is dit toe te schrijven aan slecht assetmanagement.
  • Slechte training doordat er te weinig aandacht aan wordt geschonken. Er is vaak geen koppeling tussen het niveau van gecertificeerd zijn en de taak die moet worden uitgevoerd.
  • Ineffectief verandermanagement, want gebaseerd op een inadequate risicoanalyse, verkeerde of niet-bestaande procedures of onvolledig gedefinieerde processen.
  • Het onvoldoende testen en evalueren van bekwaamheden.
  • Slechte documentatie.
  • Geen kwaliteitscontrolesysteem geïmplementeerd, als gevolg van een gemis aan hulpmiddelen voor het meten en monitoren van de performance.
  • Het blijven vastzitten in handmatige procedures; niet in staat zijn tot de implementatie van zaken als CMMS, EDMS, DCIM, et cetera.
  • Overmoedigheid als gevolg van de gedachte dat toekomstige prestaties kunnen worden afgeleid uit eerdere ervaringen.

Meer weten over het succesvol exploiteren van datacenters?

WP-SE-150x150 Dit artikel is gebaseerd op een whitepaper geschreven door datacenterspecialist Robert Woolley en Patric Donovan, senior research analist bij het Data Center Science Center van Schneider Electric. De titel van de whitepaper is ‘Essential Elements of Data Center Facility Operations’. Dit document is - na registratie - beschikbaar als pdf voor een ieder die zich verder wil bekwamen in het succesvol exploiteren van datacenters. De whitepaper is te downloaden na het invullen van uw gegevens.

    [email-download download_id="4753" contact_form_id="4752"]  
Dossiers