Naar een datagestuurde cloud-strategie

Peter

Op dit moment zijn de meeste cloud-strategieën, voor zover je daarvan kan spreken, gericht op de applicatie. In het inmiddels breed omarmde cloud-first model brengen we een voor een applicaties naar de cloud. Voor iedere applicatie bekijken we waar die het beste past. Is er een geschikte SaaS-oplossing? Dan nemen we die. Is er geen SaaS-oplossing voorhanden, maar kunnen we het verPaaSsen, dan doen we dat. En als dat ook niet lukt, overwegen we een lift-en-shift naar IaaS. Vaak selecteert de business owner de SaaS-oplossing en komt IT in zicht als er geen PaaS-oplossing voorhanden blijkt te zijn. Waarbij applicatieteams vaak ook nog eens de ruimte krijgen om zelf een PaaS of IaaS provider te selecteren zonder dat IT daar veel invloed op heeft. Maar wat betekent deze praktijk eigenlijk voor de data?

We kunnen rustig stellen dat deze cloud-first praktijk een stevige silovorming in de hand werkt. De CRM-data staat bijvoorbeeld in de salesforce cloud, salarisgegevens bij Raet, de financiële administratie in Exact Online, documenten in OneDrive, internet verkopen in GCP, productiegegevens verdeeld over AWS en verschillende on-premises databases, enzovoorts. Vanuit een securityperspectief leidt dat tot de nodige uitdagingen, waardoor de aloude perimeter security aanpak vervangen moet worden door een security aanpak die security naar het niveau van de data brengt door middel van encryptie en geavanceerd toegangsbeheer.

Intussen wordt de CIO en het BI-team onder druk gezet om meer waarde te creëren op basis van alle data die de organisatie weet te produceren, gebruikmakend van de groeiende mogelijkheden op het gebied van geavanceerde analytics, AI en machine learning. Vaak kan dat prima met behulp van de aloude datawarehouse die op gestructureerde wijze data uit de diverse databases onttrekt, zeker als het om analyses gaat die je met regelmaat of continu wilt herhalen. Maar steeds vaker willen organisaties een veel grotere vrijheid om data uit verschillende bronnen te analyseren, zonder zich vooraf vast te leggen in allerlei structuren, met uiteindelijk als doel om bedrijfsprocessen te optimaliseren. Dat kan bijvoorbeeld met een datalake. Het bouwen en onderhouden daarvan kan nogal een investering zijn, dus dan heb je wel een stevige business case nodig en een duidelijke strategie om waarde uit zo’n lake te creëren. Aangezien steeds meer data al in de cloud is, wordt de datalake ook vaak in de cloud gezet.

Het lijkt dus steeds wenselijker te worden om data te centraliseren. Maar geen trend zonder een tegentrend. Steeds meer organisaties plaatsen steeds meer apparaten aan de rand van het netwerk, aan de ‘edge’ dus, en steeds meer van deze apparaten zijn voor hun functioneren afhankelijk zijn van data en dataverwerking. Centralisering van data-opslag en verwerking is dan ineens helemaal niet meer zo wenselijk. In plaats van een gecentraliseerde (cloud) aanpak, krijgen organisaties dan te maken met een behoefte aan data-bewuste gedistribueerde clouds.

Door bovengenoemde ontwikkelingen wordt het onontkoombaar dat organisaties hun strategie vanuit het perspectief van de data gaan inrichten. Daarbij moet uiteraard rekening worden gehouden met IT-security en architecturen die de dataverwerking naar of in de buurt van het device brengen wanneer dat beter of noodzakelijk is. Als alles om data draait - en dat doet het immers - waarom dan niet de cloud?
Peter Vermeulen is Directeur bij Pb7 Research