Microsoft Azure clouddiensten getroffen door storing

Verschillende Microsoft Azure clouddiensten zijn vrijdag 31 maart getroffen door een storing. De storing is veroorzaakt door problemen in het Japan East datacenter van Microsoft, waardoor alle luchtbehandelingsunits in het datacenter uitvielen.

Een deel van de Microsoft Azure-gebruikers in de regio Japan-Oost zijn getroffen door de problemen, meldt Microsoft op de statuspagina van Microsoft Azure. Onder andere de storage en virtuele machines van Azure werden getroffen. Aangezien een flink aantal Azure diensten hiervan afhankelijk zijn werden ook deze diensten getroffen door de storing. Het ging hierbij om: API Management, App Service \ Web Apps, Automation, Backup, Cloud Services, Access Control Service, Azure Data Factory / Data Movement, DocumentDB, Event Hubs, HDInsight, IoT Hub, Key Vault, Logic Apps, Media Services, Azure Monitor, Redis Cache, RemoteApp Service Bus, Site Recovery, SQL Database, StorSimple, Stream Analytics, Access Control Service, Azure Machine Learning (ML) en Azure Notification Hub.

Problemen met RUPS

De storing begon op vrijdag 31 maart om 15:28 uur en hield aan tot 00:16 uur op 1 april. De problemen zijn veroorzaakt door een storing in een rotary uninterruptible power supply system (RUPS). Hierdoor werd de energievoorziening van alle luchtbehandelingsunits in het Japan East datacenter van Microsoft verstoord. De temperatuur in het datacenter liep door de uitval te hoog op, waardoor apparatuur automatisch werd uitgeschakeld om oververhitting te voorkomen.

Microsoft meldt dat het koelsysteem is ontworpen met een N+1 redundantie, terwijl het energiedistributiesysteem is gebouwd met een N+2 redundantie. Microsoft onderzoekt samen met een externe partij hoe het probleem in het RUPS-systeem heeft kunnen leiden tot uitval van de energievoorziening van alle luchtbehandelingsunits.