Nieuws Azure Infrastructuur

Capaciteits problemen in Microsoft Azure oplossen : Hoe ga je er mee om?

Heb je ooit capaciteitsproblemen gehad in Azure regio's? Dit probleem kan zich voordoen bij het maken, starten of aanpassen van de grootte van een virtuele machine (VM) in een regio.

Het laatste wat je wilt, is dat VM's niet opstarten en dat klant X niet kan werken.

In dit artikel wordt uitgelegd hoe je dit kunt oplossen in Microsoft Azure.

Niels Kroeze

Auteur

Niels Kroeze

Leestijd 6 minuten Gepubliceerd: 16 september 2025

Het probleem: overvolle “hero” regios 

De meeste ervaren Azure gebruikers hebben wel eens te maken gehad met de gevreesde deployment failure: geen capaciteit beschikbaar in de gekozen regio, met de volgende foutmelding:

Azure VM error message failed to start virtual machine

Error code: AllocationFailed or ZonalAllocationFailed
Error message: We do not have sufficient capacity for the requested VM size in this region. Read more about improving likelihood of allocation success at https://aka.ms/allocation-guidance

Bovendien zijn nieuwe functies zoals Azure OpenAI vaak niet beschikbaar in deze ‘drukke’ regio's. 

Wanneer wat een oneindige pool van resources leek plotseling nieuwe workloads weigert vanwege een gebrek aan capaciteit, wordt duidelijk dat de cloud gebonden is aan fysieke beperkingen: fysieke datacenters met stroom, koeling, rekken en servers, beheerd door gewone mensen.  

Op een gegeven moment is het gebouw vol, of zijn in ieder geval alle servers in gebruik. Microsoft zelf zegt hierover het volgende: 

We investeren voortdurend in extra infrastructuur en functies om ervoor te zorgen dat we altijd alle VM-typen beschikbaar hebben om aan de vraag van klanten te kunnen voldoen. Het kan echter voorkomen dat er af en toe fouten optreden bij de toewijzing van resources als gevolg van een ongekende groei in de vraag naar Azure-services in bepaalde regio's.” 

Microsoft statement

De populaire regio’s, beter bekend als “hero regions”, hebben vaak last van capaciteitsproblemen. Vooral de EU-West regio (de grootste hero region), een van Microsoft’s drukste datacenters, kampt hier al jaren mee.

Maar Azure West Europe is niet de enige regio die geraakt wordt; andere regio’s die soms problemen hebben zijn:

  • (Europa) UK South
  • (Noord-Amerika) Canada Central
  • (Noord-Amerika) East US
  • (Noord-Amerika) East US

Microsoft’s oplossing? Probeer een andere, minder drukke regio/zone; dat is wat de “behulpzame” support agent zegt…

Andere regio’s gebruiken kan een tijdelijke oplossing zijn voor je Azure-omgeving, maar dit kan ook een groot probleem worden omdat:

  • Niet elke cloudarchitectuur flexibel genoeg is om snel nieuwe regio’s te gebruiken
  • Je bepaalde features nodig hebt, en niet elke regio biedt dezelfde features (nog)
  • Je cloudbudget het niet toelaat om te verhuizen; sommige regio’s zijn duurder dan andere
  • Azure Governance en policies vereisen dat je in de “geraakte” regio moet deployen

Bij Intercept werken we bijvoorbeeld vooral met Nederlandse klanten (Azure West Europe) die niet zomaar kunnen uitwijken naar een andere regio door compliance-eisen.

Veel landen en sectoren eisen dat data binnen bepaalde grenzen blijft, en als je die regels breekt kan dat leiden tot boetes of beperkingen. Als een klant verplicht in een bepaalde regio moet deployen en dan te horen krijgt dat ze moeten uitwijken naar bijvoorbeeld Azië of de VS, letterlijk aan de andere kant van de wereld, dan is hun reactie vaak: “Serieus??

Het punt is: dit werkt niet altijd. Daarom zijn er wat workarounds nodig.

 

Oplossingen

Totdat de capaciteitsproblemen echt voorbij zijn, moet je het risico zoveel mogelijk beperken.

1. Geen autoscaling meer

Autoscaling wordt vaak gebruikt om kosten te besparen door dynamisch compute-instances toe te voegen of te verwijderen op basis van de vraag. Maar in tijden van onzekerheid kan autoscaling riskant zijn.

Denk erover na: als je stopt-dealloceert, geef je je capaciteit op. Het idee is om geld te besparen tijdens rustige momenten, maar dit kan je later juist schaden.

Bij schaarste is het slimmer om je capaciteit vast te houden en autoscaling uit te zetten. Laat je resources gewoon draaien in plaats van te gokken of er straks nog plek is.

 

2. On-Demand Capacity Reservations

Met het on-demand capacity reservation programma van Microsoft kun je compute-capaciteit reserveren in een Azure-regio of availability zone. Je reserveert en betaalt de VM vooraf om de capaciteit te garanderen op het moment dat je die nodig hebt. Zo voorkom je allocatieproblemen en verhoog je uptime.

Bij verwachte pieken, zoals tijdens een migratie, of bij bedrijfskritische workloads is dit het overwegen waard.

Een klant overtuigen om weken van tevoren al voor compute te betalen is niet makkelijk. Maar wil je echt het risico lopen op mislukte deployments, productiviteitsverlies of downtime?

 

3. Resize je VMs

Het is verleidelijk om de nieuwste SKUs te gebruiken, die snellere processors beloven. Maar niet elke workload heeft dat nodig. Nieuwe SKUs draaien vaak op de nieuwste hardware, en daar zijn de tekorten meestal het grootst.

Kies liever een VM-size die past bij je werkelijke workload. Kleinere of middelgrote SKUs, zoals D_v3, draaien op meer verschillende hardware, waardoor je meer kans hebt dat Azure ze kan alloceren. Dit geldt ook voor andere resources, want bijna elke Azure-service draait uiteindelijk op VMs.

 

4. Vermijd legacy VM-sizes

Legacy VM-series (Av1, Dv1, DSv1, D15v2, DS15v2, enz.) draaien niet op de nieuwste hardware. Als je die nog gebruikt, loop je kans op allocatiefouten, zelfs als er wel nieuwere VMs beschikbaar zijn.

De oplossing is migreren naar nieuwere VMs. Die zijn geoptimaliseerd voor de huidige hardware, presteren beter en zijn vaak ook gunstiger geprijsd.

 

5. Overweeg meerdere regio’s

Als je alles in één regio draait, beperkt dat je schaalbaarheid en flexibiliteit. En als die regio een hero-region is, heb je extra kans op tekorten.

Als je regelgeving, data-eisen en governance het toelaten, overweeg dan multi-region deployments voor schaalbaarheid, compliance en resilience.

In Azure zijn er regio pairs: elke regio heeft een peer-regio, wat het gemakkelijker kan maken om een oplossing voor meerdere regio's te overwegen.

Azure region pairs

  • Elke Azure-regio is gekoppeld aan een andere regio binnen hetzelfde geografische gebied.
  • Deze regio's liggen doorgaans minstens 300 mijl uit elkaar.

Het is belangrijk om workloads over meerdere regio's te verspreiden. Als een regio of datacenter uitvalt, bijvoorbeeld in West-Europa, dan kun je automatisch overschakelen, zodat klanten geen last hebben van downtime. Misschien een klein beetje, maar niet enorm merkbaar.

Simon Lee - Azure Expert & Consultant

Maar weet dat wanneer West-Europa een probleem heeft, de capaciteit van de gekoppelde regio ook begint vol te raken; dus wie het eerst komt, het eerst maalt!

 

6. Availability Zones

Zelfs binnen één regio kan de capaciteit opraken. Door te deployen over meerdere Availability Zones spreid je workloads over verschillende fysieke locaties.

Zo verklein je de kans dat je vastloopt in één zone en vergroot je de betrouwbaarheid. Een makkelijke manier om capaciteit te borgen zonder naar een andere regio te hoeven, mits je architectuur en governance dat toelaten.

 

7. Gebruik de Allocation success recommender tool

Wil je een voorspelling van de kans op succesvolle allocatie in de komende 7 dagen? Dan kun je de “Allocation success recommender” tool in de Azure Portal gebruiken.

Allocation success recommender tool Azure

Met deze tool kun je checken welke VM-sizes je succesvol kunt deployen en hoeveel instances er beschikbaar zijn op dat moment in een specifieke regio, zoals West Europe.

 

Extra tips

Fouten kunnen altijd gebeuren. We raden je aan om:

  • Regelmatig de Azure statuspagina te checken
  • Eerst een simpele retry te doen (soms werkt het meteen daarna, capaciteit komt vaak snel weer vrij)
  • Een andere VM-size, regio of availability zone (AZ) te proberen
  • On-demand capacity te reserveren voor kritische workloads, als je budget dat toelaat
  • De Allocation success recommender tool te gebruiken
  • Disaster recovery op te zetten

 

Conclusie

Omgaan met capaciteitsproblemen is lastig. Je moet slim plannen om genoeg capaciteit te houden voor je VMs, app services, containers, databases en alle andere resources die uiteindelijk afhankelijk zijn van compute.

Gebruik deze aanpakken als tijdelijke workaround totdat je gewenste VM-type weer beschikbaar is in de regio die je nodig hebt. De opties zijn er, maar kies wat past bij jouw situatie.

Marc Bosgoed

Neem contact met ons op!

Als je capaciteitsproblemen hebt gehad en wilt weten hoe we je kunnen helpen om in de toekomst met dit soort situaties om te gaan, neem dan gerust contact met ons op.