Duidelijkheid over de Azure SLA

Elke Azure service heeft een eigen SLA met daaraan verbonden voorwaarden, beperkingen en diensttegoed (service credits). Maar wat betekent dit nu precies? In dit artikel leggen we de verschillende SLA’s uit en wat dit nu betekent voor jouw organisatie.

De Azure Service Level Agreement (SLA) beschrijft Microsofts commitment voor uptime en connectiviteit voor de verschillende Azure Services.


Elke Azure service heeft een eigen SLA met daaraan verbonden voorwaarden, beperkingen en diensttegoed (service credits). Een aantal (gratis) Azure services hebben geen SLA, bijvoorbeeld Azure DevTest Labs. Andere Azure services vereisen een specifieke configuratie zoals bijvoorbeeld Azure Virtual Machines. De SLA start op een vrij beperkte 95% voor Single Instance Virtual Machines die gebruik maken van Standard HDD Disks, maar kan oplopen tot 99,99% voor multi instance Virtual Machines die in twee of meer Availability Zones in dezelfde Azure region zijn geplaatst. Verder worden SLA’s regelmatig bijgewerkt en zijn daarom voorzien van een versienummer.

(Voor een handig SLA board zie: https://azurecharts.com/sla)

SLA Levels

Tijdens het schrijven van dit artikel is er slechts 1 Azure Service met een SLA van 100%. Azure DNS, één van de core componenten voor services zoals Azure AD. Microsoft garandeert dat ‘geldige DNS-aanvragen 100% van de tijd een reactie zullen ontvangen van ten minste één Azure DNS-naamserver’. Microsoft weet dit te bereiken door vier DNS servers in verschillende geo’s aan te bieden, met alle een andere top level domain: .com, .net, org en ns{x}-{xx}.azure-dns.net. Om gebruik te maken van de 100% SLA garantie moet je derhalve wel alle vier de DNS servers in je app of dienst instellen.

 

Percentages zijn belangrijk

SLA uptime percentages zijn vaak hoge nummers. 99,5% klinkt als een hoog beschikbaar systeem en 99,999% (de magische 5 negens) lijkt daarom wellicht wat buitensporig. Maar als je vervolgens kijkt naar de maximale downtime veranderd dat. Slechts een zeer beperkt aantal klanten of gebruikers zullen nl. accepteren dat een app het soms even niet doet. Naar mijn bescheiden mening is het daarom niet verstandig om een productieomgeving te ontwerpen of gebruiken die minder dan 99,95% of 99,99% beschikbaarheid biedt.

Uptime percentage en maximale downtime:

99,5% = 7 minuten 12 seconden per dag
99,9% = 1 minuten 26 seconden per dag
99,95% = 43 seconden downtime per dag
99,99% = 8 seconden downtime per dag
99,999% = 0,8 seconden downtime per dag (6 seconden per week)

Bron

 

Samengestelde SLA

Wanneer je app gebruik maakt van meerdere (Azure) services, zal je de SLA elk van die services moeten controleren. Een voorbeeld, wat denk je dat de verwachte maximale downtime is van onderstaande app?

In dit voorbeeld zal de volledige app down gaan bij een storing op of de Web App of de SQL Database.  De kans op het falen van elke service is onafhankelijk, dus de samengestelde SLA voor deze toepassing is:

  • 95% (Web App) × 99.99% (Database) = 99.94%

Dat is lager dan de SLA van de individuele services

Door een onafhankelijke fallback optie toe te voegen kan je de beschikbaarheid aanzienlijk verbeteren. Wederom een voorbeeld, wat denk je dat er gebeurd als we een Queue Storage service toevoegen die is voorzien van een relatief lage 99,9% SLA in onderstaand voorbeeld:

In dit geval zal de Web App beschikbaar blijven, ook als deze niet kan verbinden met de SQL Database. De app zal pas falen als zowel de SQL Database als de Queue Storage down gaan, op dezelfde tijd. De verwachte kan op een dergelijke simultane storing is.0001 × 0.001, daarmee is de SLA van deze gecombineerde dienst:

  • SQL Database of Queue Storage = 1.0 − (0.0001 × 0.001) = 99.99999%

De samengestelde SLA is daarmee:

  • Web app en (database of queue) = 99.95% × 99.99999% = ~99.95%

U kunt dit voorbeeld en een berekening voor een multi-regio oplossing vinden in het Azure Architecture Center. U vindt daar ook een voorbeeld van een extreme hoog beschikbare oplossing die gebruik maakt van vier Azure regio’s met een 99,999999% SLA.


SLA Beperkingen

Zoals wellicht te verwachten valt, heeft Microsoft de nodige limieten en beperkingen gezet op wat de SLA daadwerkelijk dekt. In principe wordt alles buiten de controle van Microsoft zoals natuurrampen, oorlog, terrorisme, rellen of overheidsacties uitgesloten van de SLA. Ook worden netwerk en device problemen die buiten de Azure data centers optreden niet gedekt door de SLA. Dit betreft ook zaken in uw eigen omgeving (of klant omgeving) en het Azure data center.

 

Service Credits

De meeste SLAs bieden een diensttegoed of service credit. Dit betreft een percentage van de Toepasselijke Maandelijkse Servicekosten (Applicable Monthly Service Fees), die gecrediteerd kunnen worden na goedkeuring van Microsoft. Een aantal Azure services zoals Virtual Machines bieden tot 100% service credits wanneer de maandelijkse uptime onder de 95% komt en 25% wanneer de update onder de 99,99% komt. Maar andere Azure services zoals Azure Functions bieden slechts een maximale service credit van 25%, wanneer de maandelijkse uptime onder de 99% komt.

De Azure SLA dekt alleen uw Azure consumptie en dekt derhalve geen nevenschade die wellicht optreed bij uitval van uw app of dienst. Het is daarom geen alternatief voor een robuust en hoog beschikbaar Azure design.

Om een service credit aan te vragen dient er een claim te worden ingediend middels een support ticket met daarin alle relevante informatie, voor het einde van de volgende maand. Aan het ticket moet ook het zogenaamde Outage incident identifier van de Service Health pagina worden toegevoegd. Uw Cloud Solution Provider (CSP) partner kan helpen bij dit proces.

 

Beschikbaarheid verhogen

De Azure SLA is een uitstekend vertrekpunt voor het maken van het een Azure design. Door naar de verschillende requirements voor een bepaalde Azure Service te kijken krijg je inzicht in de manier waarop een dienst is ontworpen en de manier waarop deze gebruikt dient te worden volgens Microsoft. Bijvoorbeeld bij het gebruik van Cosmos DB; de standaard SLA is al indrukwekkend met 99,99%. Echter als we meerdere Azure regios instellen als ‘writable endpoints’ voor een Database Account, gaat de Azure Cosmos DB SLA naar maar liefst 99,999%, voor zowel lees- als schrijfbeschikbaarheid.

Azure biedt ook diverse beschikbaarheids opties die aan een dienst toegevoegd kunnen worden, voor Virtual Machines kan bijvoorbeeld gebruik gemaakt worden van Availability Sets. Een availability set is een logische groepering van VM’s waarmee Azure kan begrijpen hoe uw app is ontworpen, om zo redundantie en beschikbaarheid te kunnen bieden.

Je kan ook Availability Zones gebruiken voor diverse Azure services zoals VM Scale Sets (gebruikt in bijvoorbeeld Azure Kubernetes Services), Azure Backup, Storage Accounts, Key Vaults en nog meer. Een Availability Zones is een optie waarmee hoge beschikbaarheid gerealiseerd kan worden voor applicaties en data door deze te beveiligen tegen Data Center-uitval. Availability Zones zijn unieke, fysieke locaties binnen een Azure-regio. Elke zone bestaat uit een of meer datacenters die zijn voorzien van onafhankelijke stroomvoorziening, koeling en netwerk.

Voor het wereldwijd schalen van apps is de Cross-region load balancer beschikbaar, hiermee zijn indrukwekkende geografisch redundante HA-scenario's te realiseren.

 

Beschikbaarheid Monitoren

Middels de Azure Status page is de status van elke regio en service te raadplegen. Voor individuele Azure services zijn de Service Health en Resource Health pagina’s de locaties om inzicht te krijgen in de huidige en historische status van globale en individuele services. Service Health pagina bewaard een 90 dagen geschiedenis van gebeurtenissen.

Specifiek voor Web applicaties is het mogelijk om binnen Application Insights de behaalde SLA te berekenen door gebruik te maken van de Availability -> SLA Report option feature. De rapportage kan aangepast worden volgens eigen criteria zoals de web test parameters, de failure thresholds en eventuele outage windows. Binnen de SLA rapportage heeft u de mogelijkheid om in tijd of per locatie de beschikbaarheid weer te geven:


Vervolg de availability reis door het Azure Architecture Center te bezoeken, of bezoek een van de kostenloze Azure Events hosted by Intercept. We geven workshops op het gebied van Application Insights, Fundamentals voor ISV's, Cloud Native in a Day, AKS Deepdive en Azure DevOps.

Tags

  • Azure Fundamentals
  • Application Insights
  • App Modernization
  • Monitoring
  • PaaS
  • Managed AKS
  • Governance
  • IaaS
  • Serverless
  • Datacenter Migration

Geschreven door

Rinie Huijgen

Rinie Huijgen

CTO bij Intercept

Wellicht ook interessant:

  • 202011111 Intercept Illustratie Bij Artikel Aks Monitoring A

    AKS monitoring en management

    In dit artikel geven we je op een hoog niveau meer inzicht in de mogelijkheden van het monitoren van (Azure) resources, maar AKS-clusters in het bijzonder.

    • Leesduur 9min
    Meer over AKS monitoring en management
  • Ingress Name (2)

    Ingress, Services, Pods & Namespaces.

    Nadat je de container technologie hebt omarmd en hebt besloten dat Kubernetes gaat gebruiken, moet je aan de bak en je erin gaan verdiepen. Er is namelijk veel te leren, maar een aantal belangrijke concepten zoals Services, Pods, Ingresses en namespaces zijn van cruciaal belang voor je succes.

    • Leesduur 8min
    Meer over Ingress, Services, Pods & Namespaces.
  • Frontliners 3

    Case Frontliners

    Van IaaS naar Paas: een verschuiving van het gebruik van Virtuele Machines, naar de flexibiliteit en schaalbaarheid van een Webapp.

    Meer over Case Frontliners
  • 20201123 Intercept Illustratie Bij Artikel Altijd De Juiste

    Wat voor SQL database oplossing kan ik het beste gebruiken?

    Een vraag die vaak gesteld wordt bij het transformeren van een applicatie naar Azure is; wat voor SQL database oplossing kan ik het beste gebruiken? In dit artikel gaan we je meer vertellen over de mogelijke opties, waar je op moet letten bij deze keuze en welke database wij aanraden voor welke situatie.

    • Leesduur 4min
    Meer over Wat voor SQL database oplossing kan ik het beste gebruiken?
  • 20200624 Azure Landing Illustratie V4

    Wat is een Azure Landing Zone?

    Stroomlijn jouw Azure cloudmigratie met een Azure Landing Zone. Zo creeer je een framework waarbinnen je organisatie efficient en gecontroleerd een cloudmigratie kan uitvoeren. 

    • Leesduur 4min
    Meer over Wat is een Azure Landing Zone?
  • Intcercept Ebook Llustratie Strategy (1)

    Transformatievlakken voor ISV’s - Strategie

    In dit artikel behandelen we één van deze transformaties waar je als ISV mee te maken krijgt als je een transitie maakt naar de Public Cloud. We gaan kijken naar de strategie en de aandachtspunten die daarbij komen kijken.

    • Leesduur 6min
    Meer over Transformatievlakken voor ISV’s - Strategie
  • Artikel 5 Foto Engels 2

    Welke Azure Cloud Services zijn interessant voor mijn organisatie?

    Azure heeft voor iedere vorm van cloud computing een aanbod aan services als aanvulling op je omgeving. Er zijn tal van Azure Cloud Services waaruit je kunt kiezen. De belangrijkste en interessantste services voor je organisatie behandelen we in dit artikel.

    • Leesduur 3min
    Meer over Welke Azure Cloud Services zijn interessant voor mijn organisatie?
  • Template Artikel 42 Foto Engels Versie 21

    Wat is Azure Cloud Governance en hoe integreer ik het in mijn omgeving?

    Cloudtechnologieën zijn relatief eenvoudig te implementeren. Je kunt letterlijk binnen enkele minuten up and running zijn, maar haastig starten leidt helaas vaak tot meerwerk. Daarom is het belangrijk dat je beschikt over een gedegen plan.

    • Leesduur 4min
    Meer over Wat is Azure Cloud Governance en hoe integreer ik het in mijn omgeving?
  • Template Artikel Foto 3

    App en platform modernisatie: Rehost, Refactor, Rearchitect, Rebuild & Replace

    Als je hebt besloten om de overstap te maken naar Azure, begint het proces van cloudmigratie. Verschillende ingewikkelde beslissingen spelen een rol in dit proces. Het is daarom aan te raden om volgens een zorgvuldig opgestelde migratiestrategie aan de slag te gaan.

    • Leesduur 3min
    Meer over App en platform modernisatie: Rehost, Refactor, Rearchitect, Rebuild & Replace
  • Artikel Foto 1 Engels

    Wat is Microsoft Azure en waarom kiezen organisaties voor Azure?

    Ben je van plan om met je organisatie de overstap te maken naar de Cloud en overweeg je de keuze voor Microsoft Azure? In dit artikel leggen we uit wat Microsoft Azure omvat, wat de voordelen zijn van de Cloud en of Microsoft Azure wel de beste keuze is voor je organisatie.

    • Leesduur 5min
    Meer over Wat is Microsoft Azure en waarom kiezen organisaties voor Azure?
  • Marketplace 1

    Bereik meer klanten – Publiceer jouw oplossing in de Azure Marketplace

    Veel mensen maken gebruik van de Azure Marketplace zonder dat ze zich hier bewust van zijn. Maar wat is het eigenlijk? En wat kan je ermee? In dit artikel leggen we uit wat de Marketplace is, wat de voordelen zijn en hoe je jouw applicatie of software in de Marketplace publiceert.

    • Leesduur 6min
    Meer over Bereik meer klanten – Publiceer jouw oplossing in de Azure Marketplace
  • How The Performance Of Saasbased Applications Can Impact You

    De impact van SaaS op de software-industrie

    Uit onderzoek blijkt dat 66% van de ISVs haar applicatie ‘verSaaSt’ omdat ze nieuwe klanten willen aantrekken. Naast het aantrekken van nieuwe klanten brengt het verSaaSen van je applicatie nog meer voordelen met zich mee.

    • Leesduur 5min
    Meer over De impact van SaaS op de software-industrie
  • Intercept De Cloud Is Ook Bij Veel Dataverkeer

    De cloud is, ook bij veel dataverkeer, de oplossing voor ISVs

    Veel organisaties, voornamelijk ISV's, denken dat overstappen naar de Public Cloud gepaard gaat met hoge kosten. Dit hoeft absoluut niet zo te zijn. Sterker nog, overstappen naar de Public Cloud is vaak voordeliger.

    • Leesduur 3min
    Meer over De cloud is, ook bij veel dataverkeer, de oplossing voor ISVs
  • Lift En Shift Engels 1

    Wat is een lift en shift naar Azure nu echt en wat krijg ik?

    Lift en shift of ‘rehosting’ kan voelen alsof je resources van A naar B verplaatst, wat inhoudt dat je zowel het goede als het slechte verplaatst en eindigt met een omgeving die bijna identiek is aan wat je had. Maar rehosting van je omgeving is zoveel meer dan dat. In plaats van het simpelweg verplaatsen van resources, laten we het nu vanaf een andere invalshoek bekijken.

    • Leesduur 7min
    Meer over Wat is een lift en shift naar Azure nu echt en wat krijg ik?
  • Top 5 Afbeelding

    Top 5 Azure Paas and serverless services you don't want to miss as an ISV

    Wij werken dagelijkse met meerdere Independent Software Vendors (ISVs) om hun oplossing te optimaliseren met behulp van Microsoft Azure. Omdat wij een aantal PaaS diensten dagelijks tegenkomen bij onze klanten willen wij onze top 5 met jullie delen.

    • Leesduur 6min
    Meer over Top 5 Azure Paas and serverless services you don't want to miss as an ISV
  • Azure Logo

    Microsoft Azure: wat is het en hoe werkt het?

    De wereld staat nooit stil, vooral niet in de wereld van een ISV. Een belangrijke vraag voor een softwarebedrijf is dan ook: hoe blijf ik up-to-date? Microsoft Azure kan je hierbij helpen.

    • Leesduur 2min
    Meer over Microsoft Azure: wat is het en hoe werkt het?
  • Intercept Application Insights

    Application Insights: verbeter de gebruikerservaring door eenvoudig inzicht te krijgen in de performance van je applicatie [Technical Azure Hacks]

    Monitoring, analyse en het rapporteren is een vraagstuk waar vaak achteraf naar wordt gekeken waardoor het uiteindelijk uitmondt in een complex vraagstuk. Als organisatie moet je nagaan met welk doel je welke gegevens wilt verzamelen, over welke gegevens je beschikt en wat je dan inzichtelijk wil maken.

    • Leesduur 6min
    Meer over Application Insights: verbeter de gebruikerservaring door eenvoudig inzicht te krijgen in de performance van je applicatie [Technical Azure Hacks]