Projekt tardigrade beskytter dine vms mod værtsfejl

Indholdsfortegnelse:

Video: Dodging an Orbital while Going Down? | Project Tardigrade #2 2024

Video: Dodging an Orbital while Going Down? | Project Tardigrade #2 2024
Anonim

Efter flere Azure-ændringer og sikkerhedsforbedringer i de sidste par måneder introducerer Microsoft Project Tardigrade som deres nyeste forsøg på at gøre Azure mere pålidelige.

Project Tardigrade forhindrer platformfejl

Project Tardigrade er en ny service, der sigter mod at forbedre Azure-modstandsdygtighed. Det inkluderer afbødningsstrategier, der beskytter Azure VM'er mod platformfejl.

Her er, hvordan Mark Russinovich, Chief Technology Officer hos Microsoft Azure, beskriver det aktuelle arbejde med Azure:

Vores mål er at styrke organisationer til at køre deres arbejdsmængder pålideligt på Azure. Med dette som vores ledende princip investerer vi kontinuerligt i at udvikle Azure-platformen til at blive fejlgivende, ikke kun for at øge virksomhedens produktivitet, men også for at give en problemfri kundeoplevelse.

For at forhindre påvirkning af dine arbejdsmængder gør tjenesten det muligt for komponenter at selvhelbrede og hurtigt komme sig efter potentielle fejl, selv i kritiske værtsfejl.

Hvordan fungerer Project Tardigrade?

Her er et eksempel på, hvordan Tardigrade-gendannelsesprocessen fungerer:

  • Fase 1: Dette trin har ingen indflydelse på at køre kunde-VM'er. Det genanvendes simpelthen alle tjenester, der kører på værten. I det sjældne tilfælde, at den fejllagte service ikke genstarter, fortsætter vi til fase 2.
  • Fase 2: Vores diagnosetjeneste kører på værten for at indsamle alle relevante logfiler / dumps systematisk for at sikre, at vi grundigt kan diagnosticere årsagen til fejl i fase 1. Denne omfattende analyse giver os mulighed for at "rodfæste" problemet og derved forhindre gentagelser i fremtiden.
  • Fase 3: På et højt niveau nulstiller vi operativsystemet i en sund tilstand med minimal kundepåvirkning for at afbøde værtsproblemet. I denne fase bevarer vi tilstande for hver VM til RAM, hvorefter vi begynder at nulstille operativsystemet til en sund tilstand. Mens OS hurtigt nulstilles nedenunder, kører applikationer på alle VM'er, der er vært på serveren, kort, mens CPU'en midlertidigt er suspenderet. Denne oplevelse ligner en netværksforbindelse, der midlertidigt er mistet, men hurtigt genoptages på grund af gentilforsøgslogik. Når operativsystemet er nulstillet, forbruger VM'erne deres lagrede tilstand og genoptager normal aktivitet og omgår dermed eventuelle VM-genstarter.

Med dette i tankerne vil Project Tardigrade sikre, at fiaskoen for en enkelt komponent i værten ikke påvirker hele systemet. Som sådan påvirkes ikke kunde-VM'er af værtsfejl.

Microsoft arbejder hårdt for at forbedre og udvide de forskellige hostfejl-scenarier for at sikre, at deres cloud computing-platform er mere pålidelig end nogensinde.

Forvent nye udviklinger og andre pålidelighedsimplementeringer i den nærmeste fremtid.

Projekt tardigrade beskytter dine vms mod værtsfejl