Travaux et Informations

  • Status Férmée
  • Percent Complete
    100%
  • Task Type Matérielle
  • Category Backend / Core
  • Assigned To No-one
  • Operating System All
  • Severity Critical
  • Priority Very Low
  • Reported Version 1.0
  • Due in Version Undecided
  • Due Date Undecided
  • Votes
  • Private
Attached to Project: Cloud
Opened by NFrance - 20/01/2023
Last edited by NFrance - 28/04/2023

FS#329 - [resolu]Incident sur le CLoud Public

Bonjour,

Un incident impacte de nombreuses VMs sur le Cloud Public.
Notre équipe travaille dessus pour rétablir le service au plus vite.

Update 09h37 : la source de l'incident est clairement identifiée, une solution de contournement est en cours de mise en place.

Update 10h02 : la solution met plus de temps que prévue à être déployée, nous restons pleinement mobilisé pour rétablir les services au plus vite.

Update 10h49 : déploiement de la solution en cours. Prochaine mise à jour du ticket à 12h00 au plus tard.

Update 11h43 : la solution appliquée fonctionne. Les premiers serveurs sont repartis. Nous nous assurons du bon redémarrage des suivants.

Update 13h10 : la moitié des VMs impactées sont de nouveaux en service. L'autre moitié devrait aller plus rapidement.

Update 13h33 : l'ensemble des VMs sont repartis. Il reste certains services à l'arrêt, nous sommes en train de les redémarrer.

~ 16h00 : l'ensemble des services ont été rétablis.

Nous sommes désolé pour la gêne occasionné.

En application de l'amélioration continue qui est l'ADN d'NFrance, nous allons mettre en œuvre les contre mesures pour qu'un tel incident ne se reproduise pas, ou si tel devait être le cas, pour que l'impact soit bien plus limité.

Loading...

Available keyboard shortcuts

Tasklist

Task Details

Task Editing