- Status Férmée
- Percent Complete
- Task Type Matérielle
- Category Backend / Core
- Assigned To No-one
- Operating System All
- Severity Critical
- Priority Very Low
- Reported Version 1.0
- Due in Version Undecided
-
Due Date
Undecided
- Votes
- Private
FS#329 - [resolu]Incident sur le CLoud Public
Bonjour,
Un incident impacte de nombreuses VMs sur le Cloud Public.
Notre équipe travaille dessus pour rétablir le service au plus vite.
Update 09h37 : la source de l'incident est clairement identifiée, une solution de contournement est en cours de mise en place.
Update 10h02 : la solution met plus de temps que prévue à être déployée, nous restons pleinement mobilisé pour rétablir les services au plus vite.
Update 10h49 : déploiement de la solution en cours. Prochaine mise à jour du ticket à 12h00 au plus tard.
Update 11h43 : la solution appliquée fonctionne. Les premiers serveurs sont repartis. Nous nous assurons du bon redémarrage des suivants.
Update 13h10 : la moitié des VMs impactées sont de nouveaux en service. L'autre moitié devrait aller plus rapidement.
Update 13h33 : l'ensemble des VMs sont repartis. Il reste certains services à l'arrêt, nous sommes en train de les redémarrer.
~ 16h00 : l'ensemble des services ont été rétablis.
Nous sommes désolé pour la gêne occasionné.
En application de l'amélioration continue qui est l'ADN d'NFrance, nous allons mettre en œuvre les contre mesures pour qu'un tel incident ne se reproduise pas, ou si tel devait être le cas, pour que l'impact soit bien plus limité.
Un incident impacte de nombreuses VMs sur le Cloud Public.
Notre équipe travaille dessus pour rétablir le service au plus vite.
Update 09h37 : la source de l'incident est clairement identifiée, une solution de contournement est en cours de mise en place.
Update 10h02 : la solution met plus de temps que prévue à être déployée, nous restons pleinement mobilisé pour rétablir les services au plus vite.
Update 10h49 : déploiement de la solution en cours. Prochaine mise à jour du ticket à 12h00 au plus tard.
Update 11h43 : la solution appliquée fonctionne. Les premiers serveurs sont repartis. Nous nous assurons du bon redémarrage des suivants.
Update 13h10 : la moitié des VMs impactées sont de nouveaux en service. L'autre moitié devrait aller plus rapidement.
Update 13h33 : l'ensemble des VMs sont repartis. Il reste certains services à l'arrêt, nous sommes en train de les redémarrer.
~ 16h00 : l'ensemble des services ont été rétablis.
Nous sommes désolé pour la gêne occasionné.
En application de l'amélioration continue qui est l'ADN d'NFrance, nous allons mettre en œuvre les contre mesures pour qu'un tel incident ne se reproduise pas, ou si tel devait être le cas, pour que l'impact soit bien plus limité.
Loading...
Available keyboard shortcuts
- Alt + ⇧ Shift + l Login Dialog / Logout
- Alt + ⇧ Shift + a Add new task
- Alt + ⇧ Shift + m My searches
- Alt + ⇧ Shift + t focus taskid search
Tasklist
- o open selected task
- j move cursor down
- k move cursor up
Task Details
- n Next task
- p Previous task
- Alt + ⇧ Shift + e ↵ Enter Edit this task
- Alt + ⇧ Shift + w watch task
- Alt + ⇧ Shift + y Close Task
Task Editing
- Alt + ⇧ Shift + s save task