Thursday, August 20, 2009

incident datacenter - résolu

Suite à un problème sur le système de climatisation d'une de nos salles machines, nous sommes dans l'obligation d'éteindre une partie des serveurs utilisés sur notre plateforme d'hébergement (serveurs et blogs). Une intervention est en cours, nous vous donnerons une estimation du temps de rétablissement d'ici quelques minutes.

23:40:: le prestataire en charge de ce datacenter est en train de passer sur le système de climatisation de secours.

00:40: la température commence a redescendre, nous allons progressivement rallumer une partie des machines, le prestataire travaille toujours sur le système de climatisation (pas encore de temps de rétablissement complet à donner). Env 25% de nos clients sont touchés mais ce chiffre devrait significativement baisser dans les prochaines minutes.

00:48: information du gestionnaire: système de secours défaillant lui aussi, pas encore de temps de remise en service disponible. Nous continuons à rallumer des machines tant que la température se maintient.

01:30: la température ne baisse plus, nous allons éteindre des services non-critiques pour permettre de servir un maximum de serveur. Toujours pas de news du gestionnaire du datacenter :(

07:00: la température dans la deuxième salle impactée par la panne de climatisation est redescendu. Nous sommes en train de remonter des services dans cette salle. Quelques services restent en mode dégradé.

07:45: Quasiment tous les services sont maintenant disponibles

08:15: Incident résolu. Merci de contacter notre service client en indiquant que votre serveur est bloqué sur notre formulaire si vous avez le moindre problème lié au problème de cette nuit.

No comments: