Réflexe inconditionné

Il y a bien une chose qui me fait “halluciner”, c'est le réflexe du loueur moyen de serveur chez OVH, c'est entre 200 et 300 serveurs OVH que je vois en “electricReboot” sur leur interface de monitoring des baies (ils appellent ca VMS). Ce qui veut dire que c'est 200 a 300 personnes qui ont demandé un reboot électrique de leur serveur après un incident réseau de cet hébergeur sans avoir vérifié quoi que ce soit. “Oh mon dieu je n'accède plus a rien sur mon serveur ! Vite un reboot !”

Quand je reçois un SMS d'alerte (je monitore mes serveurs par des “services” extérieur) concernant un de mes serveur, je n'en déduis pas forcement que mon serveur est cassé.

Je suis tout un “processus” pour trouver l'origine du problème en remontant depuis “mon cul sur ma chaise” jusqu'au serveur. Je remonte chaque étape du réseau, si ça bloque avant, c'est que mon serveur va bien, et je touche du bois, pour l'instant, c'est toujours le cas.

Grâce a un coup de bol, j'ai toujours au moins un serveur sur chacun de leur Datacenter, ce qui me permet de remonter et me connecter vers mon serveur (“l'interne” -Ovh to Ovh- fonctionnant dans 99,9% des cas, seul l'externe restant problématique).

Depuis que Vault est en production, j'ai eu plusieurs problème réseau, mais aucun problème sur la machine proprement dite.

D'ailleurs en ce moment c'est toujours le même routeur le fautif, "VSS-1-6k" leur pose de sacré problème…

Discussion

Entrer votre commentaire
 
blog/reflexe_inconditionne.txt · Dernière modification: Wednesday 01 April 2009 par kathryl
Flux RSS du Blog Driven by DokuWiki Gentoo Powered Valid XHTML1.0 Powered by Apache PHP Powered Coffee Powered