Retour d’expérience : Panne d’un serveur HP Proliant & SAV HP
La semaine dernière dans ma boîte, notre serveur de fichiers, un HP Proliant 185 G5 est tombé en panne; enfin c’est surtout la carte mère qui est tombée en panne. Malgré notre contrat J+1, la panne est réparée une semaine plus tard. J’ai rédigé un article pour notre communication interne, pour nos utilisateurs. Je vous mets le texte brut. Les (in)compétences du service technique HP font froid dans le dos…
Retour sur la série d’évènements qui a entaché le fonctionnement du service informatique en mode « 24h Chrono ».
Mercredi, 22h48, Salle serveur
Notre serveur de fichiers, le XXXXXXXX pour les intimes, tombe en panne. Le système s’arrête, les diodes clignotent, la carte mère n’est plus de ce monde. Ce serveur gérait notre serveur de fichiers et donc les raccourcis tels que X, Documentations Technique, etc
Techniquement, c’est aussi le serveur qui nous permettait de lire nos bandes de sauvegarde…
Le cadre est placé, les épisodes peuvent commencer.Jeudi, 9h00, Salle serveur
Nous constatons la panne, déplaçons le serveur dans notre bureau. Le problème étant matériel, nous ne pouvons rien faire. Rien ne s’affiche, la carte mère (le cœur de l’ordinateur) clignote rouge. Le serveur étant sous garanti nous prenons contact avec le service technique HP. Après un diagnostique de la panne, on nous annonce que le remplacement de la carte mère sera effectué par un technicien HP, après livraison de la pièce le lendemain dans nos locaux. Ayant un contrat J+1, pour ce serveur, nous sommes dans les temps.En parallèle, nous mettons en place un système afin que les itinérants puissent se connecter à Navision via Citrix.
Vendredi, 12h00, Bureau informatique
Après de nombreuses relances, nous apprenons que le technicien passera à 16h00 et que la pièce sera livrée 30 minutes avant.Vendredi, 16h00, Bureau informatique
Le technicien arrive comme prévu. Il remplace la carte mère par la nouvelle pièce mais le serveur ne démarre toujours pas. N’ayant pas d’autres pièces de remplacement et de solution de la part du technicien, la service technique HP doit nous rappeler lundi matin.Lundi, 8h30, Bureau informatique
Le matin nous recevons une nouvelle carte mère qui est censé être compatible avec notre processeur. Après la venu du technicien, le problème est toujours le même. Le service technique HP est dans le flou et on ne sait toujours pas d’où vient la panne. Le ticket passe à un niveau supérieur, encore.Début de l’aparté
Il faut bien dire que le support HP est très, trop (et je rajouterai bien d’autre qualificatifs encore) loin de la perfection. Les techniciens lisent leurs écrans, parlent de choses qu’ils ne comprennent pas. Avec, comme toujours, dans ces plateformes, l’impossibilité d’avoir un nom et encore moins une ligne directe. On nous promet des rappels qu’on attend toujours d’ailleurs…
Fin de l’apartéLundi, 13h00, Bureau informatique
Nous recevons un premier processeur qui est censé fonctionner sur la nouvelle carte mère.
Un, deux, trois, on recommence. En fait, HP nous envoie une première carte mère puis une seconde sans penser que le processeur n’est pas forcément compatible. *Soupir*
A 18h30, la panne est toujours là et ils ne savent toujours pas pourquoi.Mardi, 8h00, Bureau informatique
Après des trentaines de minutes au téléphone avec le support HP, nous recevons deux nouvelles barrettes mémoire dans la matinée. Nous essayons de les installer avant l’intervention du technicien prévu à 14h48 (sic !) en gardant le service en ligne. Maintenant qu’on les tient…Comme cette manipulation ne résout rien, on nous annonce l’envoi de 2 nouveaux processeurs afin que le technicien face une manipulation (qui ressemble un peu à celle de la dernière chance).
Dans le même temps, on nous annonce deux choses qui nous font encore grincer des dents.
Le technicien initialement prévu à 14h48 ne viendra qu’à 18h30 car ils sont tous occupé. C’est un technicien qui est d’astreinte qui viendra.
Le processeur censé faire démarrer le serveur n’est pas disponible en France, il doit arriver des Pays-Bas le lendemain voir le sur-lendemain.
Mardi, 13h00, Bureau informatique
On insiste, quand même, pour avoir l’intervention du technicien même si toutes les pièces ne sont pas présentes.
Et c’est là qu’intervient la magie HP. On reçoit deux processeurs à 15h00 qui sont des références inconnues…Le technicien arrive à 19h00, et là de nouveau la magie intervient car le processeur hollandais nous est livré à 19h30.
Le technicien peut faire la manipulation, qui n’aboutit à rien… Notre panne passe à un échelon supérieur (encore) et apparemment on aurait découvert une nouvelle panne mondiale. On se rassure comme on peut.
On demande au technicien de déclencher l’envoi d’une nouvelle pièce, la carte Riser que l’on doit recevoir à 8h30 le lendemain et le support technique doit nous rappeler après une nouvelle (oui encore) escalade de l’incident.Mercredi, 8h20, Bureau informatique
La carte est livrée en temps et en heure, on doit toujours nous rappeler pour planifier l’intervention d’un technicien…
On décide de démonter le serveur nous même et de le remonter pièce par pièce en testant avec toutes celles qu’ils nous ont envoyé. Car si on résume, dans notre bureau, on a maintenant 2 barrettes mémoires, 5 processeurs différents, 1 carte mère, 1 carte riser…
En remontant tout nous-mêmes et en testant les pièces une par une, le serveur arrive à redémarrer *ouf*. En fait il fallait que toutes les pièces aient les références les plus récentes.
Nous avons à la suite deux soucis logiciel du au remplacement des pièces. Là, encore le technicien téléphonique HP (de niveau 3) que nous avons en ligne ne parvient pas à nous aider, en fait on peut le dire, il nous embrouille.Après une matinée de recherches d’informations, tests et paramétrages, le serveur est de nouveau parmi nous.
Epilogue
Les pannes et les soucis, en fait, ont été multiples. A la base, c’est uniquement la carte mère qui est tombé en panne. A la suite du remplacement de celle-ci, le processeur n’était pas compatible puis la RAM non plus et la carte Riser non plus.
Au final, HP n’a pas été d’une grande aide, vu les techniciens qui sont intervenus et la hotline inexistante, si ce n’est pour l’envoi des pièces de remplacement.Nous nous excusons pour la gêne occasionnée par cette panne, on a vraiment fait tout notre possible pour être le plus réactif possible mais c’était sans compter sur le fait que nous étions les premiers à avoir cette panne (on ne sait pas si on était les premiers en France ou dans le Monde). HP ne nous ayant pas rappelé pour savoir comment nous avons pu résoudre la panne, nous souhaitons un bon courage aux entreprises qui auront le même problème prochainement.
Retour sur la série d’évènements qui a entaché le fonctionnement du service informatique en mode « 24h Chrono ».








