skip to Main Content
01 83 79 95 95 contact@voxy.fr

RAID : bonne ou mauvaise chose ?

RAIDCombien d’exploitants sont-ils réellement informés de la défaillance d’un disque et combien parmi eux procèdent rapidement à son remplacement ?

Nous avons pu constater à plusieurs reprises que les dispositifs RAID apportaient parfois plus d’inconvénients que d’avantages. Cela ne signifie évidemment pas qu’ils doivent être abandonnés, bien au contraire ! Néanmoins, comme la plupart des moyens de sécurisation, ils doivent faire l’objet d’une attention particulière.

Un système en RAID se justifie uniquement si on met en oeuvre un mécanisme d’alerte sur panne et qu’on s’assure que quelqu’un traitera une telle alerte !

Si tel n’est pas le cas, on aura seulement retardé la survenance de la panne. En effet, il n’est pas rare que plusieurs disques de même génération atteignent leur limite d’âge à peu d’intervalle. Le dispositif RAID aura alors été mis en œuvre pour (presque) rien : achat, installation, configuration des alertes … Et le plus grave est qu’on croit être à l’abri d’une panne disque.

Autre croyance fausse : le RAID améliorerait la fiabilité. C’est inexact : le RAID peut accroître la disponibilité d’un système, mais il en réduit la fiabilité ! En effet, le simple fait de mettre en oeuvre un composant supplémentaire (en l’occurrence au moins 3 : un ou plusieurs disques, un contrôleur RAID, et des portions de logiciel) dans un système en augmente mathématiquement la probabilité de panne.

Pour conclure sur ce sujet, voici un exemple contre-productif d’utilisation du RAID qui s’est produit chez l’un de nos clients. Il s’agissait d’ajouter des disques sur un serveur manquant d’espace libre. L’intervention a été planifiée un week-end pour ne pas perturber les utilisateurs. L’ingénieur système avait tout prévu : sauvegardes, disques de rechange, cordons appropriés, n° de l’assistance technique des fournisseurs … Après insertion des disques et redémarrage du système, le contrôleur a entrepris la fameuse reconstruction. Après quelques longues minutes d’attente, le technicien est parti dîner, comptant que l’opération serait terminée à son retour. Il n’en fut rien … ni ce soir là, ni durant la nuit qui suivit, ni même le samedi et le dimanche. Le mercredi matin, le système n’a pu être remis en service que peu de temps avant l’ouverture du TP (heureusement, une solution d’attente avait pu être mise en place pour le lundi matin).
Aucun disque de ce système n’a jamais connu de défaillance jusqu’à son arrêt définitif 7 ans plus tard … La question qui se pose est : fallait-il mettre en œuvre une matrice RAID avec des disques dont le MTBF est supérieur à 10 ans pour une application qui, en définitive, n’était pas tellement critique ?

Back To Top
Rechercher