System Administration : Installation et Configuration d'un Système RAID

par Antonio Castro

L´auteur:

Je serai toujours reconnaissant à l'équipe de LinuxFocus dans son ensemble (traducteurs aussi), qui ont bien souvent participé de manière éloignée à améliorer l'aspect de cet article.
A cette occasion, j'aimerais remercier une personne en particulier: cet article n'aurait jamais vu le jour sans l'aide de Luis Colorado qui, e-mail après e-mail, a partagé avec moi ses connaissances du système RAID. Merci Luis.

Sommaire:

Introduction
Sélection de disques pour un système RAID
Caractéristiques d'un système SCSI
Types de RAID
Comment installer un système RAID0
Par exemple
Pour de plus amples informations

Installation et Configuration d'un Système RAID

Résumé:

RAID (Redundant Array of Inexpensive Disks: Grappe de Disques Durs Standards) est un ensemble de sous-systèmes destinés à combiner plusieurs disques durs en une seule entité virtuelle, qui se comportera comme un seul et unique disque; les différents disques fonctionneront en parallèle. Cela permet d'améliorer les performances d'accès et de protéger les informations stockées des plantages-disque.

Introduction

Il existe un certain nombre de solutions matérielles dans le marché, très chères et généralement basées sur l'utilisation de certaines cartes-contrôleur.

On peut trouver d'autres implémentations RAID basées sur des cartes qui autorisent un utilisateur à mettre plusieurs disques en RAID, grâce à un simple microprocesseur Z80 et des logiciels embarqués. Au regard de ces spécifications, il n'est pas possible de dire que cette solution donnera de meilleurs résultats qu'une solution basée sur Linux.

Les implémentations basées sur des cartes-contrôleur coûtent cher et obligent l'utilisateur à n'acheter que des disques durs identiques. D'autre part, Linux avec les pilotes de périphériques adéquats, peut gérer certaines de ces cartes, mais cela n'est pas une solution interessante car Linux offre une solution aussi efficace, basée sur du logiciel libre, excluant ainsi les alternatives matérielles onéreuses.

Le système RAID de Linux dont nous parlons, est implémenté au niveau du noyau et nous permet d'utiliser des disques durs de type différent: il peut s'agir d'un mélange de disques IDE et SCSI. Des disques durs de capacité différente peuvent être utilisés, mais dans ce cas, il sera nécessaire de créer des partitions de taille identique sur chacun des disques. La solution la plus commune est d'utiliser plusieurs disques de même capacité, mais malgré tout, il était bon de signaler que Linux offrait beaucoup plus de flexibilité. Par exemple, une partie d'un disque peut être utilisée pour un RAID et une autre comme partition indépendante. Ce n'est souvent pas une bonne idée parce que l'utilisation d'une partition indépendante peut réduire la vitesse d'accès du système RAID. En d'autres termes, même si Linux permet d'utiliser n'importe quel type de disques durs, les résultats seront toujours meilleurs s'il est possible d'utiliser des disques de capacité et de caractéristiques identiques. Une autre chose importante à prendre en considération est que la technologie SCSI permet l'accès simultané à tous les périphériques connectés au bus, alors que des disques situés sur la même carte-contrôleur IDE ne pourront jamais être accédés en même temps. Il est vraiment dommage que les disques SCSI soient encore si chers par rapport à leurs homologues IDE.

La solution logicielle d'un système RAID sous Linux est aussi efficace (si ce n'est plus) que celles basées sur des cartes spécifiques et bien sûr moins coûteuse et beaucoup plus flexible en termes de disques durs autorisés.

Sur une configuration SCSI, un périphérique peut envoyer des données au bus tandis qu'un autre est en train de les récupérer, alors que sur une interface IDE, un seul disque est accédé puis le deuxième.

Sélection de disques pour un système RAID

L'utilisation de disques durs très rapides pour mettre en place un RAID, n'est souvent pas justifiée. Ceux-ci sont plus chers. Les disques sont rapides parce que leurs têtes sont plus efficaces et plus promptes à se positionner sur le secteur approprié. Le déplacement de secteur en secteur est une opération qui nécessite beaucoup de temps sur un disque dur, mais sous Linux -contrairement à MS-DOS, par exemple-, cette opération est optimisée à un tel degré, que les informations ne sont pas accédées dans l'ordre où elles ont été demandées: l'accès aux données se réalise par un principe d'"hiérarchie intelligente", qui mémorise les demandes et y répond dans l'ordre le plus efficace.

...Linux offre une solution aussi efficace, basée sur du logiciel libre, excluant ainsi les alternatives matérielles onéreuses.

Il existe d'autres méthodes pour augmenter la performance, en diminuant le nombre d'accès-disque, comme le cache en mémoire. Les vitesses de rotation des disques ne sont souvent pas si différentes mais il peut y avoir des différences notables concernant la densité et le nombre de têtes, qui peuvent affecter le taux de transfert de manière significative. C'est un paramètre dont nous devons tenir compte. En bref, nous vous recommandons est d'utiliser des disques durs SCSI, si possible de caractéristiques similaires et pas forcément coûteux. La vitesse du système RAID proviendra de l'accès simultané aux disques, et non de la rapidité individuelle de ceux-ci.

Il faut également tenir compte du fait que le système Linux doit démarrer d'un disque non-RAID et de petite taille afin que la partition root soit relativement libre.

Caractéristiques d'un système SCSI

Au moment de se procurer les disques durs, plusieurs doutes peuvent surgir. Pour cette raison, c'est une bonne idée d'énoncer de manière un peu plus exhaustive, les principales caractéristiques auxquelles il faut prêter attention.


Nom	NumBits	NumDev	MB/s	Connecteur	Longueur Max Cable
SCSI-1	8	7	5	50 broches Basse Densité	6 mts
SCSI-2 (alias) Fast scsi, o Narrow scsi	8	7	10	50 broches Haute Densité	3 mts
SCSI-3 (alias) Ultra, o Fast20	8	7	20	50 broches Haute Densité	3 mts
Ultra Wide (alias) Fast scsi-3	16	15	40	68 broches Haute Densité	1.5 mts
Ultra2	16	15	80	68 broches Haute Densité	12 mts

Un RAID peut être composé de plusieurs partitions disques mais le résultat final sera une unique partition logique avec un seul disque, sur lequel nous ne pourrons pas créer de partitions supplémentaires. Le nom de ce périphérique logique est métadisque.

Sous Linux, les périphériques IDE sont des fichiers appelés /dev/hd..., aux périphériques SCSI correspondent les /dev/sd..., et les métadisques se voient nommés /dev/md... après avoir compilé le noyau avec les options adéquates. Quatre périphériques de ce type doivent être présents:

brw-rw----   1 root     disk       9,   0 may 28  1997 md0
brw-rw----   1 root     disk       9,   1 may 28  1997 md1
brw-rw----   1 root     disk       9,   2 may 28  1997 md2
brw-rw----   1 root     disk       9,   3 may 28  1997 md3

Le premier but à atteindre sera d'essayer de rendre le temps d'accès au swap le plus petit possible; à cette fin, la meilleure solution est d'utiliser un petit métadisque sur le RAID, ou d'étaler le swap de manière traditionnelle sur tous les disques physiques. Si plusieurs partitions swap sont utilisées, chacune sur un disque dur physique différent, alors Linux s'occupera de gérer celles-ci et le RAID ne sera pas nécessaire dans ce cas.

Types de RAID

Soit N le nombre de disques.

RAID0 (mode "stripping": entrelacement): Dans ce mode, tous les disques sont organisés de manière alternative, afin que les blocs de données soient pris en proportions égales sur tous les disques durs, alternativement, dans le but d'atteindre un débit supérieur. Comme la probabilité de trouver un bloc d'un fichier est identique sur tous les disques, il faut les faire travailler simultanément, augmentant ainsi la performance du métadisque d'à peu près N fois celle d'un disque seul.
RAID1 (mode "mirroring": premier niveau de redondance): Dans ce mode, le but est d'atteindre la plus grande sécurisation des données. Les blocs de données sont dupliqués sur tous les disques physiques (chaque bloc du disque "virtuel" a un doublon sur chacun des autres disques). Cette configuration permet d'accroitre N fois la performance en lecture d'un seul périphérique, mais elle ralentit la performance en écriture. Les opérations de lecture peuvent être organisées de manière à lire N blocs simultanément, un sur chacun des périphériques en un temps. Idem quand vous écrirez un bloc, il sera dupliqué N fois, une fois sur chacun des périphériques physiques. Il n'y a aucun avantage à tirer dans cette configuration au niveau de la capacité de stockage.
RAID4 (Remarque: Les types RAID2 et RAID3 sont obsolètes): Dans ce mode, la finalité est de combiner les avantages du RAID0 et du RAID1. Les données sont organisées en mélangeant les deux méthodes. Les périphériques de 1 à N-1 sont organisés en mode entrelacé (RAID0), et le N-ième enregistre la parité des bits individuels correspondant aux blocs allant de 1 à N-1. Si l'un des disques a un problème, il est possible de récupérer les données en utilisant l'information de parité du disque N. La performance en lecture est de N-1 et en écriture de 1/2 (parce que maintenant,l'écriture d'un bloc de données implique aussi l'écriture sur le disque de parité). Dans la perspective de restaurer un disque dur corrompu, on a seulement à relire l'information et à la ré-écrire dessus (cela lit du disque de parité mais cela écrit sur le nouveau disque dur).
RAID5: Ce mode est similaire au RAID4, sauf que maintenant les informations du disque de parité est étalée sur tous les disques durs: il n'existe pas de disque de parité proprement dit. Cela permet de réduire le temps de chargement du disque de parité, qui doit être accédé à chaque opération en écriture dans le RAID4. Maintenant, le disque où l'information de parité d'une piste est stockée, est différent pour chaque piste.

Installation et Configuration d'un Système RAID

Introduction

Sélection de disques pour un système RAID

Caractéristiques d'un système SCSI

Types de RAID

Comment installer un système RAID0

Par exemple

Pour de plus amples informations