RAID (informatique) - Définition et Explications

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Introduction

Schéma de principe d'une grappe de disques en RAID 5

En informatique, le mot RAID désigne les techniques permettant de répartir des données sur plusieurs disques durs afin d'améliorer soit la tolérance aux pannes, soit la sécurité, soit les performances de l'ensemble (En théorie des ensembles, un ensemble désigne intuitivement une collection...), ou une répartition de tout (Le tout compris comme ensemble de ce qui existe est souvent interprété comme le monde ou...) cela.

Le terme RAID a été défini en 1987 par l'Université de Berkeley (L'université de Californie, Berkeley (encore appelée UCB, Cal, Berkeley, ou UC Berkeley) est le...), dans un article nommé A Case for Redundant Arrays of Inexpensive Disks (RAID), soit « matrice redondante de disques peu onéreux ». Aujourd'hui, le mot est devenu l'acronyme de Redundant Array of Independent Disks, ce qui signifie « matrice redondante de disques indépendants », car le coût au mégaoctet de tous les disques durs a diminué d'un facteur 1 300 000 en 29 ans, ce qui fait choisir le RAID pour d'autres raisons.

Historique

En 1978, un employé d'IBM (International Business Machines Corporation (IBM) est une société multinationale américaine...), Norman Ken Ouchi, déposa un brevet concernant un « Système de récupération de données (En informatique, en l'absence de sauvegardes, la récupération de données consiste...) stockées dans une unité de stockage défectueuse », et dont la description était ce que deviendrait plus tard le . Ce brevet fait également mention du miroitage de disque (Le mot disque est employé, aussi bien en géométrie que dans la vie courante, pour désigner une...) (qui sera appelé plus tard ), ainsi que de la protection avec une parité dédiée (qui sera appelé plus tard ).

La technologie (Le mot technologie possède deux acceptions de fait :) RAID a été élaborée par un groupe de chercheurs de l'Université (Une université est un établissement d'enseignement supérieur dont l'objectif est la...) de Berkeley (Californie) en 1987. Ces derniers étudièrent la possibilité de faire reconnaître deux disques durs ou plus comme une seule unité par le système. Ils obtinrent pour résultat un système de stockage aux performances bien meilleures que celles des systèmes à disque dur (Un disque dur est une mémoire de masse magnétique utilisée principalement dans les...) unique, mais doté d'une très mauvaise fiabilité (Un système est fiable lorsque la probabilité de remplir sa mission sur une durée...). Les chercheurs s'orientèrent alors vers des architectures (Architectures est une série documentaire proposée par Frédéric Campain et Richard Copans,...) redondantes, afin d'améliorer la tolérance aux pannes du système de stockage.

En 1988, les différents RAID, de 1 à 5, étaient formellement définis par David Patterson, Garth Gibson et Randy Katz dans la publication intitulée « A Case for Redundant Arrays of Inexpensive Disks (RAID) ». Cet article introduisait le terme « RAID », dont l'industrie du disque s'est immédiatement emparée, dont elle proposait cinq niveaux différents, en les comparant au « SLED », chacun d'eux ayant ses avantages et ses inconvénients.

Les différents types de systèmes RAID

Le système RAID est :

  • soit un système de redondance qui donne au stockage des données (Dans les technologies de l'information (TI), une donnée est une description élémentaire, souvent...) une certaine tolérance aux pannes matérielles (ex : RAID1) ;
  • soit un système de répartition qui améliore ses performances (ex : RAID0) ;
  • soit les deux à la fois (ex : RAID5).

Le système RAID est donc capable de gérer d'une manière ou d'une autre la répartition et la cohérence de ces données. Ce système de contrôle (Le mot contrôle peut avoir plusieurs sens. Il peut être employé comme synonyme d'examen, de...) peut être purement logiciel (En informatique, un logiciel est un ensemble d'informations relatives à des traitements...) ou utiliser un matériel dédié.

Le RAID logiciel

En RAID logiciel, le contrôle du RAID est intégralement assuré par une couche logicielle du système d'exploitation. Cette couche s'intercale entre la couche d'abstraction ( En philosophie, l'abstraction désigne à la fois une opération qui consiste a isoler par la...) matérielle (pilote) et la couche du système de fichiers (Un système de fichiers (file system ou filesystem en anglais) ou système de gestion de...).

Avantages

  • C'est la méthode la moins onéreuse puisqu'elle ne demande aucun matériel supplémentaire.
  • Cette méthode possède une grande souplesse d'administration (logicielle).
  • Cette méthode présente l'avantage de la compatibilité entre toutes les machines équipées du même logiciel de RAID (c’est-à-dire du même système d'exploitation)

Inconvénients

  • L'inconvénient majeur réside dans le fait que cette méthode repose sur la couche d'abstraction matérielle des périphériques qui composent le volume (Le volume, en sciences physiques ou mathématiques, est une grandeur qui mesure l'extension...) RAID. Pour diverses raisons, cette couche peut être imparfaite et manquer de certaines fonctions importantes comme, par exemple, la détection et le diagnostic (Le diagnostic (du grec δι?γνωση, diágnosi, à partir de...) des défauts matériels et/ou la prise en charge (La charge utile (payload en anglais ; la charge payante) représente ce qui est effectivement...) du remplacement à chaud des unités de stockage.
  • La gestion du RAID monopolise des ressources systèmes (légèrement le processeur (Le processeur, ou CPU (de l'anglais Central Processing Unit, « Unité centrale de...) et surtout le bus système) qui pourraient être employées à d'autres fins. La baisse de performances due à la gestion logicielle du raid est particulièrement sensible dans des configurations où le système doit transférer plusieurs fois les mêmes données comme, par exemple, en RAID1, et, assez faible, dans des configurations sans redondance : exemple, le RAID 0.
  • L'utilisation du RAID sur le disque système n'est pas toujours possible.

Diverses implémentations

La plupart des systèmes d'exploitation grand public permettent déjà de mettre en œuvre le RAID logiciel, qu'il s'agisse de Microsoft Windows (Windows (littéralement « Fenêtres » en anglais) est une gamme de...), d'une distribution Linux (Une distribution Linux (ou distro, distrib), appelée aussi distribution GNU/Linux pour faire...) quelconque ou de Mac OS X (Mac OS X est une ligne de systèmes d’exploitation propriétaire développés et...).

  • Microsoft Windows XP (Windows XP est une ligne de systèmes d'exploitation multitâche propriétaire développé par...) gère logiciellement le RAID 0, 1 et peut gérer le RAID 5 moyennant une petite adaptation (Explications sur le site d'Ere numérique (Une information numérique (en anglais « digital ») est une information...) [1])
  • Microsoft (Microsoft Corporation (NASDAQ : MSFT) est une multinationale américaine de solutions...) Windows 2003 Server gère logiciellement le RAID 0, 1, et 5.
  • Mac OS (Mac OS (pour Macintosh Operating System) est le nom du système d'exploitation d'Apple pour ses...) X gère logiciellement le RAID 0, 1 et la concaténation (Le terme concaténation (substantif féminin), du latin cum (« avec »)...).
  • Le noyau Linux (Le noyau Linux est un noyau de système d'exploitation de type UNIX. Le noyau Linux est un...) (>=2.6) gère logiciellement le RAID 0, 1, 4, 5, 6, et 10 ainsi que les combinaisons de ces modes.

Les RAIDs logiciels de Microsoft Windows et de Linux (Au sens strict, Linux est le nom du noyau de système d'exploitation libre, multitâche,...) sont incompatibles entre eux.

Le RAID pseudo-matériel

L'extrême majorité des contrôleurs RAID bon marché intégrés à de nombreuses cartes mères récentes en 2004/2005 gèrent souvent le RAID 0 et 1 sur des disques IDE ou SATA. Malgré le discours marketing (Le marketing (on utilise aussi parfois — dans 7% des cas, d'après les chiffres donnés par...) qui tend systématiquement à induire en erreur sur ce point (Graphie), il ne s'agit pas de RAID matériel à proprement parler mais plutôt d'un contrôleur de disque doté de quelques fonctions avancées.

D'un point de vue (La vue est le sens qui permet d'observer et d'analyser l'environnement par la réception et...) strictement matériel, cette solution hybride (En génétique, l'hybride est le croisement de deux individus de deux variétés,...) n'est pas différente (En mathématiques, la différente est définie en théorie algébrique des...) d'un RAID logiciel. Elle diffère cependant sur l'emplacement des routines logicielles de gestion du RAID.

Avantages

L'intérêt principal de ce type de RAID est d'apporter une solution au troisième problème du RAID logiciel, à savoir qu'il ne peut pas toujours servir à héberger les fichiers du système d'exploitation puisque c'est justement ce dernier qui permet d'y accéder.

Dans ce type de RAID, la présence d'un BIOS intégrant les routines logicielles basiques de gestion du RAID permet de charger en mémoire (D'une manière générale, la mémoire est le stockage de l'information. C'est aussi le souvenir...) les fichiers essentiels du système d'exploitation (le noyau et les pilotes essentiels).

Puis, le pilote du contrôleur intègre les mêmes routines logicielles de gestion du RAID et fournit alors aux couches supérieures de l'OS non pas un accès aux périphériques mais un accès au volume RAID qu'il émule.

Inconvénients

En dehors de cet avantage important, ce type de RAID cumule les défauts des deux autres approches :

  • Les limitations de performances sont les mêmes que pour le raid logiciel car il s'agit effectivement d'un RAID logiciel camouflé.
  • Un problème important posé par ces contrôleurs hybrides est leur piètre gestion des défauts matériels et leurs fonctionnalités BIOS généralement limitées.
  • L'interopérabilité (L’ interopérabilité est la capacité que possède un produit ou un...) est très mauvaise surtout si l'on considère qu'il s'agit généralement de matériel intégré aux cartes mères des ordinateurs. Pire, le changement de carte-mère (voire simplement de version de bios), si la nouvelle utilise des jeux de puces différents, peut imposer de reconstruire le RAID entièrement. De manière générale, une reconstruction est possible si l'on reste dans des contrôleurs RAID de même marque mais de modèles différents, mais il n'existe pas de règle définie de compatibilité.
  • La fiabilité annoncée de ces dispositifs est assez controversée. [citation nécessaire]

Le RAID matériel

Dans le cas du RAID matériel, une carte ou un composant est dédié à la gestion des opérations. Le contrôleur RAID peut être interne (En France, ce nom désigne un médecin, un pharmacien ou un chirurgien-dentiste, à la...) à l'unité centrale (carte d'extension) ou déporté dans une baie de stockage.

Un contrôleur raid est en général doté d'un processeur spécifique, de mémoire, éventuellement d'une batterie de secours, et est capable de gérer tous les aspects du système de stockage RAID grâce au microcode (Le microcode est un programme composés de micro-instructions dont l'exécution au sein du...) embarqué (firmware).

Du point de vue du système d'exploitation, le contrôleur RAID matériel offre une virtualisation (La virtualisation consiste à faire fonctionner sur un seul ordinateur plusieurs systèmes...) complète du système de stockage. Le système d'exploitation considère chaque volume RAID comme un disque et n'a pas connaissance de ses constituants physiques.

Avantages

  • Les contrôleurs RAID matériels permettent la détection des défauts, le remplacement à chaud des unités défectueuses et offrent la possibilité de reconstruire de manière transparente les disques défaillants. Mais les systèmes d'exploitation évolués permettent également cela si le matériel le permet.
  • La charge système (principalement l'occupation du bus) est allégée. (surtout dans des configurations avec beaucoup de disques et une forte redondance)
  • Les vérifications de cohérence, les diagnostics et les maintenances sont effectués en arrière plan par le contrôleur sans solliciter de ressources système.

Inconvénients

  • Les contrôleurs RAID matériels utilisent chacun leur propre système pour gérer les unités de stockage. En conséquence, au contraire d'un RAID logiciel, des disques transférés d'un système à un autre ne pourront pas être récupérés si le contrôleur RAID n'est pas exactement le même (firmware compris). Il est donc conseillé de posséder une deuxième carte en cas de panne de la première.
  • Les cartes d'entrée de gamme possèdent des processeurs de puissance (Le mot puissance est employé dans plusieurs domaines avec une signification particulière :) bien inférieure à celle des ordinateurs actuels. On peut donc avoir de bien moins bonnes performances qu'un RAID logiciel.
  • Le contrôleur RAID est lui-même un composant matériel complexe, qui peut tomber en panne, et son logiciel (firmware) peut contenir des bugs, ce qui constitue un risque de panne supplémentaire (un nouveau single-point-of-failure).
  • Les différents fabricants de contrôleurs RAID fournissent des outils de gestion logicielle très différents les uns des autres (et de qualité parfois inégale). À l'opposé ( En mathématique, l'opposé d’un nombre est le nombre tel que, lorsqu’il est à...), les outils de gestion du RAID logiciel fournis avec un système d'exploitation sont généralement bien intégrés dans ce système.
  • La durée du support d'un contrôleur RAID par son constructeur (correction de bugs dans le firmware, par exemple), parfois liée à l'arrivée de nouveaux produits rendant les anciens obsolètes, peut être moins longue ou plus volatile que le support du RAID logiciel par le fournisseur du système d'exploitation. Le constructeur peut même disparaitre (ce qui est assez rare parmi les fabricants de systèmes d'exploitation).
  • Une moindre souplesse par rapport au RAID logiciel, qui dispose d'une couche d'abstraction permettant de gérer du RAID au-dessus de tout types de périphériques blocs supportés par le système d'exploitation, locaux ou distants (ATA, SCSI, ATA over Ethernet (Ethernet est un protocole de réseau local à commutation de paquets. Bien qu'il...), iSCSI... et toutes les combinaisons possibles entre eux). Les contrôleurs RAID sont spécialisés pour un seul type de périphérique bloc.
Page générée en 0.014 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique