Sauvegarde - Définition et Explications

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Critères de choix

Le choix d'une technique de sauvegarde se fera en prenant en compte :

  • la capacité de stockage du support (le volume d'information)
  • la vitesse de sauvegarde,
  • la fiabilité du support (notamment après une longue période de stockage),
  • la simplicité de classement,
  • la facilité à restaurer les données,
  • et bien sûr le coût de l'ensemble (En théorie des ensembles, un ensemble désigne intuitivement une collection...).

Intervient également la possibilité de sélectionner les données à sauvegarder. Enfin pour les grands systèmes de sauvegarde (En informatique, la sauvegarde (backup en anglais) est l'opération qui consiste à...), il faut tenir compte de critères physiques : volume (Le volume, en sciences physiques ou mathématiques, est une grandeur qui mesure l'extension...) physique (La physique (du grec φυσις, la nature) est étymologiquement la...) des supports de stockage, poids (Le poids est la force de pesanteur, d'origine gravitationnelle et inertielle, exercée par la...), sensibilité à la température (La température est une grandeur physique mesurée à l'aide d'un thermomètre et...), à l'humidité (L'humidité est la présence d'eau ou de vapeur d'eau dans l'air ou dans une substance...), à la poussière, à la lumière (La lumière est l'ensemble des ondes électromagnétiques visibles par l'œil...).

Techniques complémentaires

La sauvegarde de données peut être réalisée en utilisant des techniques plus ou moins sophistiquées. La méthode la plus simple est de parcourir les répertoires et les fichiers d'un poste de travail ou d'un serveur, mais on se trouve vite limité par le nombre (La notion de nombre en linguistique est traitée à l’article « Nombre...) de fichiers et par le volume de données, qui ont un impact direct sur le temps (Le temps est un concept développé par l'être humain pour appréhender le...) de sauvegarde. Pour contourner ces limitations, plusieurs approches sont envisageables:

  • compression des données sauvegardées, utilisé par la majorité des solutions de sauvegarde
  • technique de snapshot: prise d'image instantanée d'un disque (Le mot disque est employé, aussi bien en géométrie que dans la vie courante, pour désigner une...), en particulier dans un SAN (voir Gestion par volumes logiques)
  • sauvegarde en mode bloc (protocole NDMP en particulier pour les NAS)
  • technique de déduplication pour limiter le volume des sauvegardes en éliminant les doublons
  • une combinaison (Une combinaison peut être :) de ces différentes techniques

Méthodes (Types) de sauvegarde les plus courantes

La méthode la plus simple est la sauvegarde complète ou totale (appelée aussi "full backup (Le terme Backup ou Back-up, originaire de l'anglais, est utilisé dans plusieurs domaines :)") ; elle consiste à copier toutes les données à sauvegarder que celles-ci soient récentes, anciennes, modifiées ou non.

Cette méthode est aussi la plus fiable mais elle est longue et très coûteuse en termes d'espace disque, ce qui empêche de l'utiliser en pratique pour toutes les sauvegardes à effectuer. Afin de gagner en rapidité et en temps de sauvegarde, il existe des méthodes qui procèdent à la sauvegarde des seules données modifiées et/ou ajoutées entre deux sauvegardes totales. On en recense deux :

  • La sauvegarde différentielle
  • La sauvegarde incrémentielle

La restauration d'un disque avec l'une de ces méthodes s'avère plus longue et plus fastidieuse puisqu'en plus de la restauration de la sauvegarde différentielle ou des sauvegardes incrémentielles, on doit également restaurer la dernière sauvegarde complète. Les fichiers supprimés entre-temps seront également restaurés.

Afin de comprendre la différence entre les deux méthodes, nous prendrons l'exemple d'un plan de sauvegarde selon le cycle suivant :

  • Une sauvegarde complète au jour (Le jour ou la journée est l'intervalle qui sépare le lever du coucher du Soleil ; c'est la...) J (dimanche soir par exemple)
  • Une sauvegarde des fichiers modifiés ou nouveaux du jour (Le jour ou la journée est l'intervalle qui sépare le lever du coucher du Soleil ; c'est la...) J+1 au jour J+6 (du lundi soir au samedi soir inclus)
  • Une sauvegarde complète au jour J+7 (dimanche soir suivant)

Mécanisme

Pour pouvoir différencier ces différentes méthodes de sauvegarde/archivage (complète, incrémentielle, différentielle), le mécanisme mis en place est l'utilisation d'un marqueur d'archivage (L'archivage est l'action de mettre en archive, d'archiver. Employé surtout à l'origine pour les...). Chaque fichier ( Un fichier est un endroit où sont rangées des fiches. Cela peut-être un meuble, une pièce,...) possède ce marqueur d'archivage, qui est positionné à "vrai" lorsque l'on crée ou modifie un fichier. On peut comprendre cette position comme "Je viens d'être modifié ou créé : je suis prêt à être archivé donc je positionne mon marqueur à vrai". Ce marqueur est appelé aussi attribut d'archivage (ou bit d'archivage). Sous Windows (Windows est une gamme de systèmes d'exploitation produite par Microsoft, principalement destinées...), cet attribut est modifiable et peut être visualisé par la commande (Commande : terme utilisé dans de nombreux domaines, généralement il désigne un ordre ou un...) ATTRIB (attribut A pour archive). Le système de sauvegarde peut aussi constituer une base de données (En informatique, une base de données (Abr. : « BD » ou...) contenant les définitions des fichiers et utiliser un marquage interne (En France, ce nom désigne un médecin, un pharmacien ou un chirurgien-dentiste, à la...).

Sauvegarde complète

Lors d'une sauvegarde complète, on va remettre à "0" l'attribut du fichier pour mémoriser le fait que le fichier a été enregistré. Lorsque l'on travaille avec la date, on mémorise la date de la dernière sauvegarde de façon à pouvoir différencier les fichiers qui ont été sauvegardés des autres (date de dernière modification).

Détail technique

Lors d'une sauvegarde complète, tous les fichiers sont sauvegardés, indépendamment de la position du marqueur (vrai ou faux). Une fois le fichier archivé, celui-ci se voit attribuer la position de son marqueur (ou son bit) à "faux" (ou à "0").

Sauvegarde différentielle

La sauvegarde différentielle effectue une copie des fichiers créés ou modifiés depuis la dernière sauvegarde complète, quelles que soient les sauvegardes intermédiaires. En d'autres termes, la sauvegarde complète du jour J sert de référence pour identifier les fichiers créés, modifiés ou ajoutés et ainsi ne sauvegarder que ces derniers du jour J+1 au jour J+6.

La restauration faite à partir de ce type de sauvegarde nécessite la recopie sur disque de la dernière sauvegarde complète et de la sauvegarde différentielle la plus récente.

Avec notre exemple, si la restauration se porte sur un disque complet qui a été sauvegardé le jour J+2, on doit alors recopier sur disque la sauvegarde complète du jour J et la sauvegarde différentielle du jour J+2 afin d'avoir la dernière version des données.

Cependant lorsqu'il s'agit de la restauration d'un fichier ou d'un répertoire qui a été sauvegardé le jour J+2 seule la dernière sauvegarde, ici la différentielle, est utile.

Détail technique

Lors d'une sauvegarde différentielle, tous les fichiers dont le marqueur est à "vrai" sont sauvegardés. Une fois le fichier archivé, celui-ci garde la position de son marqueur tel qu'il l'avait avant la sauvegarde.

Sauvegarde incrémentale ou incrémentielle

Cette méthode consiste à sauvegarder les fichiers créés ou modifiés depuis la dernière sauvegarde quel que soit son type (complète, différentielle ou incrémentielle).

Exemple : une sauvegarde complète est réalisée le jour J. Le jour J+1, la sauvegarde incrémentielle est réalisée par référence au jour J. Le jour J+2, la sauvegarde incrémentielle est réalisée par référence au jour J+1. Et ainsi de suite.

Si la restauration se porte sur un disque complet qui a été sauvegardé le jour J+4, on doit alors recopier sur disque la sauvegarde du jour J et les sauvegardes incrémentielles des jours J+1, J+2, J+3 et J+4 afin d'obtenir la dernière version de la totalité des données.

Cependant lorsqu'il s'agit de la restauration d'un fichier ou d'un répertoire qui a été sauvegardé le jour J+3, seule la dernière sauvegarde, ici l'incrémentielle, est utile.

Détail technique

Lors d'une sauvegarde incrémentielle, tous les fichiers dont le marqueur est à "vrai" sont sauvegardés. Une fois le fichier archivé, celui-ci se voit attribué la position de son marqueur à "faux".

Sauvegarde, archivage et rétention

La rétention permet de faire la différence entre sauvegarde et archivage.

La rétention est le temps pendant lequel la donnée (Dans les technologies de l'information (TI), une donnée est une description élémentaire, souvent...) sauvegardée est conservée intacte. Un travail de rétention courte est assimilé à un travail de sauvegarde classique : la donnée (Dans les technologies de l'information, une donnée est une description élémentaire,...) est protégée contre sa disparition/son altération. Un travail de rétention longue (une ou plusieurs années) est assimilé à un travail d'archivage et aura pour but de retrouver la donnée à une date précise, sur demande express (Express est un langage informatique servant à spécificier formellement des données....).

Exemple : une rétention de 4 semaines implique que l'instance des données sauvegardées à une date précise seront toujours disponibles jusqu'à 28 jours après leur sauvegarde. Après ces 28 jours, d'un point (Graphie) de vue (La vue est le sens qui permet d'observer et d'analyser l'environnement par la réception et...) logique (La logique (du grec logikê, dérivé de logos (λόγος),...), les données n'existent plus dans le système de sauvegarde et sont considérées comme introuvables. Physiquement, les pistes utilisées pour enregistrer cette sauvegarde peuvent être effacées.

Plus la rétention est longue et plus le nombre d'instance sauvegardé pour un même objet (De manière générale, le mot objet (du latin objectum, 1361) désigne une entité définie dans...) fichier ou dossier est important. Plus la rétention est longue et plus la sauvegarde tend vers un mécanisme d'archivage qui nécessitera un système de recherche (La recherche scientifique désigne en premier lieu l’ensemble des actions entreprises en vue...) et d'indexation approprié. Plus la rétention est longue et plus l'espace nécessaire pour stocker les travaux de sauvegarde sera important.

Formule de calcul de l'espace de sauvegarde nécessaire

Cette formule permet de dimensionner une librairie de sauvegarde (bande ou disque VTL).

Dans le cas d'une sauvegarde classique, c'est-à-dire sauvegarde totale le week-end (vendredi soir) et sauvegardes incrémentielles les autres jours ouvrés de la semaine, du lundi au jeudi (pas le vendredi) soit quatre jours :

- soit D l'espace de donnée utile à sauvegarder,

- soit R la rétention des travaux souhaité, exprimé en semaine,

- soit T le taux de modification par jour des fichiers de l'espace à sauvegarder,

la formule suivante est obtenue : D x R + (D x T%) x 4 = capacité de sauvegarde.

Exemple chiffré : 100 Go au total ( Total est la qualité de ce qui est complet, sans exception. D'un point de vue comptable, un...) à sauvegarder avec une rétention de 3 semaines et un taux de modification de 20% par jour donne 100 x 3 + (100 x 20%) x 4 = 380 Go. 380 Go seront nécessaire pour sauvegarder nos 100 Go de données avec une rétention de 3 semaines et une modification de 20% par jour.

Des innovations technologiques telles que les snapshots ou la déduplication permettent de réduire cette valeur d'une façon très intéressante.

Page générée en 0.104 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique