Pour appréhender le rôle des distributions de Linux il est important d'avoir quelques notions sur le périmètre de Linux et sa modularité.
Le périmètre de Linux est souvent mal compris car le même terme "Linux" est utilisé pour le noyau Linux (le "kernel" lui-même), la branche du noyau ("kernel tree") et les distributions de Linux, qui ont chacun un périmètre de plus en plus grand comme le montre la figure ci-dessous. Une distribution Linux est un assemblage de milliers de paquets logiciels et de la branche du noyau, comprenant elle-même le noyau, les pilotes et les composants réseau et systèmes de fichier.
Si la philosophie Unix, qui sous-tend également celle de Linux, devait être résumée en un seul mot, ce mot serait probablement celui de "modularité". Unix a été développé à l'origine avec l'objectif d'être hautement modulaire pour être plus flexible et convivial que les systèmes d'exploitation monolithiques et complexes de l'époque. Cette modularité a perduré et a été constamment retravaillée au cours des quelques 35 ans d'existence de systèmes d'exploitation de type Unix; elle a constitué un facteur majeur de leur remarquable durée de vie et constante popularité malgré leur âge (qui est important suivant les standards de l'informatique).
Linux est un système d'exploitation très modulaire. L'utilisateur peut installer seulement les parties qui lui conviennent. Dans la plupart des cas il choisira les installations par défaut proposées dans les menus d'installation, mais il n'y est pas obligé. S'il installe par exemple un serveur, il est possible de désactiver l'interface graphique de façon à libérer la mémoire et le processeur pour d'autres tâches.
La modularité commence avec le noyau. Même quand les utilisateurs ne compilent pas leur propre noyau, la présence de l'amorceur système (qui peut être lui-même GRUB ou LILO) est un rappel qu'ils ne sont pas limités à un seul noyau installé. Quand les utilisateurs compilent leur propre noyau, ils apprennent que son contenu est configurable et que de nombreux pilotes peuvent être chargés comme modules par le système quand ils sont requis plutôt que d'être compilés dans le noyau.
La même modularité se retrouve au niveau des sous-systèmes. Le noyau fonctionne avec plus de 30 systèmes différents de gestion de fichiers. La gestion de paquets logiciels a deux principaux formats, RPM et Debian, ainsi que plusieurs plus récents tels que Portage de la distribution Gentoo. D'autres systèmes alternatifs sont encore en développement.
Les sous-systèmes continuent à évoluer. Prenons l'exemple de lpd, le système d'impression d'origine, venant de l'Unix de Berkeley. Il a été étendu au fil des années par LPRng, puis remplacé par CUPS (Common UNIX Printing System). De façon identique, quand il y a quelques années XFree86 est devenu inacceptable à cause d'un changement dans sa licence qui le rendait non libre, X.org un "fork" d'une version précédente de XFree86 l'a remplacé. Plus récemment ALSA (Advanced Linux Sound Architecture) est venu se substituer à OSS (Open Sound System) dans de nombreuses distributions.
L'histoire se répète dans l'interface utilisateur. Le shell par défaut dans la plupart des distributions est GNU bash, qui a évolué au fil des ans. Cependant il existe plus d'une demi-douzaine de substituts possibles, citons tcsh, csh, pdksh, zsh et BusyBox.
Il existe la même diversité pour l'environnement de bureau. KDE et Gnome sont les environnements les plus communs, mais certains utilisateurs qui privilégient la performance sur la simplicité d'utilisation adopteront par exemple IceWM en lieu et place de KDE ou Gnome. En ce qui concerne le gestionnaire de fenêtres, KDE a choisi KWM alors que Gnome a élu Metacity mais ces gestionnaires par défaut peuvent être remplacés par des douzaines d'alternatives.
Cette modularité permet aussi de mettre à jour certaines parties du système sans affecter le reste du système. Par exemple il est possible d'installer la dernière version de Gnome ou KDE sans changer de version du noyau.
Cette liberté de choix n'est pas forcément adaptée à tous les utilisateurs. C'est là qu'entrent en jeu les distributions de Linux.
Comme le notait Ian Murdock, le fondateur de la distribution Debian, dans un manifeste en 1993 :
Les distributions Linux ont effectivement un rôle important dans l'éco-système construit autour de Linux.
Elles rassemblent les meilleurs paquets logiciels (par exemple la distribution Debian inclut plus de 10.000 paquets logiciels) dans une offre intégrée et adaptée à leurs utilisateurs ou clients.
De plus peu de personnes et encore moins de sociétés peuvent se permettre de suivre le cycle rapide de 8-12 semaines de sortie des versions du noyau. Les distributions fournissent un cycle plus adapté à leurs besoins. La fréquence de sortie de nouvelles versions est laissé à l'appréciation de chaque distribution, il peut aller de 6 mois pour les distributions les plus en pointe (par exemple Fedora, Ubuntu) à 12-18 mois pour les distributions plus commerciales (Red Hat, SuSE) et même 2-3 ans pour la distribution Debian.
Le cycle de développement de la distribution Red Hat
Le cycle de développement de la distribution Debian