La meilleure distribution universelle n'existe pas

Magazine
Marque
Linux Pratique
Numéro
95
Mois de parution
mai 2016
Spécialité(s)


Résumé
Pourquoi est-il impossible d'avoir une réponse définitive à la question récurrente de la meilleure distribution Linux ? Si la question suscite de vifs débats, c'est plus souvent dû à une relation passionnelle à l'une d'entre elles qu'à un raisonnement rationnel…

Body

Bien souvent, un nouvel arrivant dans l'écosystème Linux demandera quelle est la meilleure distribution dans le but de l'installer. La réponse est pourtant plus compliquée qu'un simple nom donné rapidement.

Une distribution est un ensemble de logiciels cohérents fournis par une organisation, à but lucratif ou non. Elle peut aussi être représentée par un ensemble de caractéristiques qui la définit. Par exemple, le niveau de fiabilité, la diversité de paquets, la réactivité, l'âge des logiciels empaquetés, etc. Cette liste n'est évidemment pas exhaustive.

Pour connaître la meilleure distribution, il est nécessaire de comparer les distributions. Une fois les distributions triées entre elles, la première du classement pourra être définie comme la meilleure.

1. Comment comparer les distributions ?

Pour comparer les distributions entre elles, il faut définir une relation d'ordre entre elles. Il existe deux types de relation d'ordre.

1.1 Comparaison ordre produit

Supposons deux distributions A et B avec deux caractéristiques : x et y pour A et x' et y' pour B.


Définition

L'ordre produit se définit tel que (x, y) ≤ (x’, y’) si et seulement si x ≤ x’ et y ≤ y’.

Comparer deux distributions est donc comparer toutes les caractéristiques (x avec x' et y avec y' dans la définition précédente) des deux distributions entre elles. Si une distribution possède toutes ses caractéristiques supérieures (resp. inférieures) à une autre, alors cette distribution est supérieure (resp. inférieure) à l'autre.

Par exemple, on peut considérer que si l'on compare deux versions de la même distribution, la plus récente sera meilleure, car l'ensemble des caractéristiques est équivalent [1] sauf celle de l'âge des paquets. Des paquets plus récents étant préférables, la distribution plus récente est supérieure à la plus ancienne. Assez logiquement, la version 9.04 (Jaunty Jackalope) d'Ubuntu aura des paquets plus vieux qu'une 15.10 (The Wily Werewolf).

De même, on peut trouver des distributions abandonnées ou restées à l'état d'ébauche inférieures à celles qui sont vivantes actuellement en utilisant un ordre produit.

Cependant, ce mode de comparaison a une portée limitée, car c'est une relation d'ordre partiel (il existe des cas non comparables).

Si chaque distribution a quelques caractéristiques supérieures à l'autre, alors elles ne sont pas comparables. Par exemple, supposons qu'il existe deux distributions A et B que l'on note sur deux caractéristiques x et y :


A

B

x

3

4

y

5

2

A est préférable sur la caractéristique y et B est préférable sur la caractéristique x. Il n'est donc pas possible de déterminer quelle est la meilleure distribution entre A et B avec un ordre produit.

D'un point de vue pratique, avoir les toutes dernières versions des logiciels augmente les risques d'instabilité, car la fiabilité vient avec les tests et l'expérience, caractéristiques plus faciles à réunir si l'ensemble logiciel reste stable.

Avec le tableau précédent, cela donnerait :


A

B

Logiciels récents

3

4

Stabilité

5

2

La distribution A est plus stable alors que B fournit des logiciels plus récents.

Pour contourner cette limite, il est possible de faire une comparaison lexicographique qui offre une relation d'ordre total, c'est-à-dire que l'ensemble des distributions est ordonnable.

1.2 Comparaison lexicographique

Dans un ordre lexicographique, il faut ordonner les caractéristiques par priorité. L'ordre peut être défini en comparant x avec x', puis y avec y' si nécessaire.


Définition

L'ordre lexicographique est défini tel que (x, y) ≤ (x’, y’) si et seulement si [x < x’ ou [x = x’ et y ≤ y’]].

Avec le premier tableau, si l'ordre de préférence des caractéristiques est x puis y, alors la meilleure distribution est B. Si l'ordre des préférences est y puis x, alors la meilleure est A. Une fois qu'un ordre entre les caractéristiques est défini, il est possible de trier toutes les distributions et d'obtenir notre champion.

Il est tout à fait possible pour une personne ou une organisation d'ordonner les caractéristiques qui lui importent et de s'en servir pour faire un choix éclairé. Par exemple, pour un serveur, la distribution A serait privilégiée alors qu'un utilisateur voulant les dernières nouveautés aura tendance à se tourner vers la distribution B.

Comme les besoins sont différents pour chaque personne, l'ordre des caractéristiques est lui aussi différent. Cela implique que l'ordre de préférence des distributions le sera aussi. Il n'est donc pas possible d'obtenir un choix universel avec l'ordre lexicographique (alors qu'avec l'ordre produit, on obtient un choix universel sur une relation d'ordre partiel).

Tenter de donner une note globale en se basant sur chaque caractéristique ne change pas le problème. Le choix des caractéristiques à prendre en compte et le poids relatif de chaque caractéristique reviennent au même problème qu'un ordre lexicographique : l'ordre est total, mais la solution n'est pas universelle.

2. Que comparer ?

La difficulté de choix entre les caractéristiques peut sembler plus théorique que pratique. Pourtant, ce n'est pas le cas.

2.1 Caractéristiques incompatibles

Certaines caractéristiques sont incompatibles entre elles.

Le cas de la stabilité contre le fait d'avoir des logiciels récents a été vu dans la partie précédente. Cependant, ce n'est pas le seul exemple possible :

- Avoir une portabilité maximale des logiciels et une quantité maximale de logiciels puisque certains logiciels ne sont pas prévus pour fonctionner sur certaines architectures. Souvent, ce sont les architectures rares ou anciennes qui sont négligées. Debian fournit une version pour dix architectures de processeur, mais certains paquets ne sont pas disponibles sur certaines architectures. Par le passé, certaines architectures (processeurs SPARC, Alpha, Motorola 68k, etc.) ont été abandonnées, car le matériel ou le manque de volontaires pour la maintenance a poussé à arrêter de fournir une version pour eux.

- Avoir une maintenance longue des logiciels et des paquets très à jour. Pour pouvoir maintenir longtemps des paquets, il est nécessaire de limiter les versions des logiciels pour limiter la quantité de versions à maintenir. La maintenance de RHEL (Red Hat Entreprise Linux) est payante, mais dure jusqu'à 10 ans. Il est même possible de l'étendre avec un contrat supplémentaire. Debian fournit une maintenance de deux ans environ pour sa version stable et le projet Debian LTS a pour but d'augmenter la durée de la maintenance à un minimum de 5 ans. Par contre, les paquets de RHEL et Debian stable changent très peu au fil du temps (pour des mises à jour de sécurité uniquement). Au contraire, Archlinux dispose de paquets récents, mais il n'y a pas de maintenance dans le temps, uniquement des mises à jour continues. Fedora, une version communautaire de Red Hat, tente régulièrement l'inclusion de technologies récentes à titre de tests ; la branche Rawhide dispose de paquets très récents. Certains essais seront ensuite intégrés à la version RHEL.

- La facilité d'utilisation est obtenue en faisant des choix raisonnables pour l'utilisateur. C'est contraire à une priorité axée sur la facilité de personnalisation puisque la première étape sera de demander à l'utilisateur de faire des choix. Par exemple, Ubuntu choisit pour l'utilisateur son environnement de bureau (GNOME) et certains paquets visant à aider l'utilisateur sont installés par défaut (comme command-not-found [2]). Au contraire Gentoo nécessite des choix de configuration avancés (comme les flags de compilation des paquets). De même, LFS (Linux From Scratch) est une distribution permettant à l'utilisateur de configurer et construire l'ensemble de son système à la main. Son objectif est plus didactique qu'une réelle utilisation au quotidien. Il est donc logique que la facilité de prise en main soit négligée au profit du contrôle fin par l'utilisateur.

- Une distribution avec un but très spécifique et ayant un paramétrage convenant au plus grand nombre. Par exemple, BackTrack dispose d'outils préinstallés pour les audits de sécurité, tests de pénétration, etc. Il est toujours possible de l'utiliser pour un usage générique. De manière comparable, Tails est conçue pour garantir la confidentialité et l'anonymat de son utilisateur et est utilisable à partir d'un CD ou d'une clef USB. Par défaut, aucune donnée ne sera enregistrée et les données transmises sur Internet passeront par Tor pour cacher l'origine de l'émetteur de la requête. La priorité classique des distributions est de privilégier la vitesse d'échange plutôt que l'anonymat, ce qui est le but même de Tails. De même, l'idée de ne rien enregistrer est incongrue pour une distribution classique.

Au-delà des programmes, des caractéristiques comme le fait de fonctionner de manière ouverte s'opposent à la possibilité d'avoir une communication lisse et contrôlée puisque les débats seront publics. Les distributions communautaires auront plutôt des listes de diffusions ouvertes, rendant les débats et désaccords visibles publiquement sur la plupart des sujets. Les distributions commerciales gardent certains débats privés (en particulier concernant la stratégie, le marketing et la communication), ce qui est logique puisque ce sont des éléments clefs de la réussite d'une entreprise. La transparence s'oppose à la protection de données sensibles.

2.2 Caractéristiques non comparables

Certaines caractéristiques sont d'ordre qualitatif et non quantitatif. On peut préférer une qualité à une autre pour les avantages qu'elle induit, mais la caractéristique en elle-même ne peut pas être classée.

- Distribution source et distribution binaire : une distribution source fournit uniquement le code source et l'utilisateur doit compiler les paquets. Dans une distribution binaire, les paquets sont fournit compilés. Une distribution source sera naturellement plus orientée contrôle par l'utilisateur que facilité d'usage. Les distributions binaires seront plus faciles d'usage puisque les utilisateurs n'auront pas ni à choisir la configuration des compilations, ni attendre la compilation des logiciels. Les paquets restent compilables par l'utilisateur s'il le souhaite. Gentoo est probablement la distribution source la plus connue. Debian, Red Hat, SUSE, Archlinux, etc. sont des distributions binaires.

- Distribution rolling releaseet sortie régulière : les distributions rolling release (mise à jour en continu, sans version fixe) auront plus facilement des logiciels récents que des distributions avec des sorties régulières qui auront des décalages dans le temps. Plus des sorties sont espacées et plus les logiciels vont vieillir. Archlinux est probablement la distribution rolling release la plus connue. Ubuntu a des sorties fixes tous les 6 mois. Fedora fait approximativement de même. Debian publie une version stable approximativement tous les 2 ans. Les distributions à sorties régulières peuvent avoir des versions qui ressemblent à une rolling release pour mettre au point leur prochaine version. Par exemple, Fedora possède une branche nommée Rawhide, Debian utilise unstable et testing.

Conclusion

Selon les priorités de la distribution, leurs caractéristiques seront différentes. Certaines caractéristiques seront plus travaillées que d'autres. C'est ce qui fait la diversité entre les distributions. Cette diversité les rend imparfaitement substituables entre elles. La situation ressemble à une concurrence monopolistique : les distributions sont proches, mais toutes légèrement différentes [3].

Pour un utilisateur débutant, au-delà des caractéristiques de la distribution et son adaptation à son besoin, la facilité à trouver des utilisateurs ayant la même distribution que lui devrait aussi être un critère de choix, car cela lui permettra d'être aidé plus efficacement.

Notes

[1] Les nostalgiques des temps anciens considéreront probablement que c'est une hypothèse à démontrer.

[2] command-not-found est un paquet qui permet d'afficher des suggestions de paquets à installer lorsque la commande saisie dans un terminal par l'utilisateur n'est pas trouvée sur le système.

[3] L'analyse de la concurrence monopolistique a été initiée par E.H Chamberlin en 1933. L'analyse étant basée sur le comportement des entreprises, elle ne s'applique qu'imparfaitement aux distributions Linux. Par contre, la situation de différentiation reste pertinente.




Article rédigé par

Par le(s) même(s) auteur(s)

Réalisation de cartogrammes avec ScapeToad

Magazine
Marque
Linux Pratique
Numéro
69
Mois de parution
janvier 2012
Spécialité(s)
Résumé
Qui n'a jamais vu une carte déformée en fonction d'une statistique pour mieux la mettre en évidence ? On pense typiquement aux cartes montrant la sous-nutrition ou le P.I.B par pays. Ces cartes volontairement déformées s'appellent des cartogrammes. Cet article montre comment il est possible d'en réaliser sous Linux. Pour cela, nous allons utiliser ScapeToad [ST], un logiciel libre, écrit en Java. Pour illustrer cette possibilité, nous allons représenter le pourcentage d'utilisateurs d'Internet par pays en 2010.

Processus de publication chez Debian et Ubuntu

Magazine
Marque
GNU/Linux Magazine
Numéro
118
Mois de parution
juillet 2009
Résumé
Debian a été créé en 1993. Depuis, de nombreuses distributions, à la durée de vie et au succès plus ou moins importants, en ont été dérivées. Ubuntu est l'une d'elles. C'est aujourd'hui une des distributions Linux les plus populaires et les plus médiatisées.Dire qu'une distribution est dérivée d'une autre signifie que le code source, les outils et le système de paquets de la distribution d'origine ont été réutilisés. La nouvelle distribution est libre de maintenir un lien avec la distribution d'origine ou de s'en éloigner définitivement. Ubuntu n'a jamais caché sa filiation et s'en est même servi pour asseoir sa crédibilité à ses débuts. Elle a d'ailleurs choisi de rester proche de Debian d'un point de vue technique. L'objectif de cet article est de montrer les différences entre les modes de publication de Debian et d'Ubuntu, puis de voir comment Ubuntu se base sur Debian.

Les derniers articles Premiums

Les derniers articles Premium

Petit guide d’outils open source pour le télétravail

Magazine
Marque
Contenu Premium
Spécialité(s)
Résumé

Ah le Covid ! Si en cette période de nombreux cas resurgissent, ce n’est rien comparé aux vagues que nous avons connues en 2020 et 2021. Ce fléau a contraint une large partie de la population à faire ce que tout le monde connaît sous le nom de télétravail. Nous avons dû changer nos habitudes et avons dû apprendre à utiliser de nombreux outils collaboratifs, de visioconférence, etc., dont tout le monde n’était pas habitué. Dans cet article, nous passons en revue quelques outils open source utiles pour le travail à la maison. En effet, pour les adeptes du costume en haut et du pyjama en bas, la communauté open source s’est démenée pour proposer des alternatives aux outils propriétaires et payants.

Sécurisez vos applications web : comment Symfony vous protège des menaces courantes

Magazine
Marque
Contenu Premium
Spécialité(s)
Résumé

Les frameworks tels que Symfony ont bouleversé le développement web en apportant une structure solide et des outils performants. Malgré ces qualités, nous pouvons découvrir d’innombrables vulnérabilités. Cet article met le doigt sur les failles de sécurité les plus fréquentes qui affectent même les environnements les plus robustes. De l’injection de requêtes à distance à l’exécution de scripts malveillants, découvrez comment ces failles peuvent mettre en péril vos applications et, surtout, comment vous en prémunir.

Bash des temps modernes

Magazine
Marque
Contenu Premium
Spécialité(s)
Résumé

Les scripts Shell, et Bash spécifiquement, demeurent un standard, de facto, de notre industrie. Ils forment un composant primordial de toute distribution Linux, mais c’est aussi un outil de prédilection pour implémenter de nombreuses tâches d’automatisation, en particulier dans le « Cloud », par eux-mêmes ou conjointement à des solutions telles que Ansible. Pour toutes ces raisons et bien d’autres encore, savoir les concevoir de manière robuste et idempotente est crucial.

Présentation de Kafka Connect

Magazine
Marque
Contenu Premium
Spécialité(s)
Résumé

Un cluster Apache Kafka est déjà, à lui seul, une puissante infrastructure pour faire de l’event streaming… Et si nous pouvions, d’un coup de baguette magique, lui permettre de consommer des informations issues de systèmes de données plus traditionnels, tels que les bases de données ? C’est là qu’intervient Kafka Connect, un autre composant de l’écosystème du projet.

Les listes de lecture

8 article(s) - ajoutée le 01/07/2020
Découvrez notre sélection d'articles pour faire vos premiers pas avec les conteneurs, apprendre à les configurer et les utiliser au quotidien.
11 article(s) - ajoutée le 02/07/2020
Si vous recherchez quels sont les outils du DevOps et comment les utiliser, cette liste est faite pour vous.
8 article(s) - ajoutée le 02/07/2020
Il est essentiel d'effectuer des sauvegardes régulières de son travail pour éviter de perdre toutes ses données bêtement. De nombreux outils sont disponibles pour nous assister dans cette tâche.
Voir les 60 listes de lecture

Abonnez-vous maintenant

et profitez de tous les contenus en illimité

Je découvre les offres

Déjà abonné ? Connectez-vous