printf(3) : ras la pile !

GNU/Linux Magazine

n°

274

mars 2025

Par

Guidon Yann

Code

Tag(s)

printf

libc

Je rêve d’un jour où la sécurité ne sera plus une option. J’ai donc commencé à mettre au point le modèle CDI [1] [2] : une architecture Harvard modifiée qui dédie un troisième espace d'adressage indépendant pour la pile de contrôle. Ce n'est pas la solution à tous les problèmes, mais ça y contribue beaucoup ! Pour preuve, un exploit récent divulgué à pwn2own [3] aurait facilement été stoppé par ce mécanisme. Mais cet exploit me sidère par son vecteur d'attaque que j’ignorais jusque-là : l'incontournable printf(3). Quand votre librairie standard inclut l’équivalent d’une machine de Turing, pour dynamiquement parser ou afficher du texte, ce n'est plus de l’idiosyncrasie mais de l'idiotie.

Le modèle CDI (sigle de Contrôle-Donnée-Instruction) empêche toute confusion entre les types essentiels, évitant d’utiliser des données en tant que pointeurs d’instructions (ou vice versa), et garantit l’intégrité de la pile de contrôle. Le développeur peut toujours saboter sa propre pile de données, mais cela n’affecte plus directement le chemin d’exécution du code. Le modèle CDI n’affranchit évidemment pas de contrôler toutes les autres bornes.

Une fois cette vulnérabilité inhérente enfin résolue, l'attention se porte maintenant sur les vecteurs qui en abusaient. Et si l’on prend la peine de creuser un tout petit peu, c’est une nouvelle foire aux horreurs qui se dévoile, car on trouve des structures et méthodes qui sont adoptées, acceptées, normalisées, enseignées depuis des décennies. Cela fait partie d'un tout, à prendre en entier ou à laisser. Le C, c’est comme ça.

1. Pourquoi en sommes-nous là ?

Bienvenue dans les coulisses de l…

La suite est réservée aux abonnés. Il vous reste 98% à découvrir.

Déjà abonné ? Se connecter

Accédez à tous les contenus de Connect en illimité
Découvrez des listes de lecture et des contenus Premium
Consultez les nouveaux articles en avant-première

Envie de lire la suite ? Rejoignez Connect

Je m'abonne maintenant

Article rédigé par

Guidon Yann

75 articles

Par le(s) même(s) auteur(s)

Plus d'article de cet auteur

Quarante ans d’IOCCC : enfin les gagnants de l’édition 2024 !

GNU/Linux Magazine

n°

278

novembre 2025

Par

Guidon Yann

Code

Le langage que nous adorons détester a sa propre cérémonie : l’« International Obfuscated C Code Contest » s’est tenu pour la première fois en 1984 [1] afin de prouver que « good code is intuitively obvious upon casual inspection » en montrant les pires contre-exemples possibles dans un cadre restreint. La vingt-huitième édition vient de se conclure et la moisson est toujours aussi stupéfiante.

Lire l'article

Erreurs en rafales, multiparités et codes Gray entrelacés

GNU/Linux Magazine

n°

277

septembre 2025

Par

Guidon Yann

Code

Algo

Le bit de parité est semblable à ce brave petit soldat qui sonne l’alerte, avec ses moyens réduits et quand il le peut, pour que la cavalerie vienne s’occuper du problème. Mais cet humble bit obéit aux lois de l’information et laisse passer une erreur sur deux. Grâce aux codes Gray, configurés de façon inhabituelle, nous pourrons mieux filtrer les erreurs, sans augmenter considérablement la taille du circuit ni déployer des théories (trop) complexes.

Lire l'article

Visualisez les données grâce à l’alphabet Braille !

GNU/Linux Magazine

n°

275

mai 2025

Par

Guidon Yann

Code

Quand on travaille avec de grandes quantités de bits, on n’a pas forcément envie de faire une interface graphique, et les afficher dans le terminal graphique n’est pas facile. Un bit occupe toute la place d’un caractère et la représentation hexadécimale n’est pas très parlante. Heureusement, Unicode est là !

Lire l'article

aStrA : vers de vraies chaînes de caractères en C !

GNU/Linux Magazine

n°

275

mai 2025

Par

Guidon Yann

Code

Qu’est-ce qui caractérise un langage de haut niveau ? On peut dire que celui-ci doit au moins gérer les chaînes de caractères facilement et sans aucun risque. BASIC le faisait il y a soixante ans. N’importe quel langage courant le fait actuellement. Pourtant, le précédent article a démont(r)é [1] que le C n’en fait pas partie, surtout à cause des fonctions printf(3) et assimilées : elles procurent une illusion d’aisance qui s’effondre vite et c’est un vrai nid à failles. Nous avons suggéré quelques solutions que nous allons mettre en œuvre ici, grâce notamment au format des chaînes alignées [2] étendu avec des attributs, d’où le nom aStrA. Cela demande un peu de bricolage pour les réaliser en C, mais c’est un premier pas en avant, une base qui ne demande qu’à évoluer.

Lire l'article

Les listes de lecture

Python niveau débutant

9 article(s) - ajoutée le 01/07/2020

Code

Vous désirez apprendre le langage Python, mais ne savez pas trop par où commencer ? Cette liste de lecture vous permettra de faire vos premiers pas en découvrant l'écosystème de Python et en écrivant de petits scripts.

Au pays des algorithmes

11 article(s) - ajoutée le 01/07/2020

Algo

La base de tout programme effectuant une tâche un tant soit peu complexe est un algorithme, une méthode permettant de manipuler des données pour obtenir un résultat attendu. Dans cette liste, vous pourrez découvrir quelques spécimens d'algorithmes.

Analyse de données en Python

10 article(s) - ajoutée le 01/07/2020

Code

À quoi bon se targuer de posséder des pétaoctets de données si l'on est incapable d'analyser ces dernières ? Cette liste vous aidera à "faire parler" vos données.

Plus de listes de lecture