Édition de flux de données avec Awk

Spécialité(s)


Résumé

Le précédent article de notre hors-série a évoqué en détail l’utilitaire sed. Nous allons maintenant nous intéresser à un outil similaire, mais surtout complémentaire, nommé awk. Celui-ci, à l’image de sed, permet aussi une manipulation du flux de données, mais propose une approche et une syntaxe très différentes. Comme le lecteur le comprendra rapidement, awk est un outil tout aussi puissant, dont les fonctionnalités s’ajoutent avec harmonie à celles de sed.


L’utilitaire awk est un processeur d’éléments syntaxiques qui sert à traiter, de manière non interactive, des données au format texte. Comme la plupart des utilitaires Unix, mais aussi comme sed, cet outil travaille sur les données ligne par ligne. Il propose une syntaxe qui lui est spécifique et qui permet de définir, analyser, transformer les mots ou éléments syntaxiques qui composent chaque ligne.

Pour awk, chaque ligne sur son entrée standard est un enregistrement. C’est donc ce terme que nous retiendrons pour la suite de cet article. L’outil découpe ensuite cet enregistrement en champs. Ces derniers sont séparés, par défaut, par un ou plusieurs espaces ou bien une ou plusieurs tabulations.

Au final, la sémantique de awk est très riche, et cette richesse permet de le comparer à un langage de programmation dont la fonction première est de rechercher des chaînes de caractères suivant certains critères et d’y appliquer des...

Cet article est réservé aux abonnés. Il vous reste 96% à découvrir.
S'abonner à Connect
  • Accédez à tous les contenus de Connect en illimité
  • Découvrez des listes de lecture et des contenus Premium
  • Consultez les nouveaux articles en avant-première
Je m'abonne


Article rédigé par

Abonnez-vous maintenant

et profitez de tous les contenus en illimité

Je découvre les offres

Déjà abonné ? Connectez-vous