Édition de flux de données avec Awk

Magazine
Marque
GNU/Linux Magazine
HS n°
Numéro
102
Mois de parution
mai 2019
Domaines


Résumé
Le précédent article de notre hors-série a évoqué en détail l’utilitaire sed. Nous allons maintenant nous intéresser à un outil similaire, mais surtout complémentaire, nommé awk. Celui-ci, à l’image de sed, permet aussi une manipulation du flux de données, mais propose une approche et une syntaxe très différentes. Comme le lecteur le comprendra rapidement, awk est un outil tout aussi puissant, dont les fonctionnalités s’ajoutent avec harmonie à celles de sed.

L’utilitaire awk est un processeur d’éléments syntaxiques qui sert à traiter, de manière non interactive, des données au format texte. Comme la plupart des utilitaires Unix, mais aussi comme sed, cet outil travaille sur les données ligne par ligne. Il propose une syntaxe qui lui est spécifique et qui permet de définir, analyser, transformer les mots ou éléments syntaxiques qui composent chaque ligne.

Pour awk, chaque ligne sur son entrée standard est un enregistrement. C’est donc ce terme que nous retiendrons pour la suite de cet article. L’outil découpe ensuite cet enregistrement en champs. Ces derniers sont séparés, par défaut, par un ou plusieurs espaces ou bien une ou plusieurs tabulations.

Au final, la sémantique de awk est très riche, et cette richesse permet de le comparer à un langage de programmation dont la fonction première est de rechercher des chaînes de caractères suivant certains critères et d’y appliquer des transformations.

1....

Cet article est réservé aux abonnés. Il vous reste 96% à découvrir.
à partir de 21,65€ HT/mois/lecteur pour un accès 5 lecteurs à toute la plateforme
J'en profite


Articles qui pourraient vous intéresser...

Conservez l’historique de vos commandes pour chaque projet, le retour

Magazine
Marque
GNU/Linux Magazine
Numéro
241
Mois de parution
octobre 2020
Domaines
Résumé

Pouvoir conserver un historique dédié pour chaque projet, voici l’idée géniale énoncée par Tristan Colombo dans un précédent article de GLMF [1]. Cet article reprend ce concept génial (je l’ai déjà dit?) et l’étoffe en simplifiant son installation et en ajoutant quelques fonctionnalités (comme l’autodétection de projets versionnés pour proposer à l’utilisateur d’activer un historique dédié, si ce n’est pas le cas).

Système extensible et hautement disponible avec Erlang/OTP

Magazine
Marque
GNU/Linux Magazine
Numéro
241
Mois de parution
octobre 2020
Domaines
Résumé

Erlang est un langage de programmation fonctionnel et distribué, créé à la fin des années 80 pour régler de nombreux problèmes issus du monde des télécoms, et plus généralement de l’industrie. Outre le fait qu’il soit l’une des seules implémentations réussies du modèle acteur disponible sur le marché, son autre grande particularité est d’être livré avec une suite d’outils, de modèles et de principes conçus pour offrir un environnement cohérent. Ce framework, nommé OTP, fait partie intégrante de la vie des développeurs utilisant Erlang au jour le jour...

Simulation d’un ordinateur mécanique en scriptant sous FreeCAD

Magazine
Marque
Hackable
Numéro
35
Mois de parution
octobre 2020
Domaines
Résumé

L’évolution du traitement du signal est une histoire fascinante largement déroulée par David Mindell dans ses divers ouvrages [1] et citations [2]. Partant de l’ordinateur mécanique avec ses rouages, poulies, bielles et crémaillères, le passage à l’électrique au début du 20ème siècle, puis à l’électronique intégrée avec l’avènement du transistor et des circuits intégrés (VLSI) nous ont fait oublier les stades initiaux qui ont amené à notre statut actuel d’ordinateurs infiniment puissants, précis et compacts. Alors que cette histoire semble s’accompagner du passage de l’analogique au numérique – de la manipulation de grandeurs continues en grandeurs discrètes avec son gain en stabilité et reproductibilité – il n’en est en fait rien : un boulier fournit déjà les bases du calcul discrétisé mécanique, tandis que [3] introduit les concepts du calcul mécanique avec les traitements numériques avant de passer aux traitements analogiques.