Souvent le shell suffit : Comparer des données et grapher

Magazine
Marque
GNU/Linux Magazine
Numéro
157
Mois de parution
février 2013


Résumé
Avez-vous remarqué qu'on a facilement tendance à oublier que le shell offre des fonctionnalités qui vous permettent de vous passer de langages et tantôt d'outils qui sont, à première vue, plus tentant d'utiliser ? Le présent article consiste en un petit retour d'expérience dont la problématique de départ pousserait à utiliser un SGBD et divers outils annexes. Pourtant, vous allez le constater, le shell Bash et Graphviz s'en sortent haut la main.

Imaginez le cas suivant : vous disposez d'une myriade de fichiers textes de type CSV utilisant un caractère de tabulation comme séparateur, et contenant des éléments issus d'une application de gestion. Ces fichiers regroupent des éléments comme des numéros de commandes, des numéros de clients, des adresses et divers autres données du même genre. L'objectif initial de la manipulation est d'arriver à visualiser de manière simple les redondances de numéros de clients au travers des différents fichiers. En d'autres termes, on va chercher à savoir si certains de ces numéros sont récurrents d'un fichier texte à l'autre. Instinctivement, la première idée qui nous viendrait à l'esprit serait de trouver un moyen d'importer ces données, entre 1000 et 4000 lignes par fichier, dans un SGBD comme MySQL pour ensuite faire joyeusement quelques requêtes SQL pleines de jointures amusantes. Mais si l'on souhaite rendre ces opérations faciles à réutiliser, il faudra...

Cet article est réservé aux abonnés. Il vous reste 97% à découvrir.
à partir de 21,65€ HT/mois/lecteur pour un accès 5 lecteurs à toute la plateforme
J'en profite