Effectuez automatiquement des captures d'un PDF

Magazine
Marque
GNU/Linux Magazine
Numéro
213
Mois de parution
mars 2018
Domaines


Résumé
Certaines tâches sont répétitives et il convient donc de les automatiser. Dans le cas de captures d'images sur les pages de fichiers PDF, cela peut être réalisé très simplement.


Certains logiciels produisent en sortie des données au format PDF (tableaux, graphes, etc.). Pour utiliser ces données, par exemple dans un rapport, il faut alors effectuer des captures d'écran de certaines zones de pages prédéfinies. Lorsque l'on travaille avec un fichier, on peut se dire que le temps passé à développer un script sera plus long que celui nécessaire à l'obtention des captures ; mais lorsque ce sont de multiples fichiers qui apparaissent journellement, il vaut mieux se poser et réfléchir à une solution d'automatisation !

Nous allons donc voir comment capturer une zone d'une page d'un PDF, créer un script paramétrable pouvant réaliser cette tâche sur de multiples zones (et donc pages) et enfin automatiser la procédure pour tout fichier d'un certain format étant déposé dans un répertoire cible.

1. Capturer une zone d'une page d'un PDF

Dans mon cas, je dispose d'un document PDF de 10 pages et je dois extraire :

  • un graphique en bas de la page 3 ;
  • un...
Cet article est réservé aux abonnés. Il vous reste 94% à découvrir.
à partir de 21,65€ HT/mois/lecteur pour un accès 5 lecteurs à toute la plateforme
J'en profite


Articles qui pourraient vous intéresser...

Les différents frameworks de web scraping

Magazine
Marque
GNU/Linux Magazine
HS n°
Numéro
114
Mois de parution
mai 2021
Domaines
Résumé

Il ne viendrait à l’idée à personne de nos jours de se lancer dans la récupération de données sur le Web sans s’appuyer sur un framework simplifiant la tâche et évitant de réinventer la roue (carrée). Voyons donc quelques outils indispensables permettant de mener à bien cette tâche.

Écrire des mathématiques en LaTeX

Magazine
Marque
GNU/Linux Magazine
HS n°
Numéro
114
Mois de parution
mai 2021
Domaines
Résumé

S’il y a bien un domaine dans lequel excelle LaTeX, c’est l’écriture de formules mathématiques complexes et autres algorithmes. Une fois que l’on connaît et que l’on comprend la syntaxe, c’est très simple… encore faut-il avoir vu cela au moins une fois !

Application réseau avec Erlang : utilisation du protocole UDP

Magazine
Marque
GNU/Linux Magazine
Numéro
248
Mois de parution
mai 2021
Domaines
Résumé

La société Ericsson, pionnière dans le domaine des télécommunications, a été à l’origine de la création du langage Erlang. La bibliothèque standard offre toutes les méthodes pour gérer les connexions réseau, que ce soit pour créer son protocole au-dessus de TCP, UDP ou encore TLS, mais aussi en réutilisant des implémentations d’ores et déjà existantes au sein de l’écosystème fourni avec la release.

Web scraping avec Node.js

Magazine
Marque
GNU/Linux Magazine
HS n°
Numéro
114
Mois de parution
mai 2021
Domaines
Résumé

Le web scraping, c’est l’activité qui consiste à gratter (to scrap) du code HTML pour en extraire des données exploitables. Node.js se prête particulièrement bien à l’exercice, aussi je vous propose d’apprendre à gratter de la donnée avec ce formidable outil.

Intégration des alertes de Nagios dans Grafana

Magazine
Marque
GNU/Linux Magazine
Numéro
248
Mois de parution
mai 2021
Domaines
Résumé

Vous avez succombé à l’esthétique soignée des tableaux de bord de Grafana, mais vous ne pouvez pas vous passer de l’écran d’alertes du vénérable Nagios ! Alors, est-il possible de faire cohabiter ces deux produits ? Avec un peu de code Python, cela devrait être possible !