Recherches textuelles avec Recoll

Magazine
Marque
Linux Pratique
Numéro
69
Mois de parution
janvier 2012
Spécialité(s)


Résumé
Recoll est un outil de recherche textuelle pour Linux, basé sur Xapian, un puissant moteur d'indexation. Il s'accompagne d'une interface graphique simple, conçue avec Qt4, facilitant vos recherches. Tout y passe : mails, fichiers texte, les logs de votre messagerie instantanée, etc. À vous de définir les éléments que vous souhaitez voir indexés, pour bénéficier ensuite d'un outil de recherche rapide et efficace.

1. Les possibilités de Recoll

Recoll peut traiter de très nombreux types de documents (textes, e-mails, logs, fichiers compressés et même les images, grâce à ExifTool !). Plus précisément, il supporte nativement les types suivants :

-texte,

-HTML,

-OpenOffice et LibreOffice (avec l'aide de la commande unzip),

-Abiword,

-Kword,

-les formats Maildir et mbox de votre client de messagerie,

-les fichiers de conversation de Pidgin,

-Lyx,

-Scribus.

Via l'utilisation d'outils externes, il peut également prendre en charge les formats suivants :

-PDF (avec Xpdf),

-WordPerfect (via la libwpd),

-PostScript (avec Ghostscript et pstotext),

-Microsoft Word (avec Antiword),

-Microsoft PowerPoint et Microsoft Excel (avec le programme catdoc),

-RTF (avec unrtf),

-DVI (avec dvips),

-DjVu (avec DjVuLibre),

-les tags MP3 (avec la bibliothèque id3lib).

Recoll est en fait livré avec deux exécutables : /usr/bin/recollindex et /usr/bin/recoll. Le premier, le programme d'indexation, pourra être exécuté...

Cet article est réservé aux abonnés. Il vous reste 90% à découvrir.
S'abonner à Connect
  • Accédez à tous les contenus de Connect en illimité
  • Découvrez des listes de lecture et des contenus Premium
  • Consultez les nouveaux articles en avant-première
Je m'abonne


Article rédigé par

Abonnez-vous maintenant

et profitez de tous les contenus en illimité

Je découvre les offres

Déjà abonné ? Connectez-vous