Analyser des chaînes de caractères à l'aide des expressions régulières

Magazine
Marque
Linux Pratique
HS n°
Numéro
23
Mois de parution
février 2012
Spécialité(s)


Résumé
C'est une problématique que l'on retrouve fréquemment : comment analyser des chaînes de caractères ? Comment vérifier qu'elles correspondent au format attendu ? Comment récupérer des informations précises mais non connues à l'avance ? Les expressions régulières sont là pour répondre à ce problème.

Python est tout à fait adapté au traitement de données textuelles. Pour cela, il fournit deux modules : le module string permettant d'effectuer de nombreuses opérations simples et le module re prenant en charge les expressions régulières.

Dans cet article, nous verrons comment et quand utiliser ces modules et, pour ceux d'entre vous qui ne le sauraient pas, nous définirons ce qu'est une expression régulière.

1. Le module string : opérations simples

Le module string est installé par défaut avec Python. Il fournit de nombreuses méthodes permettant de rechercher du texte et de remplacer des chaînes de caractères. La méconnaissance de ce module conduit bien souvent à utiliser des méthodes beaucoup trop complexes et moins efficaces. Je vous propose de voir ici les fonctions les plus utiles.

1.1. Fonctions de base

La fonction split() permet de découper la chaîne de caractères qui lui est passée en paramètre suivant un ou des caractère(s) de séparation et renvoie une...

Cet article est réservé aux abonnés. Il vous reste 96% à découvrir.
S'abonner à Connect
  • Accédez à tous les contenus de Connect en illimité
  • Découvrez des listes de lecture et des contenus Premium
  • Consultez les nouveaux articles en avant-première
Je m'abonne


Article rédigé par

Abonnez-vous maintenant

et profitez de tous les contenus en illimité

Je découvre les offres

Déjà abonné ? Connectez-vous