Nettoyer des données CSV avec Pandas

Spécialité(s)


Résumé
L'objectif : Nous disposons d'un fichier CSV dont certaines lignes ne sont pas remplies complètement

Test;Valeur 1;Valeur 2;Valeur 3

1;12;4;16

1;;20;18

2;;;

2;3;14;5

2;11;7;18

3;8;;9

Nous souhaitons lire ce fichier et le nettoyer des lignes non complètes en associant la valeur 0 à une absence de donnée.

La solution

01: import pandas
02: 
03: if __name__ == '__main__':
04:     df = pandas.read_csv('data.csv', sep=';')
05:     df = df.astype(object).where(pandas.notnull(df), 0)

Commentaires

Lors de l'utilisation de read_csv(), il est important de penser à préciser le type de caractère délimitant les colonnes dans le paramètre sep. En effet, par défaut ce caractère est...

Cet article est réservé aux abonnés. Il vous reste 90% à découvrir.
S'abonner à Connect
  • Accédez à tous les contenus de Connect en illimité
  • Découvrez des listes de lecture et des contenus Premium
  • Consultez les nouveaux articles en avant-première
Je m'abonne


Article rédigé par

Abonnez-vous maintenant

et profitez de tous les contenus en illimité

Je découvre les offres

Déjà abonné ? Connectez-vous