L'analyse de données en Python ou comment faire du R sans R

Magazine
Marque
GNU/Linux Magazine
Numéro
188
Mois de parution
décembre 2015
Spécialités


Résumé

Vous maîtrisez Python, les possibilités offertes par R vous paraissent très intéressantes, mais vous n'avez pas envie (ou le temps) d'apprendre un nouveau langage ? Essayez avec Pandas et les modules scientifiques !


Pandas est un paquetage Python permettant de manipuler des données puis de réaliser simplement leur analyse... pour peu que l'on soit un minimum familier de NumPy et Matplotlib. Si ce que vous cherchez à faire se borne à appeler des fonctions R depuis Python, ce n'est pas Pandas qu'il faudra utiliser, mais rpy2. Pour ne pas vous frustrer, même si cela sort du champ de cet article, nous allons commencer par un aperçu très rapide de rpy2 en traduisant un exemple R puis nous utiliserons Pandas de la même manière, en partant là aussi d'un exemple.

1. rpy2 : attaquer R depuis Python

L'installation se fait de manière classique en utilisant pip :

# pip3 install rpy2

Nous allons calculer la corrélation de Pearson permettant de répondre à la question suivante : existe-t-il un lien entre le poids et la pointure des sujets étudiés ? Les données sont contenues dans un fichier pearson.csv(pour les lecteurs attentifs, il s'agit du même exemple que celui...

Cet article est réservé aux abonnés. Il vous reste 96% à découvrir.
à partir de 21,65€ HT/mois/lecteur pour un accès 5 lecteurs à toute la plateforme
J'en profite


Articles qui pourraient vous intéresser...

À la découverte des GitHub Actions

Magazine
Marque
GNU/Linux Magazine
HS n°
Numéro
115
Mois de parution
juillet 2021
Spécialités
Résumé

La discipline du CI/CD est incontournable dans l'industrie du logiciel, tant en open source que dans les projets d'entreprise, avec des outils toujours plus nombreux et efficaces. La maîtrise d'au moins un acteur principal du marché est de plus en plus regardée comme indispensable, ce qui prend tout son sens une fois qu'on a pris l'habitude d'automatiser ces opérations. Démonstration avec les GitHub Actions.

« Je veux ma maquette de satellite » : analyse du format G3DB d’objets 3D en vue de leur impression

Magazine
Marque
GNU/Linux Magazine
Numéro
250
Mois de parution
juillet 2021
Spécialités
Résumé

Nous explorons le format G3DB exploité dans nombre de jeux programmés en Java sous Android s’appuyant sur la bibliothèque LibGDX. Cette étude sera l’occasion de découvrir le format universel binaire JSON, conçu pour sa compacité tout en conservant une facilité d’analyse bien connue de ce format de données. Nous aboutirons ainsi à un modèle 3D exploitable dans tout logiciel de conception assistée par ordinateur et conclurons par l’impression des divers éléments de la maquette et son assemblage.

Utilisez les énumérations en Python

Magazine
Marque
GNU/Linux Magazine
HS n°
Numéro
115
Mois de parution
juillet 2021
Spécialités
Résumé

Il existe dans tout langage des éléments simples, pratiques, mais qui sont pourtant peu employés par les développeurs. En Python, les énumérations se retrouvent dans cette catégorie. Je vous propose dans cet article de découvrir leur intérêt.

Gérez vos projets Python avec Poetry

Magazine
Marque
GNU/Linux Magazine
Numéro
250
Mois de parution
juillet 2021
Spécialités
Résumé

« Un peu de poésie dans un monde de brutes », voilà ce que l'on pourrait se dire en lisant le nom de ce projet… pourtant, c'est à l'usage qu'il montre ses petits muscles et il vous deviendra rapidement indispensable !

Les bizarreries de l’isolation des IPC

Magazine
Marque
GNU/Linux Magazine
Numéro
250
Mois de parution
juillet 2021
Spécialités
Résumé

Le namespace IPC (Inter-Process Communication) isole les mécanismes de communication interprocessus (sémaphores, mémoire partagée et queues de messages) hérités d’UNIX Système V et bizarrement, seulement une partie de leurs pendants POSIX.