L'analyse de données en Python ou comment faire du R sans R

Magazine
Marque
GNU/Linux Magazine
Numéro
188
Mois de parution
décembre 2015
Domaines


Résumé

Vous maîtrisez Python, les possibilités offertes par R vous paraissent très intéressantes, mais vous n'avez pas envie (ou le temps) d'apprendre un nouveau langage ? Essayez avec Pandas et les modules scientifiques !


Pandas est un paquetage Python permettant de manipuler des données puis de réaliser simplement leur analyse... pour peu que l'on soit un minimum familier de NumPy et Matplotlib. Si ce que vous cherchez à faire se borne à appeler des fonctions R depuis Python, ce n'est pas Pandas qu'il faudra utiliser, mais rpy2. Pour ne pas vous frustrer, même si cela sort du champ de cet article, nous allons commencer par un aperçu très rapide de rpy2 en traduisant un exemple R puis nous utiliserons Pandas de la même manière, en partant là aussi d'un exemple.

1. rpy2 : attaquer R depuis Python

L'installation se fait de manière classique en utilisant pip :

# pip3 install rpy2

Nous allons calculer la corrélation de Pearson permettant de répondre à la question suivante : existe-t-il un lien entre le poids et la pointure des sujets étudiés ? Les données sont contenues dans un fichier pearson.csv(pour les lecteurs attentifs, il s'agit du même exemple que celui...

Cet article est réservé aux abonnés. Il vous reste 96% à découvrir.
à partir de 21,65€ HT/mois/lecteur pour un accès 5 lecteurs à toute la plateforme
J'en profite


Articles qui pourraient vous intéresser...

Neuropsydia : un module Python pour les neuropsychologues

Magazine
Marque
GNU/Linux Magazine
Numéro
248
Mois de parution
mai 2021
Domaines
Résumé

Il existe peu d’outils permettant de créer « simplement » du matériel d’évaluation neuropsychologique. Neuropsydia est un outil qui nécessite un minimum de connaissances en informatique, mais permet un gain de temps considérable, si l’on accepte d’écrire quelques lignes de code Python.

Les différents frameworks de web scraping

Magazine
Marque
GNU/Linux Magazine
HS n°
Numéro
114
Mois de parution
mai 2021
Domaines
Résumé

Il ne viendrait à l’idée à personne de nos jours de se lancer dans la récupération de données sur le Web sans s’appuyer sur un framework simplifiant la tâche et évitant de réinventer la roue (carrée). Voyons donc quelques outils indispensables permettant de mener à bien cette tâche.

Écrire des mathématiques en LaTeX

Magazine
Marque
GNU/Linux Magazine
HS n°
Numéro
114
Mois de parution
mai 2021
Domaines
Résumé

S’il y a bien un domaine dans lequel excelle LaTeX, c’est l’écriture de formules mathématiques complexes et autres algorithmes. Une fois que l’on connaît et que l’on comprend la syntaxe, c’est très simple… encore faut-il avoir vu cela au moins une fois !

Application réseau avec Erlang : utilisation du protocole UDP

Magazine
Marque
GNU/Linux Magazine
Numéro
248
Mois de parution
mai 2021
Domaines
Résumé

La société Ericsson, pionnière dans le domaine des télécommunications, a été à l’origine de la création du langage Erlang. La bibliothèque standard offre toutes les méthodes pour gérer les connexions réseau, que ce soit pour créer son protocole au-dessus de TCP, UDP ou encore TLS, mais aussi en réutilisant des implémentations d’ores et déjà existantes au sein de l’écosystème fourni avec la release.