Étant un module Python, Requests s'installe très simplement, selon votre version de Python :
$ pip install requests
$ pip-2.6 install requests
$ pip3.4 install requests
Ce module fonctionne de Python 2.6 à Python 3.4.
1. Les grandes lignes
1.1 Lire une page HTML
La lecture d'une page HTML se fait en une seule ligne :
>>> response = requests.get('http://www.monsite.org/contact-info')
On a donc récupéré l'ensemble des informations nécessaires. C'est-à-dire l'objet response avec son statut et son contenu. Il ne reste plus qu'à en extraire les informations utiles et pour cela, on passe la main à un autre module qui s'installe ainsi :
$ pip install beautifulsoup4
$ pip3.4 install beautifulsoup4
Pour des versions de Python plus anciennes, il faut installer Beautiful Soup et voici comment on l'utilise :
>>> from bs4 import BeautifulSoup
>>> soup = BeautifulSoup(response.text)
Voici comment afficher le code HTML :
>>>...
- Accédez à tous les contenus de Connect en illimité
- Découvrez des listes de lecture et des contenus Premium
- Consultez les nouveaux articles en avant-première