Rechercher et analyser des données sur le Web et générer un document CSV

Magazine
Marque
GNU/Linux Magazine
HS n°
Numéro
95
Mois de parution
mars 2018
Domaines


Résumé
L'objectif : Le Web regorge d'informations. Nous voulons récupérer le tableau récapitulatif du classement de Ligue 1 sur http://www.lfp.fr/ligue1/classement, ce qui nous permettra de stocker les données au format CSV pour effectuer par exemple des calculs statistiques par la suite.

La solution

Il faut installer le module BeautifulSoup4 :

$ sudo pip3 install BeautifulSoup4

Le code est alors :

01: from urllib.request import urlopen
02: from bs4 import BeautifulSoup
03: import csv
04: 
05: if __name__ == '__main__':
06:     url = 'http://www.lfp.fr/ligue1/classement'
07:     page = urlopen(url)
08:     soup = BeautifulSoup(page, 'html.parser')
09:     ligue_1 = []
10: 
11:     classement = soup.find('table')
12:     clubs = classement.findAll('tr')
13: 
14:     for club in clubs:
15:         data = []
16:         
17:         nom = club.find('td', attrs={'class' : 'club'})
18:         if nom:
19:             data.append(nom.find('a').text.strip())
20:         else:
21:             continue
22: 
23:         position = club.find('td', attrs={'class' : 'position'})
24:         if position:
25:             data.append(position.text.strip())
26:         else:
27:             data.append('-')
28: 
29:         diff = club.find('td', attrs={'class' : 'diff'})
30:         if diff:
31: ...

Cet article est réservé aux abonnés. Il vous reste 91% à découvrir.
à partir de 21,65€ HT/mois/lecteur pour un accès 5 lecteurs à toute la plateforme
J'en profite


Articles qui pourraient vous intéresser...

C’est l’histoire d’un make…

Magazine
Marque
GNU/Linux Magazine
Numéro
247
Mois de parution
avril 2021
Domaines
Résumé

L’outil make permet de fabriquer des fichiers selon des règles de production décrites dans une syntaxe très simple. Dans cet article, nous allons explorer les grands principes de l’écriture de ces règles et pour ceux qui ne sont pas encore familiers de cet outil, vous faire regretter d’avoir attendu si longtemps pour le connaître…

Un alter ego d’Eliza en Java faisant du calcul symbolique

Magazine
Marque
GNU/Linux Magazine
Numéro
247
Mois de parution
avril 2021
Domaines
Résumé

ELIZA a été l’un des premiers programmes (chatbot) à avoir tenté de communiquer en langage naturel. Cet article est une tentative de démystification du comportement du programme. L’interprétation d’ELIZA présentée ici est une implémentation en français qui intègre la possibilité d’effectuer des calculs de dérivées en calcul symbolique.

Programmation avec le 6502 : vers des jeux plus évolués

Magazine
Marque
Hackable
Numéro
37
Mois de parution
avril 2021
Domaines
Résumé

Nous savons à présent comment exploiter les capacités du 6502 et du PPU de la NES afin de faire des jeux, comme le Pac-Man présenté lors du dernier article. J'espère d'ailleurs que certains d'entre vous ont essayé, et sont parvenus à améliorer ce programme, disponible sur le GitHub du magazine. Aujourd'hui, nous allons voir que les cartouches de jeux elles-mêmes peuvent renfermer des trésors d'ingéniosité électronique, permettant d'augmenter les capacités de base de la console.

À la découverte des namespaces mount et uts

Magazine
Marque
GNU/Linux Magazine
Numéro
247
Mois de parution
avril 2021
Domaines
Résumé

Le namespace mount, premier d'une longue série de namespaces a été ajouté à Linux quelques années après chroot() pour offrir plus de possibilités et de sécurité dans l'isolation des systèmes de fichiers. Introduit peu après et indéniablement plus simple, le namespace uts permet d'instancier les noms de machine. Les conteneurs sont bien entendu les premiers clients de ces fonctionnalités.