Identifier des groupes de données par classification

Magazine
Marque
GNU/Linux Magazine
HS n°
Numéro
101
Mois de parution
mars 2019
Spécialité(s)


Résumé

Lorsque l'on analyse des données, l'objectif est la plupart du temps d'en extraire des connaissances. Le terme générique désignant cette activité est le Data Mining et une façon de le mettre en œuvre est la recherche de groupes de données.


Le Data Mining, encore appelé fouille de données en bon français, désigne l'extraction de connaissances à partir de données. Bien entendu, plus le volume de données est important, plus le Data Mining sera susceptible d'extraire de connaissances. Il est d'ailleurs étrange qu'aucun marketeux n'ait eu l'idée lumineuse de lancer le nouveau buzzword « Big Data Mining » pour montrer combien il était important d'avoir de nombreuses données pour obtenir de bons résultats.

D'un point de vue technique, le Data Mining consiste à utiliser des algorithmes permettant notamment de révéler des structures intéressantes au sein des données et donc d'identifier des groupes de données (classification, clustering). Dans cet article, nous allons voir comment mettre cela en pratique.

Mon idée de départ était de continuer à exploiter les données que nous avons utilisées jusqu'ici, mais il est plus intéressant de créer nos propres jeux de données pour pouvoir certains...

Cet article est réservé aux abonnés. Il vous reste 97% à découvrir.
S'abonner à Connect
  • Accédez à tous les contenus de Connect en illimité
  • Découvrez des listes de lecture et des contenus Premium
  • Consultez les nouveaux articles en avant-première
Je m'abonne


Article rédigé par

Abonnez-vous maintenant

et profitez de tous les contenus en illimité

Je découvre les offres

Déjà abonné ? Connectez-vous