Lorsque l'on analyse des données, l'objectif est la plupart du temps d'en extraire des connaissances. Le terme générique désignant cette activité est le Data Mining et une façon de le mettre en œuvre est la recherche de groupes de données.
Le Data Mining, encore appelé fouille de données en bon français, désigne l'extraction de connaissances à partir de données. Bien entendu, plus le volume de données est important, plus le Data Mining sera susceptible d'extraire de connaissances. Il est d'ailleurs étrange qu'aucun marketeux n'ait eu l'idée lumineuse de lancer le nouveau buzzword « Big Data Mining » pour montrer combien il était important d'avoir de nombreuses données pour obtenir de bons résultats.
D'un point de vue technique, le Data Mining consiste à utiliser des algorithmes permettant notamment de révéler des structures intéressantes au sein des données et donc d'identifier des groupes de données (classification, clustering). Dans cet article, nous allons voir comment mettre cela en pratique.
Mon idée de départ était de continuer à exploiter les données que nous avons utilisées jusqu'ici, mais il est plus intéressant de créer nos propres jeux de données pour pouvoir certains...
- Accédez à tous les contenus de Connect en illimité
- Découvrez des listes de lecture et des contenus Premium
- Consultez les nouveaux articles en avant-première