Ces dernières années, l'évolution technologique et la multiplication des données qui en résultent ont mis en avant nombre d'innovations. En particulier dans le domaine de l'intelligence artificielle, où il ne se passe pas un jour sans qu'un article ne soit publié dans la presse. Quel que soit le domaine, l'intelligence artificielle (Machine Learning, Deep Learning...) repose sur des outils mathématiques plus ou moins complexes, mais nécessite cependant une grande quantité de données pour la phase d’entraînement du modèle.
Pour résoudre un problème particulier, il faut tout d'abord identifier et cerner ledit problème ; par exemple dans le domaine médical, pour l'aide au diagnostic sur la détection de mélanome. Au fil du temps, un jeu de données nettoyé et documenté a été construit conjointement par la Society for Imaging Informatics in Medecine et l'International Skin Imaging Collaboration [1]. Ce dernier a donné lieu à un challenge Kaggle dont l'objectif était de construire un modèle permettant de diagnostiquer à partir d'une photo ou d'un cliché la présence d’un mélanome malin [2]. Dans ce cas, comme dans bon nombre d’autres, un modèle est entraîné à partir d'un jeu de données existant. Toutefois, dans bien des cas auxquels nous faisons face, nous n'avons pas de jeu de données disponibles. Nous allons donc voir dans cet article comment construire un jeu de données.
1. Genèse
Revenons cependant à la genèse de cet article. En ressortant mes anciens jeux de...
- Accédez à tous les contenus de Connect en illimité
- Découvrez des listes de lecture et des contenus Premium
- Consultez les nouveaux articles en avant-première