Scikit-learn : l'apprentissage statistique sans douleur

Spécialité(s)


Résumé

Comment reconnaître un spam d'un mail ? Comment prédire la météo ? Comment ranger automatiquement des documents dans différentes catégories ? Comment séparer les différentes sources d'une bande sonore ? À toutes ces questions, une même réponse : l'apprentissage statistique.


Il est de plus en plus facile de récolter et de diffuser des données : photographies, images médicales, vidéos, mails, blogs, mms. L'analyse, la compréhension et la prédiction d'un volume croissant de données prend donc une importance grandissante. Cette nécessité de fouille de données se traduit par le développement d'algorithmes dit d'apprentissage statistique.

L'apprentissage statistique effraie souvent par la complexité de la théorie mathématique nécessaire à l'implémentation des algorithmes. Scikit-learn est un module d'apprentissage statistique écrit en Python qui s'efforce de rendre ce domaine accessible à tous quel que soit le contexte d'utilisation.

Une grande variété de problèmes différents nécessitent l'utilisation de l'apprentissage statistique. Cependant, il n'y a pas de solution universelle : à chaque type de données, il faut associer une stratégie efficace. L'un des buts de scikit-learn est de faciliter la compréhension par...

Cet article est réservé aux abonnés. Il vous reste 95% à découvrir.
S'abonner à Connect
  • Accédez à tous les contenus de Connect en illimité
  • Découvrez des listes de lecture et des contenus Premium
  • Consultez les nouveaux articles en avant-première
Je m'abonne


Article rédigé par

Abonnez-vous maintenant

et profitez de tous les contenus en illimité

Je découvre les offres

Déjà abonné ? Connectez-vous