Pour créer des programmes capables de résoudre des problèmes sans leur avoir donné de méthode précise, il faut nécessairement faire appel au machine learning. Quand il s'agit d'apprendre en explorant un environnement, on passe au reinforcement learning, sujet de cet article.
Tout le monde ou presque a vu la vidéo de MarI/O [1], l'IA qui joue seule à Mario Bros. Ce qui se cache derrière cette IA est bien entendu du machine learning. Il aurait été intéressant de partir sur ce projet dans cet article, mais nous sommes ici limités par le nombre de pages du magazine tant pour le code que pour les explications qu'il faudrait fournir. Nous avons donc décidé de nous restreindre à quelque chose de bien moins ambitieux mais, nous l'espérons, tout aussi intéressant, en consacrant cet article au reinforcement learning (apprentissage par renforcement) en nous appuyant sur des frameworks Python. Nous passerons ainsi par trois étapes en abordant tout d'abord l'aspect théorique pour bien comprendre en quoi consiste le reinforcement learning. Ensuite, nous utiliserons le frameworkOpenAI Gym [2] pour une mise en pratique sur un problème prédéfini (proposé par le framework) et, pour conclure, nous verrons les pièges à éviter pour appliquer le...
- Accédez à tous les contenus de Connect en illimité
- Découvrez des listes de lecture et des contenus Premium
- Consultez les nouveaux articles en avant-première