L'apprentissage par renforcement pour créer des bots autonomes

Magazine
Marque
GNU/Linux Magazine
Numéro
216
Mois de parution
juin 2018
Domaines


Résumé

Pour créer des programmes capables de résoudre des problèmes sans leur avoir donné de méthode précise, il faut nécessairement faire appel au machine learning. Quand il s'agit d'apprendre en explorant un environnement, on passe au reinforcement learning, sujet de cet article.


Tout le monde ou presque a vu la vidéo de MarI/O [1], l'IA qui joue seule à Mario Bros. Ce qui se cache derrière cette IA est bien entendu du machine learning. Il aurait été intéressant de partir sur ce projet dans cet article, mais nous sommes ici limités par le nombre de pages du magazine tant pour le code que pour les explications qu'il faudrait fournir. Nous avons donc décidé de nous restreindre à quelque chose de bien moins ambitieux mais, nous l'espérons, tout aussi intéressant, en consacrant cet article au reinforcement learning (apprentissage par renforcement) en nous appuyant sur des frameworks Python. Nous passerons ainsi par trois étapes en abordant tout d'abord l'aspect théorique pour bien comprendre en quoi consiste le reinforcement learning. Ensuite, nous utiliserons le frameworkOpenAI Gym [2] pour une mise en pratique sur un problème prédéfini (proposé par le framework) et, pour conclure, nous verrons les pièges à éviter pour appliquer le...

Cet article est réservé aux abonnés. Il vous reste 98% à découvrir.
à partir de 21,65€ HT/mois/lecteur pour un accès 5 lecteurs à toute la plateforme
J'en profite


Articles qui pourraient vous intéresser...

Utiliser Visual Studio Code pour coder en Python

Magazine
Marque
GNU/Linux Magazine
Numéro
243
Mois de parution
décembre 2020
Domaines
Résumé

Comme Batman a Robin, Rocket Raccoon a Groot, le développeur a l’éditeur de code. Sans son plus fidèle acolyte, impossible d’écrire la moindre ligne de code... d’où l’importance d’être toujours à la recherche de l’outil le plus efficace qui soit, quitte à délaisser un vieux compagnon de route...

Générez la documentation technique de vos projets Godot

Magazine
Marque
GNU/Linux Magazine
Numéro
243
Mois de parution
décembre 2020
Domaines
Résumé

Découvrons comment utiliser GDScript Docs Maker pour générer automatiquement la documentation de vos projets Godot. Nous allons voir dans cet article que l’on peut simplement, à partir de notre code et de ses commentaires, avoir une documentation toujours à jour.

Implémentation du calcul symbolique et de la dérivation en Java

Magazine
Marque
GNU/Linux Magazine
Numéro
243
Mois de parution
décembre 2020
Domaines
Résumé

Les logiciels de calcul symbolique sont relativement abondants. Pour les curieux ou ceux qui voudraient intégrer ce type de fonctionnalités dans leurs propres programmes, nous allons essayer de lever une partie des mystères des théories et des problèmes qui se cachent derrière la création de ces systèmes.