L'apprentissage par renforcement pour créer des bots autonomes

Magazine
Marque
GNU/Linux Magazine
Numéro
216
Mois de parution
juin 2018
Domaines


Résumé

Pour créer des programmes capables de résoudre des problèmes sans leur avoir donné de méthode précise, il faut nécessairement faire appel au machine learning. Quand il s'agit d'apprendre en explorant un environnement, on passe au reinforcement learning, sujet de cet article.


Tout le monde ou presque a vu la vidéo de MarI/O [1], l'IA qui joue seule à Mario Bros. Ce qui se cache derrière cette IA est bien entendu du machine learning. Il aurait été intéressant de partir sur ce projet dans cet article, mais nous sommes ici limités par le nombre de pages du magazine tant pour le code que pour les explications qu'il faudrait fournir. Nous avons donc décidé de nous restreindre à quelque chose de bien moins ambitieux mais, nous l'espérons, tout aussi intéressant, en consacrant cet article au reinforcement learning (apprentissage par renforcement) en nous appuyant sur des frameworks Python. Nous passerons ainsi par trois étapes en abordant tout d'abord l'aspect théorique pour bien comprendre en quoi consiste le reinforcement learning. Ensuite, nous utiliserons le frameworkOpenAI Gym [2] pour une mise en pratique sur un problème prédéfini (proposé par le framework) et, pour conclure, nous verrons les pièges à éviter pour appliquer le...

Cet article est réservé aux abonnés. Il vous reste 98% à découvrir.
à partir de 21,65€ HT/mois/lecteur pour un accès 5 lecteurs à toute la plateforme
J'en profite


Articles qui pourraient vous intéresser...

Découvrez la programmation différentiable

Magazine
Marque
GNU/Linux Magazine
Numéro
246
Mois de parution
mars 2021
Domaines
Résumé

La programmation différentiable est une nouvelle façon de penser la programmation. Le principe consiste à considérer tout un programme comme une fonction qu’on puisse différentier, et donc optimiser. Nous allons construire dans cet article les outils de base pour ce faire, et présenter la librairie JAX, qui facilite la tâche.

Concevoir des tableaux en LaTeX

Magazine
Marque
GNU/Linux Magazine
HS n°
Numéro
113
Mois de parution
mars 2021
Domaines
Résumé

Il n'est pas rare de vouloir intégrer de petits tableaux dans ses documents. LaTeX permet de créer rapidement et simplement une telle représentation d'informations. Il est également possible, avec un peu d'huile de coude, de créer des tableaux très complexes ! Ce n'est pas si compliqué... à condition de savoir comment faire !

De l'usage de l'underscore en Python

Magazine
Marque
GNU/Linux Magazine
Numéro
246
Mois de parution
mars 2021
Domaines
Résumé

Un underscore avant le nom d'un attribut ou deux, est-ce un caprice de développeur ? Et si je veux utiliser des underscores après le nom de mes variables, est-ce que cela a une signification ? Tout, tout, tout, vous saurez tout sur l'usage des underscores en Python !

Parler à un RADAR spatioporté : traitement et analyse des données de Sentinel-1

Magazine
Marque
GNU/Linux Magazine
Numéro
246
Mois de parution
mars 2021
Domaines
Résumé

Nous avions étudié comment fonctionne un RADAR pour la mesure de distance, puis d’azimut et finalement interférométrique, lors d’un déploiement depuis le sol. Nous allons appliquer ces connaissances aux données acquises par les RADAR transportés par les satellites de l’ESA Sentinel-1, librement disponibles sur le Web. Nous conclurons en installant au sol une cible coopérative qui sera parfaitement visible depuis l’espace.