Les articles de GNU/Linux Magazine Hors-Série N°94

Image promotionnelle
Petite introduction au Machine Learning
Article mis en avant

Préface

Avec l'explosion du nombre de données disponibles, il faut trouver des méthodes efficaces de traitement pour parvenir à en faire émerger des connaissances.
Le Machine Learning, l’apprentissage des intelligences artificielles, en quelques mots, ses principes, ses modèles, ses applications.
Le machine learning (ou apprentissage automatique) et le deep learning (apprentissage profond) font partie des thèmes les plus actifs du moment : difficile de recenser tous les frameworks libres disponibles, lequel choisir pour votre projet ou pour remporter le prochain challenge Kaggle ?
Face à la complexité d’un ensemble de données, le data scientist commence par les scruter sous tous les angles. Cette analyse graphique permet parfois de mettre en évidence des relations entre différentes dimensions. Dans ces cas-là, il est alors tentant de quantifier cette relation. Parmi les outils à la disposition du data scientist, la régression linéaire est l’un des plus simples, dont nous allons voir qu’il ne permet pas uniquement de lier des données selon une relation linéaire.
Il existe une terrible malédiction à laquelle se heurte le data scientist : la malédiction de la dimension. Ce terrible fléau frappe lorsque le nombre de variables d’un ensemble de données devient trop important. Dans ce cas, afin de permettre une analyse précise dans chacune des dimensions, il faut un ensemble de mesures tout à fait gigantesque. De plus, la multiplication des dimensions rend l’analyse très complexe. Difficile pour un humain d’appréhender les relations entre autant de variables.
Avec Netflix, Quora, Amazon, Mangaki, les systèmes de recommandation sont omniprésents dans nos vies. Mais comment fonctionnent-ils ? Cet article présente les algorithmes principaux qui permettent de les concevoir. Nous en profitons pour décrire notre tout dernier algorithme utilisant les posters des œuvres pour améliorer les recommandations, présenté au workshop MANPU le 10 novembre 2017 à Kyoto, à l’occasion de la conférence International Conference on Document Analysis and Recognition (ICDAR).
Le ciel offre une variété étonnante d'objets célestes. Ces variétés ont fait l'objet depuis l'antiquité de classifications plus ou moins précises au fur et à mesure que les observations élargissaient le champ de nos connaissances. L'oeil et le cerveau humain ont su regrouper, expliquer et inventorier les éléments de l'Univers. Essayons alors d'utiliser la puissance du Machine Learning pour caractériser automatiquement ces galaxies lointaines et mystérieuses.
Les protéines sont des composants biologiques importants constitués par l'assemblage de briques élémentaires, les acides aminés. L'organisation tridimensionnelle d'une protéine est cependant difficile à prédire à partir de la succession d'acides aminés. Dans cet article, nous allons détailler une étape importante dans le processus de construction d'un modèle tridimensionnel, la prédiction d'éléments de structure secondaire remarquables.
Les molécules chimiques sont tout autour de nous, il y a bien entendu celles de synthèse qui font décrier la chronique, mais toute la communication du vivant est basée sur la chimie, à commencer par les odeurs. Comment traiter ces petits composés pourtant aussi importants ? Nous allons le découvrir dans cet article.