Les progrès réalisés cette dernière décennie en Deep Learning ont profité à plusieurs domaines, ce qui lui a permis de s’imposer comme une approche incontournable en Machine Learning. La classification automatique des documents textuels est l’une des tâches dans laquelle le Deep Learning s’avère particulièrement utile et performant. Dans cet article, nous allons présenter en détail les aspects théoriques et pratiques liés à l’implémentation d’un système d’analyse des sentiments. Il s’agit de la classification automatique de tweets en trois classes : positive, négative ou neutre.
1. Introduction
Plusieurs entreprises s’intéressent aux avis des clients sur leurs produits et services. L’analyse des sentiments est une approche permettant de détecter automatiquement les émotions des clients à partir des commentaires postés sur les réseaux sociaux. Le but du travail présenté dans cet article est d’implémenter un réseau de neurones profond pour détecter automatiquement la polarité d’un tweet. À partir des données étiquetées/labellisées (c’est-à-dire que chaque tweet est accompagné d’une étiquette : positive, négative ou neutre), l’apprentissage d’un réseau de neurones permet de construire un modèle (une fonction mathématique) qui servira par la suite à prédire de nouvelles données (i.e. des tweets non vus lors de la phase d’apprentissage). Nous utilisons le corpus US Twitter Airline disponible sur le lien [1].
Fig. 1 : Aperçu global du système d’analyse des sentiments.
La figure 1 donne...
- Accédez à tous les contenus de Connect en illimité
- Découvrez des listes de lecture et des contenus Premium
- Consultez les nouveaux articles en avant-première