Introduction au NLP avec Spacy

Magazine
Marque
GNU/Linux Magazine
Numéro
220
Mois de parution
novembre 2018
Domaines


Résumé
Le Natural Language Processing - ou NLP - est un domaine qui a clairement le vent en poupe. Permettre à une machine de comprendre un texte venant d’un humain a alimenté...

Le code a été testé sous Debian et est disponible sur GitHub : https://github.com/ugocupcic/LinuxMagSpacy.

...  l’imaginaire collectif depuis - au moins ! - les années 50 avec le test de Turing. Les géants américains - les GAFA - et tout un écosystème de startups mènent une guerre endiablée dans ce domaine. Mais le NLP est à la portée de tous grâce à des librairies open source très bien développées comme Spacy que nous allons aborder dans cet article.

Spacy [1] est une librairie open source développée par Explosion AI[2], une startup auto financée de 2 personnes, fondée en 2016 par Matthew Honnibal et Ines Montani. Avant de créer la startup, Matthew avait débuté le développement de Spacy en 2014 avec une première release début 2015, époque à laquelle Ines l’a rejoint. Cette librairie Python a une très bonne documentation [3] et permet de se lancer dans le NLP très facilement. Il existe d’autres excellentes librairies open source de NLP, par...

Cet article est réservé aux abonnés. Il vous reste 94% à découvrir.
à partir de 21,65€ HT/mois/lecteur pour un accès 5 lecteurs à toute la plateforme
J'en profite


Articles qui pourraient vous intéresser...

Analyser un système avec SystemTap

Magazine
Marque
GNU/Linux Magazine
Numéro
248
Mois de parution
mai 2021
Domaines
Résumé

SystemTap est un outil d’analyse et de débogage de Linux. En instrumentant des points précis du système d’exploitation, il permet d’afficher des traces, de faire des mesures, ou de modifier le comportement d’un système existant, sans le recompiler, et même sans le redémarrer.

Persistance et objets en C++

Magazine
Marque
GNU/Linux Magazine
HS n°
Numéro
114
Mois de parution
mai 2021
Domaines
Résumé

Au travers de deux articles [1-2] sur les principes de l’orienté objet en C++, nous avions abordé encapsulation, héritage, et polymorphisme. Nous proposons dans ce nouvel article les classes de base pour gérer la persistance d’objets dans des fichiers. Ces classes utilisent les principes énoncés ci-dessus et présentent des stratégies via la généricité. Un exemple de stratégie pour stocker en binaire pourra être redéfini pour d’autres stratégies, comme un stockage en XML.

Principes de l’orienté objet en C++ : la généricité

Magazine
Marque
GNU/Linux Magazine
Numéro
248
Mois de parution
mai 2021
Domaines
Résumé

La programmation orientée objet obéit à des principes. Les 4 principaux sont l’encapsulation, l’héritage, le polymorphisme et la généricité. Dans un premier article, nous avons évoqué l’encapsulation, puis l’héritage et le polymorphisme dans un deuxième. Ce troisième et dernier article traite de la généricité.