Comprendre un amas multidimensionnel de données, avec des millions d’échantillons, impose l’utilisation d’un outil très performant, mais aussi très souple pour pouvoir confronter rapidement ses intuitions avec la réalité des données. Dans cet article, nous allons étendre un petit lisp, afin de le doter d’un compilateur embarqué, assurant ainsi souplesse et performance lors du traitement des données. J’espère ainsi vous convaincre de l’attrait des langages de type Lisp pour le Machine Learning et la Big Data.
1. Besoin du data scientist
Deux tâches principales incombent au data scientist, lorsqu’est soumis à sa sagacité un ensemble de données. La première, est de comprendre les liens entre les données qui lui sont présentées. La seconde, de se servir de cette manne pour prédire un événement futur.
Un exemple du premier cas peut être l’analyse de données socioculturelles, financières, économiques… pour comprendre le résultat d’un vote. Ou...
- Accédez à tous les contenus de Connect en illimité
- Découvrez des listes de lecture et des contenus Premium
- Consultez les nouveaux articles en avant-première