Que ce soit à des fins statistiques, marketing, ou encore plus simplement pour la recherche scientifique, nos systèmes d'information doivent constamment stocker un nombre impressionnant de données, souvent de plusieurs téraoctets, tout en garantissant non seulement un temps d'accès défiant toute concurrence, mais aussi permettre de retrouver un échantillon ou un sous-ensemble de ces données tout aussi rapidement. Dans cet article, nous allons étudier comment Infinispan [1] permet d'implémenter de puissantes fonctions de recherche, à l'aide de l'une de ses récentes fonctionnalités de requête (« Query » [2]).
La force des systèmes de persistance de type NoSQL [3], dont Infinispan fait partie, est de profiter de l'absence de schéma de données, et surtout de contrainte relationnelle, pour obtenir de très bonnes performances, malgré la masse de données manipulées. De manière évidente, cette performance se fait souvent au prix de toute capacité de recherche.
Infinispan est une grille de données qui peut aisément être agrandie pour tenir (potentiellement) une quantité de données infinie, et assurer un temps de réponse constant - puisqu'à l'aide de la magie des algorithmes de hashage cohérents [4], les clients de la grille sont toujours à même de retrouver une information directement auprès du nœud de la grille qui le détient (voir [5] pour plus de détails sur les problématiques de stockage et d'accès rapide d'Infinispan).
C'est très puissant et performant, mais que faire si l'on ne connaît pas la clé de l'information recherchée? Comment permettre aux...
- Accédez à tous les contenus de Connect en illimité
- Découvrez des listes de lecture et des contenus Premium
- Consultez les nouveaux articles en avant-première