Les filtres de Bloom : un peu de bruit pour beaucoup [1] !

Magazine
Marque
GNU/Linux Magazine
Numéro
231
Mois de parution
novembre 2019
Domaines


Résumé

Avec l’explosion des données (un fichier de logs, par exemple), chercher une information particulière déjà connue devient une tâche complexe. Or depuis 1970, il existe une technique particulièrement puissante qui permet de résoudre très efficacement ce problème : les filtres de Bloom. Cet article propose de les explorer et de montrer comment les implémenter.


Dans de nombreux problèmes informatiques, il est nécessaire de déterminer si un ou plusieurs éléments figurent dans un ensemble de données de référence, et ce, de manière rapide (en particulier, en minimisant les accès disques, ce qui devient difficile dans la pratique si l’ensemble de référence est grand). Dans bien des cas, l’usage classique des tables de hachage ne permet pas un tel traitement, en particulier dans des environnements contraints comme celui du calcul embarqué. Dans cet article, nous allons présenter une structure probabiliste, les filtres de Bloom, permettant de traiter efficacement ce type de problème. L’idée maîtresse est d’introduire une dose acceptable d’erreurs pour augmenter les performances, tout en gérant les contraintes (temps et mémoire), mais sans dégrader la solution/décision finale. Après la présentation d’une implémentation classique, nous verrons une implémentation optimisée, développée par l’auteur,...

Cet article est réservé aux abonnés. Il vous reste 97% à découvrir.
à partir de 21,65€ HT/mois/lecteur pour un accès 5 lecteurs à toute la plateforme
J'en profite


Articles qui pourraient vous intéresser...

Scikit-image, une alternative à OpenCV pour la reconnaissance d'images

Magazine
Marque
GNU/Linux Magazine
Numéro
244
Mois de parution
janvier 2021
Domaines
Résumé

Une fois n'est pas coutume, nous allons découvrir et utiliser une alternative à OpenCV, scikit-image communément appelé skimage. Nous implémenterons la reconnaissance d'images avec la méthode des histogrammes de gradients orientés (HOG : Histogram of Oriented Gradients) associée à une machine à vecteurs de support (SVM : Support Vector Machine). Cette méthode est employée dans bien des applications telles que l'automobile, pour la détection de piétons [1].

Jenkins, Docker et Kubernetes pour déployer en CI/CD

Magazine
Marque
Linux Pratique
Numéro
123
Mois de parution
janvier 2021
Domaines
Résumé

La mise en place d'un processus d'intégration continue et de déploiement continu nécessite une réflexion sérieuse avant de la concrétiser dans la vraie vie d'une organisation. La diversité des méthodes agiles, la panoplie des outils DevOps disponible sur le marché et le choix de l'infrastructure sous-jacente pour créer vos projets nécessitent de prendre du recul avant de se lancer. Découvrez dans cet article comment créer un CI/CD.