Optimisez l'exécution de vos codes Python !
Lorsque l'on étudie des données, il est courant de devoir regrouper les éléments par grandes catégories. La première étape peut être d'utiliser une structuration sous forme de graphe, mais cela n'est pas toujours suffisant. Il faut alors passer à une seconde étape et créer des classes d'éléments à l'intérieur du graphe.
Stocker plusieurs milliards d'objets ayant une taille totale supérieure à l'exaoctet de manière totalement distribuée grâce à une myriade de petits serveurs relativement peu onéreux, c'est ce que le logiciel libre Ceph est capable de faire !
Au cours des précédents articles, nous avons vu les différents types de parcours de données ainsi que les différents types de jointures. Il reste des nœuds effectuant une opération particulière, principalement sur un ensemble de données, comme un tri ou un agrégat, mais aussi sur plusieurs ensembles, pour une action comme un assemblage, une intersection ou un regroupement. Cet article aborde tous ces types de nœuds.