Les codes fantastiques : bouturage

Magazine
Marque
GNU/Linux Magazine
Numéro
265
Mois de parution
septembre 2023
Spécialité(s)


Résumé

Nouvel épisode des codes fantastiques avec une histoire de clonage d’arbres en Python.


Body

Pour créer un clone d’un objet en Python, la méthode standard est d’utiliser la fonction deepcopy disponible dans le module standard copy. Dans le cas qui m’intéresse, je dois cloner un objet issu de la désérialisation d’un objet au format JSON. Cela nous donne deux propriétés : l’objet est un arbre (il n’y a pas dans la structure de l’objet deux références sur le même objet), et il ne contient que des types de base (bool, int, str, float, dict, list). Essayons de voir si l’on peut exploiter ces propriétés pour faire une copie en profondeur rapide. Commençons par un petit exemple de référence :

>>> obj = { 1 : 1., True : ‘hello’, ‘pof’ : [‘a’, ‘b’, ‘c’]}
>>> %timeit deepcopy(obj)
2.06 µs ± 13.6 ns per loop (mean ± std. dev. of 7 runs, 1,000,000 loops each)

On observe par ailleurs que la signature de copy.deepcopy est la suivante :

deepcopy(x, memo=None, _nil=[])

Le paramètre memo est un objet de type dictionnaire qui permet de stocker les correspondances entre objet de référence et clone, et d’ainsi gérer les références multiples. Dans notre cas, on peut éviter les interactions avec cet objet (pas de références multiples dans notre arbre), cela devrait nous éviter quelques indexations de tableau.

On peut aussi inspecter le code de deepcopy dans la bibliothèque Python :

>>> import inspect
>>> print(inspect.getsource(deepcopy))
[...]
    copier = _deepcopy_dispatch.get(cls)
    if copier is not None:
        y = copier(x, memo)
    else:
        if issubclass(cls, type):
            y = _deepcopy_atomic(x, memo)
        else:
            copier = getattr(x, "__deepcopy__", None)
            if copier is not None:
                y = copier(memo)
            else:
                reductor = dispatch_table.get(cls)
[...]

La mécanique est assez générique : elle gère la méthode magique __deepcopy__, effectue un appel rapide aux fonctions copy._deepcopy_list ou copy._deepcopy_dict à travers le dictionnaire _deepcopy_dispatch... On peut s’inspirer de cette stratégie pour une implémentation simple et efficace (car utilisant peu d’appels de fonctions et faisant quelques hypothèses sur les types rencontrés) pour notre objet simplifié :

>>> def deepcopy_tree(obj):
...   if isinstance(obj, list): return [deepcopy_tree(x) for x in obj]
...   elif isinstance(obj, dict): return {k: deepcopy_tree(v) for k, v in obj.items()}
...   else: return obj # int, str etc are immutable
>>> %timeit deepcopy_tree(obj)
705 ns ± 2.47 ns per loop (mean ± std. dev. of 7 runs, 1,000,000 loops each)

On notera qu’on ne clone pas les clés de dictionnaires : elles sont immuables par définition.

Pour pousser un peu plus loin l’intégration, on pourrait même encapsuler notre arbre dans une classe avec une méthode __deepcopy__ :-).



Article rédigé par

Par le(s) même(s) auteur(s)

C++ : contrôlez votre espérance de vie

Magazine
Marque
MISC
Numéro
141
Mois de parution
septembre 2025
Spécialité(s)
Résumé

Le langage C est un magnifique outil pédagogique pour enseigner le concept de mémoire, puisqu’il laisse la main au développeur pour la gérer. Mais on le sait, cet attrait n’en est pas un quand on parle de sûreté d’exécution, puisque ce langage est connu pour ne pas aider le développeur pour détecter les usages illégaux liés à la mémoire. Le langage Rust a attaqué le problème en rendant explicite le concept de durée de vie. Le langage Safe C++ tente quant à lui d’introduire ce concept en C++. Il y a plus de vingt ans, splint proposait déjà un concept moins ambitieux pour C. Et maintenant certains fous essaient de le porter vers C++, à travers des extensions de Clang. Quelles sont donc toutes ces approches ?

Les listes de lecture

Python niveau débutant

9 article(s) - ajoutée le 01/07/2020
Vous désirez apprendre le langage Python, mais ne savez pas trop par où commencer ? Cette liste de lecture vous permettra de faire vos premiers pas en découvrant l'écosystème de Python et en écrivant de petits scripts.

Au pays des algorithmes

11 article(s) - ajoutée le 01/07/2020
La base de tout programme effectuant une tâche un tant soit peu complexe est un algorithme, une méthode permettant de manipuler des données pour obtenir un résultat attendu. Dans cette liste, vous pourrez découvrir quelques spécimens d'algorithmes.

Analyse de données en Python

10 article(s) - ajoutée le 01/07/2020
À quoi bon se targuer de posséder des pétaoctets de données si l'on est incapable d'analyser ces dernières ? Cette liste vous aidera à "faire parler" vos données.
Plus de listes de lecture