N'importe qui ayant travaillé dans l'informatique depuis plus de cinq ans vous le dira : on n'a pas attendu Google et son livre sur les SRE [1] pour « monitorer » nos systèmes. Au passage, excusez-moi pour l'affreux barbarisme alors que j'aurais pu utiliser le mot surveiller tout simplement, mais alerte de « divulgâchage » : il y en aura malheureusement bien d'autres dans cet article, parce que soit je ne trouve pas la traduction française satisfaisante, soit la traduction française n'a pas exactement le même sens. Alors pourquoi depuis cinq ans ne parle-t-on plus que d'observabilité et non plus de monitoring ?
C'est que les choses dans le paysage de l'IT ont pas mal changé ces dernières années. Mais vous le savez sans doute déjà : il y a eu l'arrivée des microservices, des conteneurs, des orchestrateurs... Comment y échapper ! Mais pour que tout le monde soit à la même page avant d'entrer dans le vif du sujet, nous allons commencer par un petit retour dans le temps pour mieux comprendre les challenges auxquels l'observabilité doit faire face.
1. Il était une fois...
Il n'y a pas si longtemps, le terme service n'était jamais employé pour désigner une application, et pour cause, l'application en question était le plus souvent un monolithe. Ici, pas de débat entre monolithe et microservices, juste une brève histoire du temps. Exécuter une application monolithique était une opération relativement simple, et pour qu'un monolithe soit isolé des autres workloads, il suffisait de lui dédier sa propre machine virtuelle. Partant de là, « monitorer » un monolithe...
- Accédez à tous les contenus de Connect en illimité
- Découvrez des listes de lecture et des contenus Premium
- Consultez les nouveaux articles en avant-première
[1] Les livres sur le Site Reliability Engineering de Google sont disponibles en ligne (et en anglais) : https://sre.google/books/
[2] Traduction d'un tweet de « Honest Update @honest_update » de 2015 : "We replaced our monolith with micro services so that every outage could be more like a murder mystery." https://twitter.com/honest_update/status/651897353889259520
[3] Les Golden Signals sont définis dans le livre du SRE :
https://sre.google/sre-book/monitoring-distributed-systems/
[4] Les signaux dans OpenTelemetry :
https://opentelemetry.io/docs/concepts/signals/
[5] J'espère que je ne vous fais pas découvrir eBPF, il y a en ce moment même une telle hype autour de cet outil révolutionnaire qu'il est difficile de passer à côté : https://ebpf.io/
[6] Le papier de recherche de Google intitulé Google Wide profiling: A continuous profiling infrastructure for data centers est disponible en ligne : https://research.google/pubs/pub36575/
[7] BPF ou maintenant cBPF est l'ancêtre d'eBPF, et pour les curieux, Wikipédia nous dit tout : https://fr.wikipedia.org/wiki/BSD_Packet_Filter