Les 3 piliers de l&#039;observabilité

octobre 2022

Par

Tag(s)

OpenTelemetry

Télémétrie

N'importe qui ayant travaillé dans l'informatique depuis plus de cinq ans vous le dira : on n'a pas attendu Google et son livre sur les SRE [1] pour « monitorer » nos systèmes. Au passage, excusez-moi pour l'affreux barbarisme alors que j'aurais pu utiliser le mot surveiller tout simplement, mais alerte de « divulgâchage » : il y en aura malheureusement bien d'autres dans cet article, parce que soit je ne trouve pas la traduction française satisfaisante, soit la traduction française n'a pas exactement le même sens. Alors pourquoi depuis cinq ans ne parle-t-on plus que d'observabilité et non plus de monitoring ?

C'est que les choses dans le paysage de l'IT ont pas mal changé ces dernières années. Mais vous le savez sans doute déjà : il y a eu l'arrivée des microservices, des conteneurs, des orchestrateurs... Comment y échapper ! Mais pour que tout le monde soit à la même page avant d'entrer dans le vif du sujet, nous allons commencer par un petit retour dans le temps pour mieux comprendre les challenges auxquels l'observabilité doit faire face.

1. Il était une fois...

Il n'y a pas si longtemps, le terme service n'était jamais employé pour désigner une application, et pour cause, l'application en question était le plus souvent un monolithe. Ici, pas de débat entre monolithe et microservices, juste une brève histoire du temps. Exécuter une application monolithique était une opération relativement simple, et pour qu'un monolithe soit isolé des autres workloads, il suffisait de lui dédier sa propre machine virtuelle. Partant de là, « monitorer » un…

La suite est réservée aux abonnés. Il vous reste 96% à découvrir.

Déjà abonné ? Se connecter

Accédez à tous les contenus de Connect en illimité
Découvrez des listes de lecture et des contenus Premium
Consultez les nouveaux articles en avant-première

Envie de lire la suite ? Rejoignez Connect

Je m'abonne maintenant

Références

[1] Les livres sur le Site Reliability Engineering de Google sont disponibles en ligne (et en anglais) : https://sre.google/books/

[2] Traduction d'un tweet de « Honest Update @honest_update » de 2015 : "We replaced our monolith with micro services so that every outage could be more like a murder mystery." https://twitter.com/honest_update/status/651897353889259520

[3] Les Golden Signals sont définis dans le livre du SRE :
https://sre.google/sre-book/monitoring-distributed-systems/

[4] Les signaux dans OpenTelemetry :
https://opentelemetry.io/docs/concepts/signals/

[5] J'espère que je ne vous fais pas découvrir eBPF, il y a en ce moment même une telle hype autour de cet outil révolutionnaire qu'il est difficile de passer à côté : https://ebpf.io/

[6] Le papier de recherche de Google intitulé Google Wide profiling: A continuous profiling infrastructure for data centers est disponible en ligne : https://research.google/pubs/pub36575/

[7] BPF ou maintenant cBPF est l'ancêtre d'eBPF, et pour les curieux, Wikipédia nous dit tout : https://fr.wikipedia.org/wiki/BSD_Packet_Filter

Article rédigé par

Beuret Stéphane

25 articles

Par le(s) même(s) auteur(s)

Plus d'article de cet auteur

Le Continuous Profiler

GNU/Linux Magazine

n°

264

juillet 2023

Par

L'arrivée de Docker, de Kubernetes et plus généralement de ce que l'on nomme le cloud natif a bousculé nos habitudes : de la manière dont nous écrivons notre code, dont nous le déployons, mais aussi de la manière dont nous l'observons ! Peu d'entre nous se préoccupaient de l'Application Performance Monitoring (APM) avant 2014, et je suis sûr que beaucoup ignorent encore ce qu'est une trace distribuée. Pourtant, avec nos applications dynamiques découpées en microservices et hébergées dans le cloud, il est de plus en plus difficile de faire l'impasse sur ce genre d'outils. Et le continuous profiler est justement l'un de ces précieux outils.

Lire l'article

Les logs, encore et toujours pertinents

GNU/Linux Magazine

HS n°

octobre 2022

Par

Parmi les trois piliers de l'observabilité, s'il y en a bien un qui n'a pas besoin d'être présenté, ce sont bien les logs. Qui n'a pas son anecdote sur un print initialement utilisé par un développeur pour s'assurer du bon déroulement de son code qui finit par se retrouver dans le code en production ? Le log est réellement l'instrument qui nous permet de répondre à cette question rudimentaire, mais essentielle : que se passe-t-il dans mon code à l'instant t. Mais parce qu'il est simple à utiliser et flexible à souhait, le log pose souvent un réel problème lorsqu'une application passe en production. Et c'est encore plus vrai dans les systèmes distribués.

Lire l'article

La magie des métriques

GNU/Linux Magazine

HS n°

octobre 2022

Par

Les métriques sont de loin, à mon humble avis, le signal le plus fascinant. Je vous l'accorde, elles sont aussi vieilles que l'informatique elle-même et pour cause : « ce qui ne se mesure pas ne s'améliore pas » [1]. Mais mesurer une chose est parfois un art, et dans les technologies de l'informatique, c'est un art qui a fondamentalement évolué ces dernières années. Non pas qu'on ne mesure plus les mêmes choses qu'il y a 20 ans, la charge d'un CPU et les IOPS ont toujours leur importance, mais on ne les aborde simplement plus de la même manière, surtout quand on vient à parler de systèmes distribués.

Lire l'article

Application Performance Monitoring

GNU/Linux Magazine

HS n°

octobre 2022

Par