Un Watchdog externe pour vos systèmes

Magazine
Marque
GNU/Linux Magazine
Numéro
117
Mois de parution
juin 2009


Résumé
Imaginons un instant un serveur classique. Celui-ci, suite à une erreur, se retrouve « planté ». Il ne répond plus aux demandes du réseau, impossible de reprendre la main. Il n'existe plus qu'une seule solution, l'accès physique à la machine et le redémarrage d'une manière plus ou moins douce. Dans l'embarqué, ceci doit être fait automatiquement. C'est l'objet même d'un watchdog ou chien de garde.

Gardons notre exemple de serveur. Qu'avons-nous fait ? Nous nous sommes rendu compte que le serveur ne répondait plus par un moyen ou un autre :

  • utilisation d'un outil de supervision de type Nagios ou autre ;
  • constatation de fait, suite à une impossibilité de connexion SSH par exemple ;
  • système d'alerte et de signalisation « çapamarche » également appelé « coup de fil plaintif du service concernée ».

En a alors découlé une intervention physique sans doute soldée par un reboot hard de la machine serveur. Un watchdog repose plus ou moins sur le même principe de fonctionnement, mais avec quelques nuances :

  • Le reboot hard est une solution envisagée par défaut (interruption de l'alimentation).
  • C'est le système surveillé qui a la tâche de signaler son bon fonctionnement.
  • Un délai récurrent est imposé pour cette signalisation, seul moyen d'empêcher l'application de la solution par défaut.

En d'autres termes, un système embarqué signale son état opérationnel de...

Cet article est réservé aux abonnés. Il vous reste 93% à découvrir.
à partir de 21,65€ HT/mois/lecteur pour un accès 5 lecteurs à toute la plateforme
J'en profite