Notre expérience nous montre que la fonction de system manager OpenVMS est parfois confiée à une personne dont l'emploi du temps est partagé entre plusieurs tâches et que surveillance du système n'est plus constante.
Une surveillance correcte peut être réalisée de manière automatique et continue. Des messages d'alarmes automatiques peuvent être envoyés par mail.
Nous avons développé un outil écrit en DCL qui s'adapte très facilement aux différentes configurations grâce à l'emploi de fichiers de configurations externes à la procédure principale. Cette procédure tourne à intervalles réguliers ou peut être lancée à des moments déterminés de la journée.
La surveillance de base reprend les aspect suivants :
New hardware errors. Increments of device errors counters after the initial scan of the procedure.
Host ip ping tests.
Batch and print queues status.
Batch and print jobs status.
Processes that have to exist on the system.
Files that should/shouldn’t reside on the system.
Free disk space.
Mean idle cpu.
Maximum processes allowed.
Process COM queue.
Process in SUSP states.
Intrusions.
Shadow sets state.
Cluster members entering/leaving the cluster.
Searching patterns in files.
Running external procedures.
Watch some internal hardware raid devices via msa$util or sas$util.
Heartbeat. An email can be sent everyday to be sure that the procedure runs.
Possibility to run scans only during periods of a day.
Pagefile usage.
Nous avons bien entendu la faculté d'y ajouter des "modules" en fonction des besoins comme par exemple tester la réponse à un query, la surveillance détaillée d'un process en particulier, l'execution automatique de certaines tâches à des moments spécifiques de la journée ou de la semaine ...