Ce document explique déroulement d'un job sur un serveur HP non-stop par l'intermédiaire d'un agent AE NSK.
Le démarrage du job est initié par Automation Engine qui envoie un message concernant le démarrage du job à l'agent AE NSK. L'agent AE crée ensuite une entrée dans le fichier de statut AE.
L'agent AE NSK envoie un message au collecteur de sortie AE (via IPC) contenant notamment les informations suivantes :
Il reçoit les informations suivantes :
Si nécessaire, l'agent démarre un nouveau processus TACL. Celui-ci s'identifie alors auprès d'AE Output Collector (qui lui a été indiqué comme périphérique de sortie).
Output Collector crée le fichier de rapport. Il configure ensuite le TACL du job (paramètre utilisateur, priorité, etc). Enfin, le TACL du Job reçoit le fichier de Job sous forme de fichier Obey et commence ainsi le traitement du Job.
Pendant le déroulement du Job, toutes les sorties générées par le Job sont dirigées vers AE Output Collector et sont écrites dans les rapports de Job. Si une entrée est prévue et un terminal a été configuré pour le job, l'entrée correspondante est alors prise à partir du terminal.
La connexion entre le rapport du job et le job est établie via l'emplacement # qui est utilisé par les jobs pour répondre à l'Output Collector.
Ainsi les outputs de $UC4OC.#AAL peuvent être écrites dans le fichier de rapport $DATA.REPORTS.FFXX, et les outputs de $UC4OC.#AAM sont dans le rapport $DATA.REPORTS.FFXY.
Les noms des différents emplacements et des fichiers de rapport sont donnés par l'agent ou apr le collecteur de sortie.
Output Collector reconnaît la fin du Job quand le processus TACL du Job se représente avec une demande de saisie ou (en cas d'erreur) parce qu'il le ferme. A la fin d'un job, le collecteur de sortie écrit cette information dans le fichier de statut du job et envoie le message correspondant à l'agent via IPC. Celui-ci annonce au Serveur que le Job est terminé.
1. Signification du fichier de statut
Le fichier de statut du job améliore la restauration des jobs si de l'agent ou de le collecteur de sortie s'interrompt. Dans ce cas-là, le contexte issu du fichier de statut de Job est restauré lors du redémarrage du processus interrompu. De nombreux Jobs peuvent donc surmonter une telle erreur et le fonctionnement se poursuit sans perturbation. Les jobs qui se sont terminés pendant l'interruption de l'agent/du collecteur de sortie sont identifiés et signalés. De cette façon, Automation Engine possède toujours une image correcte du statut du système.
2. Surveillance réciproque
L'agent et le collecteur de sortie se surveillent mutuellement. Si un de ces deux processus devait se terminer inopinément (arrêt accidentel, défaillance du CPU, erreur logicielle, entre autres), le processus survivant démarre automatiquement le processus arrêté. Si le CPU du processus arrêté n'est pas (plus) disponible, un autre CPU disponible est sélectionné (de préférence un CPU différent de celui du processus survivant). En ce sens, le système est tolérant par rapport à des erreurs très diverses.
Rubriques connexes :