Incident description

Service Incident status Start Date End Date
Graham Closed
Created by Fraser McCrossan on

Title


Planned Outage - Arrêt planifié


Summary


The Graham cluster is unavailable to all users as we perform cluster maintenance. The work will be completed by Tuesday, April 4, 2023 at 10 a.m.

During the outage, a new home server will be installed. We will migrate all user data off the old server onto the new. We will also update the compute node image and CUDA driver version.

Please watch https://status.alliancecan.ca for updates on the availability of Graham and all other national systems.

This outage impacts the cluster, login nodes, visualization nodes (VDI) as well as data transfer nodes (DTN). There will be no impact to the Graham cloud.

Users will be notified by email when the cluster is up and running again.

For questions, or assistance please email [email protected].

=====

En raison de travaux de maintenance, la grappe Graham n'est pas disponible.  Le service reprendra à 10 h HAE le 4 avril.

Cet arrêt de service nous permettra d’installer un nouveau serveur /home et de mettre à jour l’image logicielle des nœuds de calcul ainsi que le pilote CUDA.

L’état de Graham et des autres grappes est rapporté sur la page https://status.alliancecan.ca.

L’arrêt de service touche les nœuds de connexion, les nœuds de visualisation (VDI) ainsi que les nœuds de transfert de données (DTN). Le nuage Graham n'est pas touché.

Nous vous informerons par courriel de la reprise du service.

Si vous avez des questions ou avez besoin d’assistance, écrivez à [email protected]


Updated by Fraser McCrossan on