Incident description

System Incident status Start Date End Date
Niagara Closed
Created by Ramses van Zon on

Title


Planned Maintenance - Maintenance planifié


Summary


The annual cooling tower maintenance for the SciNet data centre will take place on August 21, 2024 from 7 a.m. EDT until the end of day. This maintenance requires a shutdown of the compute nodes of all SciNet systems (Niagara, Mist, Rouge, Teach, as well as hosted equipment). The login nodes, file systems and the HPSS system will remain available.

The scheduler will hold jobs that cannot finish before the start of the shutdown. Users are encouraged to submit small and short jobs that can take advantage of this, as the scheduler may be able to fit these jobs in before the maintenance on otherwise idle nodes.

The status of the Niagara and Mist clusters can be checked on here and on https://docs.scinet.utoronto.ca.

--

Les opérations annuelles de maintenance de la tour de refroidissement du centre de données de SciNet seront effectuées le 21 août 2024, à partir de 7 h HE jusqu'à la fin de journée.    Cette maintenance nécessite un arrêt des nœuds de calcul de toutes les grappes de SciNet (Niagara, Mist, Rouge, Teach, ainsi que les  équipements hébergés). Les nœuds de connexion, les systèmes de fichiers et le système HPSS resteront disponibles.

Les tâches qui ne pourront pas se terminer avant le début des travaux seront retenues par l’ordonnanceur jusqu’à la remise en service. Nous vous suggérons de lancer de courtes tâches nécessitant peu de ressources, que l’ordonnanceur pourra placer à l’avance en utilisant la capacité potentiellement disponible de certains nœuds.

Le statut des grappes Niagara et Mist peut être vérifié ici et sur https://docs.scinet.utoronto.ca.


Updated by Ramses van Zon on