Incident description

Service Incident status Start Date End Date
Rorqual Closed
Created by Pier-Luc St-Onge on

Title


Hard drive replacement for /project - Remplacement de disque dur pour /project


Summary


Replacing a hard-drive is usually transparent to users, but the storage system has been very sensitive to such operation. To prevent any additional problem, we have to pause read and write operations for a certain time period (in the order of 30-45 minutes if no issue).

Active jobs accessing /project will hang until read and write operations are resumed. The jobs will continue as usual after that, but their time limit will not be increased.

The access from login nodes and via Globus is also affected.

Replacing this hard drive is relatively urgent and we cannot wait for a proper maintenance period. We apologize for the impacts on your research activities.

======

Le remplacement d'un disque dur est généralement transparent pour les usagers, mais le système de stockage s'est montré très sensible à ce type d'opération. Afin d'éviter tout problème supplémentaire, nous devons mettre sur pause les opérations de lecture et d'écriture pendant une certaine période (de l'ordre de 30 à 45 minutes si tout va bien).

Les tâches en cours accédant à /project subiront la pause jusqu'à la reprise des opérations de lecture et d'écriture. Elles reprendront ensuite leur cours normal, mais leur durée limite ne sera pas prolongée.

L'accès à partir des nœuds de connexion et via Globus sera aussi affecté.

Le remplacement de ce disque dur est relativement urgent et nous ne pouvons pas attendre une période de maintenance plus appropriée. Nous sommes désolés pour les impacts sur vos activités de recherche.


Updated by Pier-Luc St-Onge on