Event Date | Summary |
---|---|
Narval est maintenant opérationnel à pleine capacité. Narval is now fully operational. |
|
The Rorqual acceptance tests need more time than expected, but the electrical power needs will change over the next two weeks:
Les tests d'acceptation de Rorqual requièrent plus de temps que prévu, mais les besoins en puissance électrique vont varier au cours des deux prochaines semaines :
|
|
The large-scale stability test of Rorqual has been postponed to Friday January 24. The Narval compute capacity will temporarily be reduced to 20-25%. The capacity is still around 30% for medium-scale tests. Once these large-scale tests will be done (estimate January 28), the Narval capacity will be back to 50%. We still estimate that Narval will come back at 100% on January 31. Le test de stabilité à grande échelle de Rorqual est reporté à vendredi 24 janvier. La capacité de calcul de Narval sera temporairement réduite à 20-25%. La capacité est actuellement à 30% pour des tests de performance de taille moyenne. Une fois les tests à grande échelle complétés (estimation : 28 janvier), la capacité de Narval sera de retour à 50%. Il est toujours prévu que Narval revienne à 100% le 31 janvier. |
|
So far, the performance and stability tests on Rorqual are going well. Starting early next week (on January 20 or 21), the most power demanding tests will be done, but the forecasted cold weather in Montreal has significantly reduced the electrical capacity of the data center. To remedy this limitation, the Narval compute capacity will temporarily be reduced to 20-25% (now is around 45-50%). Once these large-scale tests will be done (estimate Friday, January 24), the Narval capacity will be back to 50%. We still estimate that Narval will come back at 100% on January 31. Jusqu'à présent, les tests de performance et de stabilité de Rorqual avancent bien. En début de la semaine prochaine (le 20 ou 21 janvier), les tests de performance à grande échelle seront faits, mais le temps très froid annoncé à Montréal cause une réduction significative de la capacité électrique du centre de données. Pour remédier à cette limitation, la capacité de calcul de Narval sera temporairement réduite à 20-25% (actuellement à 45-50%). Une fois les tests à grande échelle complétés (estimation : 24 janvier), la capacité de Narval sera de retour à 50%. Il est toujours prévu que Narval revienne à 100% le 31 janvier. |
Service | Incident status | Start Date | End Date |
---|---|---|---|
Narval | Closed |
2025-01-13 - 2025-02-14 - Planned partial outage - Arrêt partiel planifié
Performance and stability tests on Rorqual will require the shutdown of about half of Narval compute nodes from 8 a.m. on January 13, 2025 (EST).
About half of the nodes of each type (CPU, GPU and large memory) will be shut down.
/home
is mounted at /lustre02/home
/project
is mounted at /lustre03/project
/scratch
is mounted at /lustre04/scratch
======
Les tests de performance et de stabilité de Rorqual nous obligent à éteindre environ la moitié des nœuds de calcul de Narval à partir de 8 h le 13 janvier 2025 (HNE).
Environ la moitié des nœuds de chaque type (CPU, GPU, grande mémoire) seront éteints.
/home
est accessible via /lustre02/home
/project
est accessible via /lustre03/project
/scratch
est accessible via /lustre04/scratch
Updated by Maxime Boissonneault on