Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Rotations des journaux de boue
SageMaker HyperPod fournit une rotation automatique des journaux des démons Slurm afin de gérer l'utilisation de l'espace disque et de maintenir les performances du système. La rotation des journaux est essentielle pour empêcher les journaux de consommer trop d'espace disque et garantir un fonctionnement optimal du système en archivant et en supprimant automatiquement les anciens fichiers journaux tout en conservant les informations de journalisation récentes. Les rotations des journaux Slurm sont activées par défaut lorsque vous créez un cluster.
Comment fonctionne la rotation des bûches
Lorsque cette option est activée, la configuration de rotation des journaux :
-
Surveille tous les fichiers journaux Slurm dont l'extension
.logse trouve dans le/var/log/slurm/dossier du contrôleur, des nœuds de connexion et de calcul. -
Fait pivoter les journaux lorsqu'ils atteignent une taille de 50 Mo.
-
Conserve jusqu'à deux fichiers journaux pivotés avant de les supprimer.
-
Envoie SIGUSR2 un signal aux démons Slurm (
slurmctld,slurmd, etslurmdbd) après la rotation.
Liste des fichiers journaux soumis à une rotation
Les journaux de Slurm se trouvent dans le /var/log/slurm/ répertoire. La rotation des journaux est activée pour tous les fichiers correspondants/var/log/slurm/*.log. En cas de rotation, les fichiers pivotés ont des suffixes numériques (tels que). slurmd.log.1 La liste suivante n'est pas exhaustive mais présente certains des fichiers journaux critiques qui pivotent automatiquement :
-
/var/log/slurm/slurmctld.log -
/var/log/slurm/slurmd.log -
/var/log/slurm/slurmdb.log -
/var/log/slurm/slurmrestd.log
Activer ou désactiver la rotation des journaux
Vous pouvez contrôler la fonctionnalité de rotation des journaux à l'aide du enable_slurm_log_rotation paramètre figurant dans le config.py script des scripts de cycle de vie de votre cluster, comme illustré dans l'exemple suivant :
class Config: # Set false if you want to disable log rotation of Slurm daemon logs enable_slurm_log_rotation = True # Default value
Pour désactiver la rotation des journaux, définissez le paramètre surFalse, comme indiqué dans l'exemple suivant :
enable_slurm_log_rotation = False
Note
Les scripts de cycle de vie s'exécutent sur tous les nœuds Slurm (nœuds de contrôleur, de connexion et de calcul) lors de la création du cluster. Ils s'exécutent également sur de nouveaux nœuds lorsqu'ils sont ajoutés au cluster. La mise à jour des configurations de rotation des journaux doit être effectuée manuellement après la création du cluster. La configuration de rotation du journal est stockée dans/etc/logrotate.d/sagemaker-hyperpod-slurm. Nous vous recommandons de laisser la rotation des journaux activée pour éviter que les fichiers journaux ne consomment trop d'espace disque. Pour désactiver la rotation du journal, supprimez le sagemaker-hyperpod-slurm fichier ou commentez son contenu en ajoutant # au début de chaque ligne du sagemaker-hyperpod-slurm fichier.
Paramètres de rotation des journaux par défaut
Les paramètres suivants sont configurés automatiquement pour chaque fichier journal pivoté :
| Paramètre | Value | Description |
|---|---|---|
rotate |
2 | Nombre de fichiers journaux pivotés à conserver |
size |
50 Mo | Taille maximale avant rotation |
copytruncate |
activé | Copie et tronque le fichier journal d'origine |
compress |
désactivées | Les journaux pivotés ne sont pas compressés |
missingok |
activé | Aucune erreur si le fichier journal est manquant |
notifempty |
activé | Ne fait pas pivoter les fichiers vides |
noolddir |
activé | Les fichiers pivotés restent dans le même répertoire |