Rotations des journaux de boue - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Rotations des journaux de boue

SageMaker HyperPod fournit une rotation automatique des journaux des démons Slurm afin de gérer l'utilisation de l'espace disque et de maintenir les performances du système. La rotation des journaux est essentielle pour empêcher les journaux de consommer trop d'espace disque et garantir un fonctionnement optimal du système en archivant et en supprimant automatiquement les anciens fichiers journaux tout en conservant les informations de journalisation récentes. Les rotations des journaux Slurm sont activées par défaut lorsque vous créez un cluster.

Comment fonctionne la rotation des bûches

Lorsque cette option est activée, la configuration de rotation des journaux :

  • Surveille tous les fichiers journaux Slurm dont l'extension .log se trouve dans le /var/log/slurm/ dossier du contrôleur, des nœuds de connexion et de calcul.

  • Fait pivoter les journaux lorsqu'ils atteignent une taille de 50 Mo.

  • Conserve jusqu'à deux fichiers journaux pivotés avant de les supprimer.

  • Envoie SIGUSR2 un signal aux démons Slurm (slurmctld,slurmd, etslurmdbd) après la rotation.

Liste des fichiers journaux soumis à une rotation

Les journaux de Slurm se trouvent dans le /var/log/slurm/ répertoire. La rotation des journaux est activée pour tous les fichiers correspondants/var/log/slurm/*.log. En cas de rotation, les fichiers pivotés ont des suffixes numériques (tels que). slurmd.log.1 La liste suivante n'est pas exhaustive mais présente certains des fichiers journaux critiques qui pivotent automatiquement :

  • /var/log/slurm/slurmctld.log

  • /var/log/slurm/slurmd.log

  • /var/log/slurm/slurmdb.log

  • /var/log/slurm/slurmrestd.log

Activer ou désactiver la rotation des journaux

Vous pouvez contrôler la fonctionnalité de rotation des journaux à l'aide du enable_slurm_log_rotation paramètre figurant dans le config.py script des scripts de cycle de vie de votre cluster, comme illustré dans l'exemple suivant :

class Config: # Set false if you want to disable log rotation of Slurm daemon logs enable_slurm_log_rotation = True # Default value

Pour désactiver la rotation des journaux, définissez le paramètre surFalse, comme indiqué dans l'exemple suivant :

enable_slurm_log_rotation = False
Note

Les scripts de cycle de vie s'exécutent sur tous les nœuds Slurm (nœuds de contrôleur, de connexion et de calcul) lors de la création du cluster. Ils s'exécutent également sur de nouveaux nœuds lorsqu'ils sont ajoutés au cluster. La mise à jour des configurations de rotation des journaux doit être effectuée manuellement après la création du cluster. La configuration de rotation du journal est stockée dans/etc/logrotate.d/sagemaker-hyperpod-slurm. Nous vous recommandons de laisser la rotation des journaux activée pour éviter que les fichiers journaux ne consomment trop d'espace disque. Pour désactiver la rotation du journal, supprimez le sagemaker-hyperpod-slurm fichier ou commentez son contenu en ajoutant # au début de chaque ligne du sagemaker-hyperpod-slurm fichier.

Paramètres de rotation des journaux par défaut

Les paramètres suivants sont configurés automatiquement pour chaque fichier journal pivoté :

Paramètre Value Description
rotate 2 Nombre de fichiers journaux pivotés à conserver
size 50 Mo Taille maximale avant rotation
copytruncate activé Copie et tronque le fichier journal d'origine
compress désactivées Les journaux pivotés ne sont pas compressés
missingok activé Aucune erreur si le fichier journal est manquant
notifempty activé Ne fait pas pivoter les fichiers vides
noolddir activé Les fichiers pivotés restent dans le même répertoire