Débogage des configurations de cycle de vie dans Amazon SageMaker Studio Classic
Important
Depuis le 30 novembre 2023, l’expérience Amazon SageMaker Studio précédente s’appelle désormais Amazon SageMaker Studio Classic. La section suivante est spécifique à l’utilisation de l’application Studio Classic. Pour en savoir plus sur l’utilisation de l’expérience Studio mise à jour, consultez Amazon SageMaker Studio.
Les rubriques suivantes montrent comment obtenir des informations sur vos configurations de cycle de vie et comment les déboguer.
Rubriques
Vérification du processus de configuration de cycle de vie à partir de CloudWatch Logs
Les configurations de cycle de vie ne journalisent que STDOUT et STDERR.
STDOUT est la sortie par défaut pour les scripts bash. Vous pouvez écrire dans STDERR ajoutant >&2 à la fin d'une commande bash. Par exemple, echo 'hello'>&2.
Les journaux de vos configurations de cycle de vie sont publiés sur votre Compte AWS à l'aide d'Amazon CloudWatch. Ces journaux sont disponibles dans le flux de journaux /aws/sagemaker/studio de la console CloudWatch.
Ouvrez la console CloudWatch à l’adresse https://console.aws.amazon.com/cloudwatch/
. Choisissez Journaux à gauche. Dans le menu déroulant, sélectionnez Groupes de journaux.
Sur la page Groupes de journaux, recherchez
aws/sagemaker/studio.-
Sélectionnez le groupe de journaux.
Sur la page Informations de groupe de journaux, cliquez sur l'onglet Flux de journaux.
Pour trouver les journaux d’une application spécifique, recherchez les flux de journaux en utilisant le format suivant :
domain-id/space-name/app-type/default/LifecycleConfigOnStartPar exemple, pour rechercher les journaux de configuration de cycle de vie pour le domaine
d-m85lcu8vbqmz, le nom d’espacei-sonic-jset le type d’applicationJupyterLab, utilisez la chaîne de recherche suivante :d-m85lcu8vbqmz/i-sonic-js/JupyterLab/default/LifecycleConfigOnStart
Échec de l’application JupyterServer
Si votre application JupyterServer se bloque en raison d’un problème avec la configuration de cycle de vie attachée, Studio Classic affiche le message d’erreur suivant sur l’écran de démarrage de Studio Classic.
Failed to create SageMaker Studio due to start-up script failure
Cliquez sur le lien View script logs pour afficher les journaux CloudWatch pour votre application JupyterServer.
Dans le cas où la configuration de cycle de vie défectueuse est spécifiée dans le paramètre DefaultResourceSpec de votre domaine, de votre profil utilisateur ou de votre espace partagé, Studio Classic continue d’utiliser la configuration de cycle de vie même après le redémarrage de Studio Classic.
Pour résoudre cette erreur, suivez les étapes de la rubrique Définition de configurations de cycle de vie par défaut pour Amazon SageMaker Studio Classic afin de supprimer le script de configuration de cycle de vie du paramètre DefaultResourceSpec ou sélectionnez un autre script comme script par défaut. Lancez ensuite une nouvelle appli JupyterServer (Serveur Jupyter).
Échec de l'application KernelGateway
Si votre application KernelGateway se bloque en raison d’un problème avec la configuration de cycle de vie attachée, Studio Classic affiche le message d’erreur dans votre bloc-notes Studio Classic.
Cliquez sur le lien View script logs pour afficher les journaux CloudWatch pour votre application KernelGateway.
Dans ce cas, votre configuration de cycle de vie est spécifiée dans le Lanceur Studio Classic lors du lancement d’un nouveau bloc-notes Studio Classic.
Pour résoudre cette erreur, utilisez le Lanceur Studio Classic pour sélectionner une autre configuration de cycle de vie ou sélectionnez No script.
Note
Une configuration de cycle de vie KernelGateway par défaut spécifiée dans DefaultResourceSpec s’applique à toutes les images KernelGateway dans le domaine, le profil utilisateur ou l’espace partagé, sauf si l’utilisateur sélectionne un autre script dans la liste affichée dans le Lanceur Studio Classic. Le script par défaut s’exécute également si No Script est sélectionné par l’utilisateur. Pour plus d’informations sur la sélection d’un script, consultez Étape 3 : Lancer une application à l'aide de la configuration de cycle de vie.
Expiration de la configuration de cycle de vie
Le délai d’expiration de la configuration du cycle de vie est limité à 5 minutes. Si un script de configuration de cycle de vie prend plus de 5 minutes à s’exécuter, Studio Classic renvoie une erreur.
Pour résoudre cette erreur, assurez-vous que votre script de configuration de cycle de vie se termine en moins de 5 minutes.
Pour vous aider à diminuer la durée de l’exécution de scripts, essayez ce qui suit :
-
Réduisez les étapes nécessaires. Par exemple, limitez quels environnements conda peuvent installer de grands packages.
-
Exécutez les tâches en parallèle.
-
Utilisez la commande
nohupde votre script pour vous assurer que les signaux de blocage sont ignorés et n’empêchent pas l’exécution du script.