Débogage des configurations de cycle de vie dans Amazon SageMaker Studio Classic - Amazon SageMaker AI

Débogage des configurations de cycle de vie dans Amazon SageMaker Studio Classic

Important

Depuis le 30 novembre 2023, l’expérience Amazon SageMaker Studio précédente s’appelle désormais Amazon SageMaker Studio Classic. La section suivante est spécifique à l’utilisation de l’application Studio Classic. Pour en savoir plus sur l’utilisation de l’expérience Studio mise à jour, consultez Amazon SageMaker Studio.

Les rubriques suivantes montrent comment obtenir des informations sur vos configurations de cycle de vie et comment les déboguer.

Vérification du processus de configuration de cycle de vie à partir de CloudWatch Logs

Les configurations de cycle de vie ne journalisent que STDOUT et STDERR.

STDOUT est la sortie par défaut pour les scripts bash. Vous pouvez écrire dans STDERR ajoutant >&2 à la fin d'une commande bash. Par exemple, echo 'hello'>&2.

Les journaux de vos configurations de cycle de vie sont publiés sur votre Compte AWS à l'aide d'Amazon CloudWatch. Ces journaux sont disponibles dans le flux de journaux /aws/sagemaker/studio de la console CloudWatch.

  1. Ouvrez la console CloudWatch à l’adresse https://console.aws.amazon.com/cloudwatch/.

  2. Choisissez Journaux à gauche. Dans le menu déroulant, sélectionnez Groupes de journaux.

  3. Sur la page Groupes de journaux, recherchez aws/sagemaker/studio.

  4. Sélectionnez le groupe de journaux.

  5. Sur la page Informations de groupe de journaux, cliquez sur l'onglet Flux de journaux.

  6. Pour trouver les journaux d’une application spécifique, recherchez les flux de journaux en utilisant le format suivant :

    domain-id/space-name/app-type/default/LifecycleConfigOnStart

    Par exemple, pour rechercher les journaux de configuration de cycle de vie pour le domaine d-m85lcu8vbqmz, le nom d’espace i-sonic-js et le type d’application JupyterLab, utilisez la chaîne de recherche suivante :

    d-m85lcu8vbqmz/i-sonic-js/JupyterLab/default/LifecycleConfigOnStart

Échec de l’application JupyterServer

Si votre application JupyterServer se bloque en raison d’un problème avec la configuration de cycle de vie attachée, Studio Classic affiche le message d’erreur suivant sur l’écran de démarrage de Studio Classic.

Failed to create SageMaker Studio due to start-up script failure

Cliquez sur le lien View script logs pour afficher les journaux CloudWatch pour votre application JupyterServer.

Dans le cas où la configuration de cycle de vie défectueuse est spécifiée dans le paramètre DefaultResourceSpec de votre domaine, de votre profil utilisateur ou de votre espace partagé, Studio Classic continue d’utiliser la configuration de cycle de vie même après le redémarrage de Studio Classic.

Pour résoudre cette erreur, suivez les étapes de la rubrique Définition de configurations de cycle de vie par défaut pour Amazon SageMaker Studio Classic afin de supprimer le script de configuration de cycle de vie du paramètre DefaultResourceSpec ou sélectionnez un autre script comme script par défaut. Lancez ensuite une nouvelle appli JupyterServer (Serveur Jupyter).

Échec de l'application KernelGateway

Si votre application KernelGateway se bloque en raison d’un problème avec la configuration de cycle de vie attachée, Studio Classic affiche le message d’erreur dans votre bloc-notes Studio Classic.

Cliquez sur le lien View script logs pour afficher les journaux CloudWatch pour votre application KernelGateway.

Dans ce cas, votre configuration de cycle de vie est spécifiée dans le Lanceur Studio Classic lors du lancement d’un nouveau bloc-notes Studio Classic.

Pour résoudre cette erreur, utilisez le Lanceur Studio Classic pour sélectionner une autre configuration de cycle de vie ou sélectionnez No script.

Note

Une configuration de cycle de vie KernelGateway par défaut spécifiée dans DefaultResourceSpec s’applique à toutes les images KernelGateway dans le domaine, le profil utilisateur ou l’espace partagé, sauf si l’utilisateur sélectionne un autre script dans la liste affichée dans le Lanceur Studio Classic. Le script par défaut s’exécute également si No Script est sélectionné par l’utilisateur. Pour plus d’informations sur la sélection d’un script, consultez Étape 3 : Lancer une application à l'aide de la configuration de cycle de vie.

Expiration de la configuration de cycle de vie

Le délai d’expiration de la configuration du cycle de vie est limité à 5 minutes. Si un script de configuration de cycle de vie prend plus de 5 minutes à s’exécuter, Studio Classic renvoie une erreur.

Pour résoudre cette erreur, assurez-vous que votre script de configuration de cycle de vie se termine en moins de 5 minutes.

Pour vous aider à diminuer la durée de l’exécution de scripts, essayez ce qui suit :

  • Réduisez les étapes nécessaires. Par exemple, limitez quels environnements conda peuvent installer de grands packages.

  • Exécutez les tâches en parallèle.

  • Utilisez la commande nohup de votre script pour vous assurer que les signaux de blocage sont ignorés et n’empêchent pas l’exécution du script.