Création d’une instance de bloc-notes Amazon SageMaker
Important
Les politiques IAM personnalisées qui autorisent Amazon SageMaker Studio ou Amazon SageMaker Studio Classic à créer des ressources Amazon SageMaker doivent également accorder des autorisations pour ajouter des balises à ces ressources. L’autorisation d’ajouter des balises aux ressources est requise, car Studio et Studio Classic balisent automatiquement toutes les ressources qu’ils créent. Si une politique IAM autorise Studio et Studio Classic à créer des ressources mais n’autorise pas le balisage, des erreurs « AccessDenied » peuvent se produire lors de la tentative de création de ressources. Pour plus d’informations, consultez Octroi d’autorisations pour baliser les ressources SageMaker AI.
Les Politiques gérées par AWS pour Amazon SageMaker AI qui autorisent la création de ressources SageMaker incluent déjà des autorisations permettant d’ajouter des balises lors de la création de ces ressources.
Une instance de bloc-notes Amazon SageMaker est une instance de calcul ML exécutant l’application de bloc-notes Jupyter. SageMaker AI gère la création de l’instance et des ressources connexes. Utilisez les blocs-notes Jupyter dans votre instance de bloc-notes pour :
-
préparer et traiter les données ;
-
écrire du code pour entraîner des modèles ;
-
déployer des modèles dans l’hébergement SageMaker AI ;
-
tester et valider vos modèles.
Pour créer une instance de bloc-notes, utilisez la console SageMaker AI ou l’API CreateNotebookInstance.
Le type d’instance de bloc-notes que vous choisissez dépend de la façon dont vous utilisez votre instance de bloc-notes. Assurez-vous que votre instance de bloc-notes n’est pas liée par la mémoire, le CPU ou les E/S. Pour charger un jeu de données en mémoire sur l’instance de bloc-notes à des fins d’exploration ou de prétraitement, choisissez un type d’instance avec suffisamment de mémoire RAM pour votre jeu de données. Cela nécessite une instance avec au moins 16 Go de mémoire (.xlarge ou plus). Si vous envisagez d’utiliser le bloc-notes pour un prétraitement intensif, nous vous recommandons de choisir une instance optimisée pour le calcul, telle qu’une instance c4 ou c5.
L’une des bonnes pratiques lors de l’utilisation d’un bloc-notes SageMaker consiste à utiliser l’instance de bloc-notes pour orchestrer d’autres services AWS. Par exemple, vous pouvez utiliser l’instance de bloc-notes pour gérer le traitement de grands jeux de données. Pour cela, appelez les services AWS Glue for ETL (extraction, transformation et chargement) ou Amazon EMR pour le mappage et la réduction des données à l’aide de Hadoop. Vous pouvez utiliser les services AWS comme formes temporaires de calcul ou de stockage de vos données.
Vous pouvez stocker et extraire vos données d’entraînement et de test à l’aide d’un compartiment Amazon Simple Storage Service. Vous pouvez ensuite utiliser SageMaker AI pour entraîner et générer votre modèle. Par conséquent, le type d’instance de votre bloc-notes n’aurait aucune incidence sur la vitesse de l’entraînement et des tests de votre modèle.
Une fois la demande reçue, SageMaker AI effectue les opérations suivantes :
-
Création d’une interface réseau : si vous choisissez la configuration de VPC facultative, SageMaker AI crée l’interface réseau dans votre VPC. Il utilise l’ID de sous-réseau que vous avez fourni dans la demande pour déterminer la zone de disponibilité dans laquelle le sous-réseau sera créé. SageMaker AI associe le groupe de sécurité que vous fournissez dans la demande au sous-réseau. Pour plus d’informations, consultez Connecter une instance de bloc-notes dans un VPC à des ressources externes.
-
Lancement d’une instance de calcul ML : SageMaker AI lance une instance de calcul ML dans un VPC SageMaker AI. SageMaker AI effectue les tâches de configuration qui lui permettent de gérer votre instance de bloc-notes. Si vous avez spécifié votre VPC, SageMaker AI active le trafic entre votre VPC et l’instance de bloc-notes.
-
Installation des packages et des bibliothèques Anaconda pour les plateformes de deep learning courantes : SageMaker AI installe tous les packages Anaconda inclus dans le programme d’installation. Pour plus d’informations, consultez Liste des packages Anaconda
. En outre, SageMaker AI installe les bibliothèques de deep learning TensorFlow et Apache MXNet. -
Attachement d’un volume de stockage ML : SageMaker AI attache un volume de stockage ML à l’instance de calcul ML. Vous pouvez utiliser le volume comme zone de travail pour nettoyer le jeu de données d’entraînement ou pour stocker temporairement des données de validation, de test ou d’autres données. Pour le volume, choisissez n’importe quelle taille comprise entre 5 Go et 16 384 Go, par incréments de 1 Go. La valeur par défaut est 5 Go. Les volumes de stockage ML sont chiffrés et, par conséquent, SageMaker AI ne peut pas déterminer la quantité d’espace disponible sur le volume. Pour cette raison, vous pouvez augmenter la taille du volume lorsque vous mettez à jour une instance de bloc-notes, mais vous ne pouvez pas réduire la taille de volume. Si vous souhaitez réduire la taille du volume de stockage ML utilisé, créez une nouvelle instance de bloc-notes avec la taille souhaitée.
Seuls les fichiers et les données enregistrés dans le dossier
/home/ec2-user/SageMakersont conservés entre les sessions d’instance de bloc-notes. Les fichiers et les données enregistrés en dehors de ce répertoire sont remplacés lorsque l’instance de bloc-notes s’arrête et redémarre. Chaque répertoire /tmp d'instance de bloc-notes offre un stockage minimum instantané de 10 Go dans une instance de bloc-notes. Un stockage d’instance offre un stockage par bloc temporaire qui n’est pas conservé. Lorsque l’instance est arrêtée ou redémarrée, SageMaker AI supprime le contenu de ce répertoire. Ce stockage temporaire fait partie du volume racine de l’instance bloc-notes.Si le type d’instance utilisé par l’instance de bloc-notes prend en charge le protocole NVMe, les clients peuvent utiliser les volumes de stockage d’instances NVMe disponibles pour ce type d’instance. Pour les instances avec des volumes de stockage NVMe, tous les volumes de stockage d’instances sont automatiquement attachés à l’instance au lancement. Pour plus d’informations sur les types d’instances et leurs volumes de stockage NVMe associés, consultez les détails sur les types d’instances Amazon Elastic Compute Cloud
. Pour rendre le volume de stockage NVMe attaché disponible pour votre instance de bloc-notes, suivez les étapes décrites dans Mise à disposition des volumes de stockage d’instances sur votre instance. Effectuez les étapes avec un accès racine ou à l’aide d’un script de configuration de cycle de vie.
Note
Les volumes de stockage d’instances NVMe ne constituent pas un stockage persistant. Ce stockage est de courte durée avec l’instance et doit être reconfiguré chaque fois qu’une instance dotée de ce stockage est lancée.
Pour créer une instance de bloc-notes SageMaker AI :
-
Ouvrez la console Amazon SageMaker AI à l’adresse https://console.aws.amazon.com/sagemaker/
. -
Choisissez Instances de bloc-notes, puis Créer une instance de bloc-notes.
-
Sur la page Créer une instance de bloc-notes, fournissez les informations suivantes :
-
Pour Notebook instance name (Nom d’instance de bloc-notes), saisissez un nom pour votre ordinateur bloc-notes.
-
Pour Notebook instance type (Type d’instance de bloc-notes), choisissez une taille d’instance adaptée à votre cas d’utilisation. Pour obtenir la liste des types d’instances et des quotas pris en charge, consultez Service Quotas Amazon SageMaker AI.
-
Pour Identificateur de plateforme, choisissez un type de plateforme sur lequel créer l’instance de bloc-notes. Ce type de plateforme dicte le système d’exploitation et la version de JupyterLab avec lesquels votre instance de bloc-notes est créée. À compter du 30 juin 2025, seul JupyterLab 4 est pris en charge pour les nouvelles instances. Pour plus d’informations sur le type d’identificateur de plateforme, consultez Instances de bloc-notes Amazon Linux 2. Pour plus d’informations sur les versions de JupyterLab, consultez Versionnement de JupyterLab.
Important
JupyterLab 1 et JupyterLab 3 ne sont plus pris en charge depuis le 30 juin 2025. Vous ne pouvez plus créer de nouvelles instances de bloc-notes ou redémarrer des instances de bloc-notes arrêtées avec ces versions. Les instances en service existantes peuvent continuer à fonctionner mais ne recevront pas de mises à jour de sécurité ni de correctifs de bogues. Migrez vers les instances de bloc-notes JupyterLab 4 pour continuer à bénéficier d’un support technique. Pour plus d’informations, consultez Maintenance des versions de JupyterLab.
-
(Facultatif) La configuration supplémentaire permet aux utilisateurs avancés de créer un script shell qui peut s’exécuter lorsque vous créez ou démarrez l’instance. Ce script, appelé script de configuration du cycle de vie, peut être utilisé pour définir l’environnement du bloc-notes ou pour exécuter d’autres fonctions. Pour plus d’informations, consultez Personnalisation d’une instance de bloc-notes SageMaker à l’aide d’un script LCC.
-
(Facultatif) La configuration supplémentaire vous permet également de spécifier la taille, en Go, du volume de stockage ML attaché à l'instance de bloc-notes. Vous pouvez choisir une taille comprise entre 5 et 16,384 Go, par incréments de 1 Go. Vous pouvez utiliser le volume pour nettoyer le jeu de données d'entraînement ou stocker temporairement des données de validation ou d'autres données.
-
(Facultatif) Pour Minimum IMDS Version (Version IMDS minimale), sélectionnez une version dans la liste déroulante. Si cette valeur est définie sur v1, les deux versions peuvent être utilisées avec l'instance de bloc-notes. Si v2 est sélectionné, seule IMDSv2 peut être utilisée avec l'instance de bloc-notes. Pour plus d’informations sur IMDSv2, consultez Utiliser IMDSv2.
Note
À compter du 31 octobre 2022, la version IMDS minimale par défaut pour les instances de bloc-notes SageMaker passe d'IMDSv1 à IMDSv2.
À compter du 1er février 2023, IMDSv1 ne sera plus disponible pour la création de nouvelles instances de bloc-notes. Après cette date, vous pouvez créer des instances de bloc-notes avec une version IMDS minimale de 2.
-
Pour Rôle IAM, choisissez un rôle IAM existant dans votre compte ayant les autorisations nécessaires pour accéder aux ressources SageMaker AI ou choisissez Créer un nouveau rôle. Si vous choisissez Créer un nouveau rôle, SageMaker AI crée un rôle IAM nommé
AmazonSageMaker-ExecutionRole-. La politique gérée AWSYYYYMMDDTHHmmSSAmazonSageMakerFullAccessest attachée au rôle. Ce rôle fournit des autorisations qui permettent à l’instance de bloc-notes d’appeler SageMaker AI et Amazon S3. -
Dans Accès racine, pour accorder l’accès racine à tous les utilisateurs d’instances de bloc-notes, choisissez Activer. Pour retirer aux utilisateurs l’accès racine, choisissez Désactiver. Si vous accordez l’accès racine, tous les utilisateurs d’instances de bloc-notes ont des privilèges d’administrateur et peuvent accéder à tous les fichiers et les modifier.
-
(Facultatif) La clé de chiffrement vous permet de chiffrer des données sur le volume de stockage ML attaché à l’instance de bloc-notes à l’aide d’une clé AWS Key Management Service (AWS KMS). Si vous envisagez de stocker des informations sensibles sur le volume de stockage de Machine Learning, envisagez de les chiffrer.
-
(Facultatif) Le réseau vous permet de placer votre instance de bloc-notes dans un Virtual Private Cloud (VPC). Un VPC fournit une sécurité supplémentaire et limite l’accès aux ressources dans le VPC à partir de sources extérieures au VPC. Pour plus d’information sur VPC, consultez le Guide de l’utilisateur Amazon VPC.
Pour ajouter votre instance de bloc-notes à un VPC :
-
Choisissez le VPC et un SubnetId.
-
Pour Security Group (Groupe de sécurité), sélectionnez le groupe de sécurité par défaut de votre VPC.
-
Si vous avez besoin de votre instance de bloc-notes pour accéder à Internet, activez l’accès direct à Internet. Pour Direct internet access (Accès Internet direct), choisissez Enable (activer). L’accès à Internet peut rendre votre instance de bloc-notes moins sécurisée. Pour plus d’informations, consultez Connecter une instance de bloc-notes dans un VPC à des ressources externes.
-
-
(Facultatif) Pour associer des référentiels git à l’instance de bloc-notes, choisissez un référentiel par défaut et jusqu’à 3 référentiels supplémentaires. Pour plus d’informations, consultez Référentiels Git avec des instances de bloc-notes SageMaker AI.
-
Choisissez Create notebook instance (Créer une instance de bloc-notes).
En quelques minutes, Amazon SageMaker AI lance une instance de calcul ML (dans le cas présent, une instance de bloc-notes) et lui attache un volume de stockage ML. L’instance de bloc-notes possède un serveur de blocs-notes Jupyter préconfiguré et un ensemble de bibliothèques Anaconda. Pour plus d’informations, consultez l’API
CreateNotebookInstance.
-
-
Lorsque l’état de l’instance de bloc-notes est
InService, dans la console, l’instance de bloc-notes est prête à l’emploi. Choisissez Open Jupyter (Ouvrir Jupyter) en regard du nom du bloc-notes pour ouvrir le tableau de bord Jupyter classique.Note
Pour renforcer la sécurité de votre instance de bloc-notes Amazon SageMaker, tous les domaines
régionaux sont enregistrés dans la liste des suffixes publics (PSL)notebook.region.sagemaker.awsd’Internet. Pour plus de sécurité, nous vous recommandons d’utiliser des cookies avec un préfixe __Host-pour définir des cookies sensibles pour les domaines de vos instances de bloc-notes SageMaker. Cela vous permettra de protéger votre domaine contre les tentatives de falsification de requêtes intersites (CSRF). Pour plus d’informations, consultez la page Set-Cookiedu site Web de la documentation pour les développeurs de mozilla.org . Vous pouvez choisir Open Jupyter (Ouvrir Jupyter) pour ouvrir le tableau de bord JupyterLab. Le tableau de bord permet d’accéder à votre instance de bloc-notes.
Pour plus d’informations sur les blocs-notes Jupyter, consultez Jupyter
.