Guide de l’utilisateur JupyterLab
Ce guide explique aux utilisateurs de JupyterLab comment exécuter des flux de travail d’analytique et de machine learning dans SageMaker Studio. Vous pouvez bénéficier d’un stockage rapide et mettre à l’échelle votre capacité de calcul, en fonction de vos besoins.
JupyterLab prend en charge les espaces privés et partagés. Les espaces privés sont limités à un utilisateur unique dans un domaine. Les espaces partagés permettent aux autres utilisateurs de votre domaine de collaborer avec vous en temps réel. Pour en savoir plus sur les espaces Studio, consultez Espaces Amazon SageMaker Studio.
Pour commencer à utiliser JupyterLab, créez un espace et lancez votre application JupyterLab. L’espace exécutant votre application JupyterLab est un espace JupyterLab. L’espace JupyterLab utilise une instance Amazon EC2 unique pour vos calculs et un volume Amazon EBS unique pour votre stockage. Tout ce qui se trouve dans votre espace, comme votre code, votre profil git et les variables d’environnement, est stocké sur le même volume Amazon EBS. Le volume présente 3 000 IOPS et un débit de 125 mégaoctets par seconde (Mo/s). Vous pouvez utiliser le stockage rapide pour ouvrir et exécuter plusieurs blocs-notes Jupyter sur la même instance. Vous pouvez également changer de noyau très rapidement dans un bloc-notes.
Votre administrateur a configuré les paramètres de stockage Amazon EBS par défaut pour votre espace. La taille de stockage par défaut est de 5 Go, mais vous pouvez augmenter la quantité d’espace disponible. Vous pouvez vous adresser à votre administrateur pour qu’il vous fournisse des directives.
Vous pouvez changer le type d’instance Amazon EC2 que vous utilisez pour exécuter JupyterLab, en augmentant ou en diminuant verticalement votre capacité de calcul en fonction de vos besoins. Les instances à lancement rapide démarrent beaucoup plus rapidement que les autres instances.
Votre administrateur peut vous fournir une configuration de cycle de vie qui personnalise votre environnement. Vous pouvez spécifier la configuration de cycle de vie lorsque vous créez l’espace.
Si votre administrateur vous donne accès à un système Amazon EFS, vous pouvez configurer votre espace JupyterLab pour y accéder.
Par défaut, l’application JupyterLab utilise l’image de distribution SageMaker. Cela inclut la prise en charge de nombreux packages de machine learning, d’analytique et de deep learning. Toutefois, si vous avez besoin d’une image personnalisée, votre administrateur peut vous aider à accéder aux images personnalisées.
Le volume Amazon EBS persiste indépendamment de la durée de vie d’une instance. Vous ne perdrez pas vos données en changeant les instances. Utilisez les bibliothèques de gestion de packages conda et pip pour créer des environnements personnalisés reproductibles qui persistent même lorsque vous changez de types d’instance.
Après avoir ouvert JupyterLab, vous pouvez configurer votre environnement à l’aide du terminal. Pour ouvrir le terminal, accédez au Lanceur et choisissez Terminal.
Vous trouverez ci-dessous des exemples de différentes manières de configurer un environnement dans JupyterLab.
Note
Dans Studio, vous pouvez utiliser des configurations de cycle de vie pour personnaliser votre environnement, mais nous vous recommandons d’utiliser un gestionnaire de packages à la place. L’utilisation de configurations de cycle de vie est une méthode plus sujette aux erreurs. Il est plus facile d’ajouter ou de supprimer des dépendances que de déboguer un script de configuration de cycle de vie. Cela peut également augmenter le temps de démarrage de JupyterLab.
Pour en savoir plus sur les configurations de cycle de vie, consultez Configurations de cycle de vie avec JupyterLab.