Quand devriez-vous utiliser un projet d' SageMaker IA ?Qu'y a-t-il dans un projet d' SageMaker IA ?Dois-je créer un projet pour utiliser des pipelines d' SageMaker IA ?

Qu'est-ce qu'un projet d' SageMaker IA ?

SageMaker Les projets aident les entreprises à mettre en place et à standardiser des environnements de développement pour les data scientists et CI/CD des systèmes pour les MLOps ingénieurs. Les projets permettent également aux organisations de configurer la gestion des dépendances, la gestion du référentiel de code, la reproductibilité de la génération et le partage d’artefacts.

Vous pouvez provisionner SageMaker des projets à l'aide de modèles personnalisés stockés dans des compartiments Amazon S3 ou à l'aide de modèles issus de l' AWS Service Catalog SageMaker IA. Pour plus d'informations sur le AWS Service Catalog, voir What Is AWS Service Catalog. Avec SageMaker Projects, MLOps les ingénieurs et les administrateurs d'organisation peuvent définir leurs propres modèles ou utiliser des modèles fournis par l' SageMaker IA. Les modèles SageMaker fournis par l'IA démarrent le flux de travail ML grâce au contrôle des versions source, à des pipelines de ML automatisés et à un ensemble de code pour commencer rapidement à itérer sur les cas d'utilisation du ML.

Quand devriez-vous utiliser un projet d' SageMaker IA ?

Important

À compter du 9 septembre 2024, les modèles de projet qui utilisent le AWS CodeCommit référentiel ne sont plus pris en charge. Pour les nouveaux projets, sélectionnez parmi les modèles de projet disponibles qui utilisent des référentiels Git tiers.

Bien que les blocs-notes soient utiles pour la création et l’expérimentation de modèles, une équipe de scientifiques des données et d’ingénieurs de ML partageant du code ont besoin d’un moyen plus évolutif de maintenir la cohérence du code et un contrôle de version strict.

Chaque organisation possède son propre ensemble de normes et de pratiques qui assurent la sécurité et la gouvernance de son AWS environnement. SageMaker L'IA fournit un ensemble de modèles de première qualité pour les organisations qui souhaitent se lancer rapidement dans les flux de travail ML et le CI/CD. Les modèles incluent des projets qui utilisent des services AWS-native pour CI/CD, tels que AWS CodeBuild, et AWS CodePipeline. AWS CodeCommit Les modèles offrent également la possibilité de créer des projets utilisant des outils tiers, tels que Jenkins et GitHub. Pour obtenir la liste des modèles de projet fournis par l' SageMaker IA, consultezUtiliser des modèles SageMaker de projet fournis par l'IA.

Organisations ont souvent besoin d'un contrôle strict des MLOps ressources qu'elles fournissent et gèrent. Cette responsabilité implique certaines tâches, notamment la configuration des rôles et des politiques IAM, l'application des balises de ressources, le renforcement du chiffrement et le découplage des ressources entre plusieurs comptes. SageMaker Les projets peuvent prendre en charge toutes ces tâches grâce à des offres de modèles personnalisés dans le cadre desquelles les organisations utilisent des CloudFormation modèles pour définir les ressources nécessaires à un flux de travail de machine learning. Les scientifiques des données peuvent choisir un modèle pour amorcer et préconfigurer leur flux ML.

Pour commencer, nous vous recommandons de créer et de stocker des modèles personnalisés dans un compartiment Amazon S3. Cela vous permet de créer un bucket dans n'importe quelle région prise en charge par votre organisation. S3 prend en charge le contrôle de version, ce qui vous permet de conserver plusieurs versions de vos modèles et de les restaurer si nécessaire. Pour plus d'informations sur la création d'un projet à partir d'un magasin de modèles dans un compartiment Amazon S3, consultezUtilisation d'un modèle issu d'un compartiment Amazon S3.

Vous pouvez également créer des modèles personnalisés sous forme de produits Service Catalog et les configurer dans l'interface utilisateur de Studio ou Studio Classic sous Modèles d'organisation. Le Service Catalog est un service qui aide les entreprises à créer et à gérer des catalogues de produits dont l'utilisation est approuvée sur AWS. Pour plus d'informations sur la création de modèles personnalisés, voir Création de modèles de projets d' SageMaker IA personnalisés — Meilleures pratiques.

Bien que vous puissiez utiliser l'une ou l'autre option, nous vous recommandons d'utiliser des compartiments S3 sur le Service Catalog, afin de pouvoir créer un compartiment dans les régions prises en charge où l' SageMaker IA est disponible sans avoir à gérer les complexités du Service Catalog.

SageMaker Les projets peuvent vous aider à gérer vos référentiels Git afin que vous puissiez collaborer plus efficacement entre les équipes, garantir la cohérence du code et prendre en charge le CI/CD. SageMaker Les projets peuvent vous aider dans les tâches suivantes :

Organiser toutes les entités du cycle de vie ML dans un seul projet.
Établir une approche en un seul clic pour configurer une infrastructure ML standard pour l'entraînement et le déploiement des modèles, qui intègre les bonnes pratiques.
Créer et partager des modèles pour l’infrastructure ML afin de répondre à plusieurs cas d’utilisation.
Tirez parti des modèles prédéfinis SageMaker fournis par l'IA pour commencer rapidement à vous concentrer sur la création de modèles, ou créez des modèles personnalisés avec des ressources et des directives spécifiques à l'organisation.
S’intégrer aux outils de votre choix en étendant les modèles de projet. Pour un exemple, voir Créer un projet d' SageMaker IA à intégrer GitLab et GitLab Pipelines.
Organiser toutes les entités du cycle de vie ML dans un seul projet.

Qu'y a-t-il dans un projet d' SageMaker IA ?

Les clients ont la possibilité de configurer leurs projets avec les ressources qui répondent le mieux à leur cas d’utilisation. L'exemple ci-dessous présente la MLOps configuration d'un flux de travail ML, y compris la formation et le déploiement des modèles.

Diagramme de flux de travail ML pour un pipeline qui inclut les étapes d’entraînement et de déploiement de modèles.

Un projet typique avec un modèle SageMaker fourni par l'IA peut inclure les éléments suivants :

Un ou plusieurs référentiels avec un exemple de code pour créer et déployer des solutions de ML. Ce sont des exemples pratiques que vous pouvez adapter à vos besoins. Vous possédez ce code et vous pouvez tirer parti des référentiels contrôlés par version pour vos tâches.
Un pipeline d' SageMaker IA qui définit les étapes de préparation des données, de formation, d'évaluation et de déploiement des modèles, comme indiqué dans le schéma suivant.
Un pipeline CodePipeline ou Jenkins qui exécute votre pipeline d' SageMaker IA chaque fois que vous enregistrez une nouvelle version du code. Pour plus d'informations sur CodePipeline, voir Qu'est-ce que AWS CodePipeline. Pour obtenir des informations sur Jenkins, consultez Documentation utilisateur Jenkins.
Groupe de modèles contenant des versions de modèle. Chaque fois que vous approuvez la version du modèle résultant d'une exécution de pipeline d' SageMaker IA, vous pouvez la déployer sur un point de terminaison d' SageMaker IA.

Chaque projet d' SageMaker IA possède un nom et un identifiant uniques qui sont appliqués sous forme de balises à toutes les SageMaker IA et AWS ressources créées dans le projet. Avec le nom et l’ID, vous pouvez afficher toutes les entités associées à votre projet. Il s’agit des licences suivantes :

Pipelines
Modèles enregistrés
Modèles déployés (points de terminaison)
Ensembles de données
Produits Service Catalog
CodePipeline et pipelines Jenkins
CodeCommit et des référentiels Git tiers

Dois-je créer un projet pour utiliser des pipelines d' SageMaker IA ?

Non SageMaker les pipelines sont des entités autonomes, tout comme les tâches de formation, les tâches de traitement et les autres tâches liées à SageMaker l'IA. Vous pouvez créer, mettre à jour et exécuter des pipelines directement dans un bloc-notes à l'aide du SDK SageMaker Python sans utiliser de projet d' SageMaker IA.

Les projets fournissent une couche supplémentaire pour vous aider à organiser votre code et à adopter les bonnes pratiques opérationnelles dont vous avez besoin pour un système de qualité de la production.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Projets

Octroi des autorisations de SageMaker studio requises pour utiliser les projets