Validation de modèles en production

Grâce à SageMaker l'IA, vous pouvez tester plusieurs modèles ou versions de modèles derrière le même point de terminaison à l'aide de variantes. Une variante se compose d'une instance ML et des composants de service spécifiés dans un modèle d' SageMaker IA. Vous pouvez avoir plusieurs variantes derrière un point de terminaison. Chaque variante peut avoir un type d'instance différent ou un modèle d' SageMaker IA qui peut être redimensionné automatiquement indépendamment des autres. Les modèles des variantes peuvent être entraînés à l'aide de différents jeux de données, de différents algorithmes, de différents cadres de ML ou d'une combinaison de ces éléments. Toutes les variantes d'un point de terminaison partagent le même code d'inférence. SageMaker L'IA prend en charge deux types de variantes, les variantes de production et les variantes fictives.

Si plusieurs variantes de production sont associées à un point de terminaison, vous pouvez attribuer une partie de vos demandes d'inférence à chaque variante. Chaque demande est acheminée vers une seule variante de production. La variante de production vers laquelle la demande a été acheminée fournit la réponse à l'appelant. Vous pouvez comparer les performances des variantes de production entre elles..

Vous pouvez également avoir une variante shadow correspondant à une variante de production derrière un point de terminaison. Une partie des demandes d'inférence destinées à la variante de production est répliquée vers la variante shadow. Les réponses de la variante shadow sont journalisées à des fins de comparaison et ne sont pas renvoyées à l'appelant. Cela vous permet de tester les performances de la variante shadow sans exposer l'appelant à la réponse produite par la variante shadow.

Rubriques

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Volumes de stockage d’instances

Test de modèles avec des variantes de production