View a markdown version of this page

AWSSupport-RequestSageMakerLimitIncrease - AWS Systems Manager Référence du manuel d'automatisation

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

AWSSupport-RequestSageMakerLimitIncrease

Description

Le AWSSupport-RequestSageMakerLimitIncrease runbook permet de soumettre en masse plusieurs demandes d'augmentation de quotas Amazon SageMaker AI (SageMaker AI) en une seule opération, rationalisant ainsi la gestion des quotas pour les charges de travail d'apprentissage automatique à grande échelle. Le runbook valide chaque demande par rapport à des quotas de service d' SageMaker IA ajustables, achemine les demandes dans les limites des seuils d'approbation automatique pour un traitement immédiat et crée des dossiers de AWS support pour les demandes nécessitant un examen manuel. Les augmentations de quotas sont appliquées dans la même AWS région où le runbook est exécuté.

Important

Ce runbook ne prend pas en charge les demandes d'augmentation de quota pour les instances de calcul spécialisées, notamment les types d'instances P4, P5 et Trainium. Pour ces types d'instances, soumettez des demandes d'augmentation de quota individuelles via la console AWS Service Quotas ou le AWS Support.

Le runbook s'arrête pendant une heure maximum en attendant l'approbation des responsables désignés via la notification Amazon Simple Notification Service (Amazon SNS). Vérifiez attentivement le résultat de l'ApproveQuotaCodeLimitMappingétape avant de l'approuver, car les augmentations de quota approuvées ne peuvent pas être annulées.

Exécuter cette automatisation (console)

Type de document

 Automatisation

Propriétaire

Amazon

Plateformes

LinuxmacOS, Windows

Paramètres

  • AutomationAssumeRole

    Type : AWS::IAM::Role :Arn

    Description : (Facultatif) Le nom de ressource Amazon (ARN) du rôle Gestion des identités et des accès AWS (IAM) qui permet à AWS Systems Manager (Systems Manager) Automation d'effectuer les actions en votre nom. Si aucun rôle n'est spécifié, Systems Manager Automation utilise les autorisations de l'utilisateur qui lance ce runbook.

  • ResourcesMapping

    Type : StringList

    Description : (Obligatoire) Les quotas du service SageMaker AI à augmenter, spécifiés sous forme de valeurs séparées par des deux-points. Supporte trois formats :

    • Category:Resource:NewValue— lorsque les noms des catégories et des ressources sont disponibles. Exemple : spot-training-job:ml.c4.xlarge:25

    • Resource:NewValue— lorsque seul le nom de la ressource est disponible. Exemple : max_number_of_experiment_trial_associations:501

    • QuotaCode:NewValue— lors de l'utilisation du code de quota direct. Exemple : L-9xAxx23x:25

    Vous pouvez mélanger les formats dans une même demande, séparés par des virgules. 50 articles maximum. Exemple : studio:CodeEditor-ml.r6id.large:787,spot-training-job:ml.c4.xlarge:34,L-99AEC235:2

  • SNSTopicArn

    Type : Chaîne

    Description : (Obligatoire) L'ARN de la rubrique Amazon SNS utilisé pour envoyer des notifications d'approbation lors de l'exécution de l'automatisation.

  • Approbation IAM

    Type : StringList

    Description : (Obligatoire) Liste des principaux AWS authentifiés qui peuvent approuver ou rejeter les demandes d'augmentation de quota. Maximum de 10 approbateurs. Formats acceptés : nom d'utilisateur IAM, ARN de l'utilisateur IAM, ARN du rôle IAM ou ARN de l'utilisateur du rôle IAM assume le rôle.

  • MinimumRequiredApprovals

    Type : Integer

    Valeurs valides : 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10

    Valeur par défaut : 1

    Description : (Facultatif) Le nombre minimum d'approbations requises pour reprendre l'automatisation. Ne peut pas dépasser le nombre d'approbateurs défini dansApproverIAM.

Autorisations IAM requises

Le AutomationAssumeRole paramètre nécessite les actions suivantes pour utiliser correctement le runbook.

  • servicequotas:ListServiceQuotas

  • servicequotas:RequestServiceQuotaIncrease

  • servicequotas:GetRequestedServiceQuotaChange

  • sns:Publish

  • ssm:SendAutomationSignal

Étapes de document

  1. VerifyCategoriesAndResources- Valide toutes les catégories et ressources spécifiées par rapport à des quotas de service d' SageMaker IA ajustables à l'aide de l'API AWS Service Quotas. Confirme que chaque catégorie et nom de ressource existe et est modifiable, et identifie les demandes pour lesquelles la nouvelle limite est inférieure à la valeur actuelle.

  2. BranchOnValidCategoriesFound- Vérifie si des mappages de quotas valides ont été trouvés. Si des mappages valides existent, passe à. ApproveQuotaCodeLimitMapping Sinon, passe directement à. GenerateSummaryReport

  3. ApproveQuotaCodeLimitMapping- Prépare un message d'approbation détaillé indiquant les demandes valides prêtes à être traitées, les demandes non valides accompagnées d'explications (telles que des limites inférieures aux valeurs actuelles ou des codes de quota non pris en charge) et une ventilation complète de toutes les demandes d'augmentation de quota à examiner avant approbation.

  4. WaitingForApproval- Suspend l'automatisation et envoie une notification d'approbation à la rubrique Amazon SNS spécifiée. Les approbateurs désignés doivent examiner le résultat de l'ApproveQuotaCodeLimitMappingétape et approuver ou rejeter les demandes. Cette étape expire au bout de 3 600 secondes (une heure) si aucune action n'est entreprise.

  5. RequestQuotaIncreases- Soumet des demandes d'augmentation de quota individuelles pour chaque ressource valide via l'API AWS Service Quotas. Les demandes sont rythmées à une par seconde pour éviter le ralentissement de l'API. Gère les exceptions d'API avec de nouvelles tentatives exponentielles.

  6. WaitForRequestQuotaIncreaseResults- Vérifie le statut de toutes les demandes d'augmentation de quota soumises jusqu'à ce qu'aucune n'en PENDING reste. Les statuts de terminal acceptés sont CASE_OPENEDAPPROVED,DENIED, NOT_APPROVEDCASE_CLOSED, etINVALID_REQUEST.

  7. GetRequestQuotaIncreaseResults- Récupère le statut final de toutes les demandes d'augmentation de quotas soumises depuis l'API AWS Service Quotas et associe le dossier IDs d'assistance aux ressources et IDs demandes de rapports correspondantes.

  8. GenerateSummaryReport- Compile un résumé complet de toutes les demandes d'augmentation de quota et de leurs résultats, y compris le nombre total de demandes, les détails de chaque demande, le dossier d'assistance IDs pour les demandes nécessitant un examen manuel et les prochaines étapes réalisables.

Sorties

GenerateSummaryReport.SummaryReport- Un résumé complet de toutes les demandes d'augmentation de quota, de leur statut et de tout dossier d'assistance IDs créé pour examen manuel.