View a markdown version of this page

AWSSupport-RequestSageMakerLimitIncrease - AWS Systems Manager Referenz zum Automatisierungs-Runbook

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

AWSSupport-RequestSageMakerLimitIncrease

Beschreibung

Das AWSSupport-RequestSageMakerLimitIncrease Runbook ermöglicht die massenhafte Einreichung mehrerer Amazon SageMaker AI (SageMaker AI) -Kontingenterhöhungsanträge in einem einzigen Vorgang und optimiert so die Kontingentverwaltung für umfangreiche Machine-Learning-Workloads. Das Runbook validiert jede Anfrage anhand einstellbarer SageMaker KI-Servicequoten, leitet Anfragen innerhalb der Schwellenwerte für die automatische Genehmigung zur sofortigen Bearbeitung weiter und erstellt AWS Supportanfragen für Anfragen, die manuell überprüft werden müssen. Kontingenterhöhungen werden in derselben AWS Region angewendet, in der das Runbook ausgeführt wird.

Wichtig

Dieses Runbook unterstützt keine Anfragen zur Erhöhung der Kontingente für spezialisierte Recheninstanzen, einschließlich der Instance-Typen P4, P5 und Trainium. Reichen Sie für diese Instance-Typen individuelle Anfragen zur Erhöhung des Kontingents über die AWS Service Quotas Quota-Konsole oder den AWS Support ein.

Das Runbook wird für bis zu einer Stunde angehalten und wartet auf die Genehmigung durch die designierten Principals per Amazon Simple Notification Service (Amazon SNS) -Benachrichtigung. Prüfen Sie die Ergebnisse der ApproveQuotaCodeLimitMapping einzelnen Schritte sorgfältig, bevor Sie sie genehmigen, da genehmigte Quotenerhöhungen nicht rückgängig gemacht werden können.

Führen Sie diese Automatisierung aus (Konsole)

Art des Dokuments

Automatisierung

Eigentümer

Amazon

Plattformen

LinuxmacOS, Windows

Parameter

  • AutomationAssumeRole

    Geben Sie AWS::IAM::Role: :Arn ein

    Beschreibung: (Optional) Der Amazon-Ressourcenname (ARN) der AWS Identity and Access Management (IAM) -Rolle, die es AWS Systems Manager (Systems Manager) Automation ermöglicht, die Aktionen in Ihrem Namen durchzuführen. Wenn keine Rolle angegeben ist, verwendet Systems Manager Automation die Berechtigungen des Benutzers, der dieses Runbook startet.

  • ResourcesMapping

    Typ: StringList

    Beschreibung: (Erforderlich) Die zu erhöhenden SageMaker AI-Dienstkontingente, angegeben als durch Doppelpunkte getrennte Werte. Unterstützt drei Formate:

    • Category:Resource:NewValue— wenn sowohl Kategorie- als auch Ressourcennamen verfügbar sind. Beispiel: spot-training-job:ml.c4.xlarge:25

    • Resource:NewValue— wenn nur der Ressourcenname verfügbar ist. Beispiel: max_number_of_experiment_trial_associations:501

    • QuotaCode:NewValue— bei Verwendung des direkten Kontingentcodes. Beispiel: L-9xAxx23x:25

    Sie können Formate in derselben Anfrage mischen, getrennt durch Kommas. Maximal 50 Artikel. Beispiel: studio:CodeEditor-ml.r6id.large:787,spot-training-job:ml.c4.xlarge:34,L-99AEC235:2

  • SNSTopicArn

    Typ: Zeichenfolge

    Beschreibung: (Erforderlich) Der ARN des Amazon SNS SNS-Themas, das zum Senden von Genehmigungsbenachrichtigungen während der Automatisierungsausführung verwendet wurde.

  • ApprovIAM

    Typ: StringList

    Beschreibung: (Erforderlich) Eine Liste AWS authentifizierter Principals, die Anfragen zur Erhöhung des Kontingents genehmigen oder ablehnen können. Maximal 10 Genehmiger. Zulässige Formate: IAM-Benutzername, IAM-Benutzer-ARN, IAM-Rollen-ARN oder IAM-Annahme-Rollenbenutzer-ARN.

  • MinimumRequiredApprovals

    Typ: Ganzzahl

    Gültige Werte: 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10

    Standard: 1

    Beschreibung: (Optional) Die Mindestanzahl von Genehmigungen, die erforderlich sind, um die Automatisierung wieder aufzunehmen. Die Anzahl der in definierten Genehmiger darf nicht überschritten werden. ApproverIAM

Erforderliche IAM-Berechtigungen

Der AutomationAssumeRole Parameter erfordert die folgenden Aktionen, um das Runbook erfolgreich zu verwenden.

  • servicequotas:ListServiceQuotas

  • servicequotas:RequestServiceQuotaIncrease

  • servicequotas:GetRequestedServiceQuotaChange

  • sns:Publish

  • ssm:SendAutomationSignal

Dokumentschritte

  1. VerifyCategoriesAndResources- Validiert alle angegebenen Kategorien und Ressourcen anhand anpassbarer SageMaker KI-Servicequotas mithilfe der AWS Service Quotas API. Bestätigt, dass alle Kategorien- und Ressourcennamen existieren und geändert werden können, und identifiziert Anfragen, bei denen das neue Limit unter dem aktuellen Wert liegt.

  2. BranchOnValidCategoriesFound- Überprüft, ob gültige Kontingentzuordnungen gefunden wurden. Wenn gültige Zuordnungen vorhanden sind, fahren Sie mit fort. ApproveQuotaCodeLimitMapping Andernfalls springt direkt zu. GenerateSummaryReport

  3. ApproveQuotaCodeLimitMapping- Bereitet eine detaillierte Genehmigungsnachricht vor, in der gültige Anfragen, die zur Bearbeitung bereit sind, ungültige Anfragen mit Erläuterungen (z. B. unter den aktuellen Werten liegende Grenzwerte oder nicht unterstützte Kontingentcodes) und eine vollständige Aufschlüsselung aller Anträge zur Erhöhung der Quote vor der Genehmigung angezeigt werden.

  4. WaitingForApproval- Unterbricht die Automatisierung und sendet eine Genehmigungsbenachrichtigung an das angegebene Amazon SNS SNS-Thema. Benannte Genehmiger müssen die Ergebnisse des ApproveQuotaCodeLimitMapping Schritts überprüfen und die Anfragen genehmigen oder ablehnen. Dieser Schritt läuft nach 3600 Sekunden (einer Stunde) ab, wenn keine Maßnahme ergriffen wird.

  5. RequestQuotaIncreases- Sendet individuelle Anfragen zur Erhöhung der Kontingente für jede gültige Ressource über die AWS Service Quotas API. Anfragen werden mit einer pro Sekunde bearbeitet, um eine API-Drosselung zu verhindern. Behandelt API-Ausnahmen mit exponentiellen Wiederholungsversuchen.

  6. WaitForRequestQuotaIncreaseResults— Ruft den Status aller eingereichten Anfragen zur Erhöhung des Kontingents ab, bis keiner mehr im Status ist. PENDING Zulässige Terminalstatus sindCASE_OPENED,APPROVED,DENIED, NOT_APPROVEDCASE_CLOSED, und. INVALID_REQUEST

  7. GetRequestQuotaIncreaseResults- Ruft den endgültigen Status aller eingereichten Anfragen zur Erhöhung des Kontingents aus der AWS Service Quotas API ab und ordnet den Support-Fall IDs den entsprechenden Ressourcen und der IDs Berichtsanfrage zu.

  8. GenerateSummaryReport- Stellt eine umfassende Zusammenfassung aller Anfragen zur Erhöhung der Kontingente und ihrer Ergebnisse zusammen, einschließlich der Gesamtzahl der Anfragen, der Einzelheiten pro Anfrage, der Support-Anfrage IDs für Anfragen, die manuell überprüft werden müssen, und der umsetzbaren nächsten Schritte.

Ausgaben

GenerateSummaryReport.SummaryReport- Eine umfassende Zusammenfassung aller Anfragen zur Erhöhung der Kontingente, ihres Status und aller Support-Anfragen, die zur manuellen Überprüfung IDs erstellt wurden.