Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
AWSSupport-RequestSageMakerLimitIncrease
Beschreibung
Das AWSSupport-RequestSageMakerLimitIncrease Runbook ermöglicht die massenhafte Einreichung mehrerer Amazon SageMaker AI (SageMaker AI) -Kontingenterhöhungsanträge in einem einzigen Vorgang und optimiert so die Kontingentverwaltung für umfangreiche Machine-Learning-Workloads. Das Runbook validiert jede Anfrage anhand einstellbarer SageMaker KI-Servicequoten, leitet Anfragen innerhalb der Schwellenwerte für die automatische Genehmigung zur sofortigen Bearbeitung weiter und erstellt AWS Supportanfragen für Anfragen, die manuell überprüft werden müssen. Kontingenterhöhungen werden in derselben AWS Region angewendet, in der das Runbook ausgeführt wird.
Wichtig
Dieses Runbook unterstützt keine Anfragen zur Erhöhung der Kontingente für spezialisierte Recheninstanzen, einschließlich der Instance-Typen P4, P5 und Trainium. Reichen Sie für diese Instance-Typen individuelle Anfragen zur Erhöhung des Kontingents über die AWS Service Quotas Quota-Konsole oder den AWS Support ein.
Das Runbook wird für bis zu einer Stunde angehalten und wartet auf die Genehmigung durch die designierten Principals per Amazon Simple Notification Service (Amazon SNS) -Benachrichtigung. Prüfen Sie die Ergebnisse der ApproveQuotaCodeLimitMapping einzelnen Schritte sorgfältig, bevor Sie sie genehmigen, da genehmigte Quotenerhöhungen nicht rückgängig gemacht werden können.
Führen Sie diese Automatisierung aus (Konsole)
Art des Dokuments
Automatisierung
Eigentümer
Amazon
Plattformen
LinuxmacOS, Windows
Parameter
-
AutomationAssumeRole
Geben Sie AWS::IAM::Role: :Arn ein
Beschreibung: (Optional) Der Amazon-Ressourcenname (ARN) der AWS Identity and Access Management (IAM) -Rolle, die es AWS Systems Manager (Systems Manager) Automation ermöglicht, die Aktionen in Ihrem Namen durchzuführen. Wenn keine Rolle angegeben ist, verwendet Systems Manager Automation die Berechtigungen des Benutzers, der dieses Runbook startet.
-
ResourcesMapping
Typ: StringList
Beschreibung: (Erforderlich) Die zu erhöhenden SageMaker AI-Dienstkontingente, angegeben als durch Doppelpunkte getrennte Werte. Unterstützt drei Formate:
-
Category:Resource:NewValue— wenn sowohl Kategorie- als auch Ressourcennamen verfügbar sind. Beispiel:spot-training-job:ml.c4.xlarge:25 -
Resource:NewValue— wenn nur der Ressourcenname verfügbar ist. Beispiel:max_number_of_experiment_trial_associations:501 -
QuotaCode:NewValue— bei Verwendung des direkten Kontingentcodes. Beispiel:L-9xAxx23x:25
Sie können Formate in derselben Anfrage mischen, getrennt durch Kommas. Maximal 50 Artikel. Beispiel:
studio:CodeEditor-ml.r6id.large:787,spot-training-job:ml.c4.xlarge:34,L-99AEC235:2 -
-
SNSTopicArn
Typ: Zeichenfolge
Beschreibung: (Erforderlich) Der ARN des Amazon SNS SNS-Themas, das zum Senden von Genehmigungsbenachrichtigungen während der Automatisierungsausführung verwendet wurde.
-
ApprovIAM
Typ: StringList
Beschreibung: (Erforderlich) Eine Liste AWS authentifizierter Principals, die Anfragen zur Erhöhung des Kontingents genehmigen oder ablehnen können. Maximal 10 Genehmiger. Zulässige Formate: IAM-Benutzername, IAM-Benutzer-ARN, IAM-Rollen-ARN oder IAM-Annahme-Rollenbenutzer-ARN.
-
MinimumRequiredApprovals
Typ: Ganzzahl
Gültige Werte: 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10
Standard: 1
Beschreibung: (Optional) Die Mindestanzahl von Genehmigungen, die erforderlich sind, um die Automatisierung wieder aufzunehmen. Die Anzahl der in definierten Genehmiger darf nicht überschritten werden.
ApproverIAM
Erforderliche IAM-Berechtigungen
Der AutomationAssumeRole Parameter erfordert die folgenden Aktionen, um das Runbook erfolgreich zu verwenden.
-
servicequotas:ListServiceQuotas -
servicequotas:RequestServiceQuotaIncrease -
servicequotas:GetRequestedServiceQuotaChange -
sns:Publish -
ssm:SendAutomationSignal
Dokumentschritte
-
VerifyCategoriesAndResources- Validiert alle angegebenen Kategorien und Ressourcen anhand anpassbarer SageMaker KI-Servicequotas mithilfe der AWS Service Quotas API. Bestätigt, dass alle Kategorien- und Ressourcennamen existieren und geändert werden können, und identifiziert Anfragen, bei denen das neue Limit unter dem aktuellen Wert liegt. -
BranchOnValidCategoriesFound- Überprüft, ob gültige Kontingentzuordnungen gefunden wurden. Wenn gültige Zuordnungen vorhanden sind, fahren Sie mit fort.ApproveQuotaCodeLimitMappingAndernfalls springt direkt zu.GenerateSummaryReport -
ApproveQuotaCodeLimitMapping- Bereitet eine detaillierte Genehmigungsnachricht vor, in der gültige Anfragen, die zur Bearbeitung bereit sind, ungültige Anfragen mit Erläuterungen (z. B. unter den aktuellen Werten liegende Grenzwerte oder nicht unterstützte Kontingentcodes) und eine vollständige Aufschlüsselung aller Anträge zur Erhöhung der Quote vor der Genehmigung angezeigt werden. -
WaitingForApproval- Unterbricht die Automatisierung und sendet eine Genehmigungsbenachrichtigung an das angegebene Amazon SNS SNS-Thema. Benannte Genehmiger müssen die Ergebnisse desApproveQuotaCodeLimitMappingSchritts überprüfen und die Anfragen genehmigen oder ablehnen. Dieser Schritt läuft nach 3600 Sekunden (einer Stunde) ab, wenn keine Maßnahme ergriffen wird. -
RequestQuotaIncreases- Sendet individuelle Anfragen zur Erhöhung der Kontingente für jede gültige Ressource über die AWS Service Quotas API. Anfragen werden mit einer pro Sekunde bearbeitet, um eine API-Drosselung zu verhindern. Behandelt API-Ausnahmen mit exponentiellen Wiederholungsversuchen. -
WaitForRequestQuotaIncreaseResults— Ruft den Status aller eingereichten Anfragen zur Erhöhung des Kontingents ab, bis keiner mehr im Status ist.PENDINGZulässige Terminalstatus sindCASE_OPENED,APPROVED,DENIED,NOT_APPROVEDCASE_CLOSED, und.INVALID_REQUEST -
GetRequestQuotaIncreaseResults- Ruft den endgültigen Status aller eingereichten Anfragen zur Erhöhung des Kontingents aus der AWS Service Quotas API ab und ordnet den Support-Fall IDs den entsprechenden Ressourcen und der IDs Berichtsanfrage zu. -
GenerateSummaryReport- Stellt eine umfassende Zusammenfassung aller Anfragen zur Erhöhung der Kontingente und ihrer Ergebnisse zusammen, einschließlich der Gesamtzahl der Anfragen, der Einzelheiten pro Anfrage, der Support-Anfrage IDs für Anfragen, die manuell überprüft werden müssen, und der umsetzbaren nächsten Schritte.
Ausgaben
GenerateSummaryReport.SummaryReport- Eine umfassende Zusammenfassung aller Anfragen zur Erhöhung der Kontingente, ihres Status und aller Support-Anfragen, die zur manuellen Überprüfung IDs erstellt wurden.