AWS BatchUnterstützung für SageMaker KI-Ausbildungsjobs - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

AWS BatchUnterstützung für SageMaker KI-Ausbildungsjobs

In einer AWS BatchJob-Warteschlange werden eingereichte Jobs gespeichert und priorisiert, bevor sie auf Rechenressourcen ausgeführt werden. Sie können SageMaker KI-Schulungsjobs an eine Job-Warteschlange senden, um die Vorteile der von bereitgestellten Tools zur serverlosen Jobplanung und Priorisierung zu nutzen. AWS Batch

Funktionsweise

In den folgenden Schritten wird der Arbeitsablauf zur Verwendung einer AWS Batch Job-Warteschlange mit SageMaker KI-Schulungsaufträgen beschrieben. Weitere Informationen und Beispiel-Notebooks finden Sie im Erste Schritte Abschnitt.

  • Einrichtung AWS Batch und alle erforderlichen Berechtigungen. Weitere Informationen finden Sie unter Einrichten von AWS Batch im Benutzerhandbuch für AWS Batch.

  • Erstellen Sie die folgenden AWS Batch Ressourcen in der Konsole oder mithilfe vonAWS CLI:

  • Konfigurieren Sie Ihre Daten und fordern Sie einen SageMaker KI-Schulungsjob an, z. B. Ihr Schulungscontainer-Image. Um einen Trainingsjob an eine AWS Batch Warteschlange zu senden, können Sie das AWS CLIAWS SDK für Python (Boto3), oder das SageMaker AI Python SDK verwenden.

  • Reichen Sie Ihre Trainingsjobs in der Auftragswarteschlange ein. Sie können die folgenden Optionen verwenden, um Aufträge einzureichen:

    • Verwenden Sie die AWS BatchSubmitServiceJob-API.

    • Verwenden Sie das aws_batchModul aus dem SageMaker AI Python SDK. Nachdem Sie ein TrainingQueue Objekt und ein Modell-Trainingsobjekt (z. B. einen Estimator oder ModelTrainer) erstellt haben, können Sie TrainingQueue mithilfe der queue.submit() Methode Trainingsjobs an die senden.

  • Nachdem Sie Jobs eingereicht haben, können Sie Ihre Job-Warteschlange und den Job-Status mit der AWS Batch Konsole, der AWS Batch DescribeServiceJobAPI oder der SageMaker DescribeTrainingJobKI-API einsehen.

Kosten und Verfügbarkeit

Detaillierte Preisinformationen zu Schulungsjobs finden Sie unter Amazon SageMaker AI-Preise. Mit AWS Batch zahlen Sie nur für alle genutzten AWS Ressourcen, z. B. EC2 Amazon-Instances. Weitere Informationen finden Sie unter AWS Batch Preise.

Sie können es AWS Batch für SageMaker KI-Schulungsjobs überall dort verwendenAWS-Region, wo Schulungsjobs verfügbar sind. Weitere Informationen finden Sie unter Amazon SageMaker AI-Endpunkte und Kontingente.

Um sicherzustellen, dass Sie über die erforderliche Kapazität verfügen, wenn Sie sie benötigen, können Sie flexible SageMaker AI-Trainingspläne (FTP) verwenden. Diese Pläne ermöglichen es Ihnen, Kapazitäten für Ihre Trainingsjobs zu reservieren. In Kombination mit AWS Batch den Warteschlangenfunktionen können Sie die Auslastung während der Laufzeit Ihres Plans maximieren. Weitere Informationen finden Sie unter Trainingspläne für Ihre Schulungsjobs oder HyperPod -cluster reservieren.

Erste Schritte

Ein Tutorial zum Einrichten einer AWS Batch Job-Warteschlange und zum Einreichen von SageMaker KI-Schulungsjobs finden Sie unter Erste Schritte mit AWS Batch SageMaker KI im AWS BatchBenutzerhandbuch.

Jupyter-Notebooks, die zeigen, wie das aws_batch Modul im SageMaker AI Python SDK verwendet wird, finden Sie in den Notebook-Beispielen AWS Batch für SageMaker AI-Training-Jobs im Repository. amazon-sagemaker-examples GitHub