Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Verwenden eines Modellpakets zum Erstellen eines Modells
Verwenden Sie ein Modellpaket zum Erstellen eines bereitstellbaren Modells, das Sie verwenden können, um Echtzeit-Inferenzen abzurufen, indem Sie einen gehosteten Endpunkt erstellen oder Stapelumwandlungsaufträge ausführen. Sie können ein bereitstellbares Modell aus einem Modellpaket mithilfe der Konsole von Amazon SageMaker AI, der Low-Level SageMaker API oder des Amazon SageMaker Python SDKs
Themen
Verwenden eines Modellpakets zum Erstellen eines Modells (Konsole)
So erstellen Sie ein bereitstellbares Modell aus einem Modellpaket (Konsole)
-
Öffnen Sie die SageMaker-AI-Konsole unter https://console.aws.amazon.com/sagemaker/
. -
Wählen Sie Model packages (Modellpakete) aus.
-
Wählen Sie ein Modellpaket, das Sie aus der Liste auf der Registerkarte Meine Modellpakete erstellt haben, oder wählen Sie auf der Registerkarte AWS Marketplace-Abonnements ein Modellpaket aus, das Sie abonniert haben.
-
Wählen Sie Modell erstellen aus.
-
Geben Sie für Model name (Modellname) einen Namen für das Modell ein.
-
Wählen Sie für IAM-Rolle eine IAM-Rolle aus, die über die erforderlichen Berechtigungen zum Aufrufen anderer Services in Ihrem Namen verfügt. Sie können auch Neue Rolle erstellen auswählen, damit SageMaker AI eine Rolle erstellen kann, der die verwaltete Richtlinie
AmazonSageMakerFullAccessangefügt ist. Weitere Informationen finden Sie unter Wie verwendet man SageMaker AI-Ausführungsrollen. -
Wählen Sie für VPC eine Amazon VPC aus, auf die das Modell zugreifen kann. Weitere Informationen finden Sie unter Geben Sie SageMaker KI-gehosteten Endpunkten Zugriff auf Ressourcen in Ihrer Amazon VPC.
-
Übernehmen Sie die Standardwerte für Container input options (Container-Eingabeoptionen) und Choose model package (Modellpaket auswählen).
-
Geben Sie für Umgebungsvariablen die Namen und Werte der Umgebungsvariablen an, die Sie an den Modellcontainer übergeben möchten.
-
Geben Sie für Tags ein oder mehrere Tags an, um das Modell zu verwalten. Jedes Tag besteht aus einem Schlüssel und einem optionalen Wert. Tag-Schlüssel müssen in einer Ressource eindeutig sein.
-
Wählen Sie Modell erstellen aus.
Nach dem Erstellen eines bereitstellbaren Modells können Sie es verwenden, um einen Endpunkt für die Echtzeit-Inferenz einzurichten oder einen Stapelumwandlungsauftrag zum Abrufen von Inferenzen für ganze Datensätze zu erstellen. Informationen zum Hosten von Endpunkten in SageMaker AI finden Sie unter Modelle für Inferenz bereitstellen.
Verwenden eines Modellpakets zum Erstellen eines Modells (API)
Um ein Modellpaket zum Erstellen eines bereitstellbaren Modells über die SageMaker-API zu verwenden, geben Sie entweder den Namen oder den Amazon-Ressourcennamen (ARN) des Modellpakets als ModelPackageName-Feld des ContainerDefinition-Objekts an, das Sie an die CreateModel-API übergeben.
Nach dem Erstellen eines bereitstellbaren Modells können Sie es verwenden, um einen Endpunkt für die Echtzeit-Inferenz einzurichten oder einen Stapelumwandlungsauftrag zum Abrufen von Inferenzen für ganze Datensätze zu erstellen. Informationen zu gehosteten Endpunkten in SageMaker AI finden Sie unter Modelle für Inferenz bereitstellen.
Verwenden eines Modellpakets zum Erstellen eines Modells (Amazon SageMaker Python SDK )
Um ein Modellpaket zum Erstellen eines bereitstellbaren Modells mithilfe des SageMaker AI Python SDK zu verwenden, initialisieren Sie ein ModelPackage-Objekt und übergeben Sie den Amazon-Ressourcennamen (ARN) des Modellpakets als model_package_arn Argument. Zum Beispiel:
from sagemaker import ModelPackage model = ModelPackage(role='SageMakerRole', model_package_arn='training-job-scikit-decision-trees-1542660466-6f92', sagemaker_session=sagemaker_session)
Nach dem Erstellen eines bereitstellbaren Modells können Sie es verwenden, um einen Endpunkt für die Echtzeit-Inferenz einzurichten oder einen Stapelumwandlungsauftrag zum Abrufen von Inferenzen für ganze Datensätze zu erstellen. Informationen zum Hosten von Endpunkten in SageMaker AI finden Sie unter Modelle für Inferenz bereitstellen.