Cloud_Instances

Amazon SageMaker Neo bietet Kompilierungsunterstützung für beliebte Frameworks für maschinelles Lernen wie TensorFlow PyTorch,, MXNet und mehr. Sie können Ihr kompiliertes Modell auf Cloud-Instanzen und AWS Inferentia-Instanzen bereitstellen. Eine Liste der unterstützten Frameworks und Instance-Typen finden Sie unter Unterstützte Instance-Typen und Frameworks.

Sie können Ihr Modell auf drei Arten kompilieren: über die AWS CLI, die SageMaker KI-Konsole oder das SageMaker AI-SDK für Python. Weitere Informationen finden Sie unter Verwenden von Neo zum Kompilieren eines Modells. Nach der Kompilierung werden Ihre Modellartefakte in der Amazon-S3-Bucket-URI gespeichert, die Sie während des Kompilierungsjobs angegeben haben. Sie können Ihr kompiliertes Modell mithilfe des SageMaker AI SDK für Python,, oder der Konsole auf Cloud-Instanzen und AWS AWS SDK für Python (Boto3) AWS CLI Inferentia-Instanzen bereitstellen. AWS

Wenn Sie Ihr Modell mithilfe AWS CLI der Konsole oder Boto3 bereitstellen, müssen Sie einen Amazon ECR-URI für das Docker-Image für Ihren primären Container auswählen. Eine Liste der Amazon ECR-URIs finden Sie unter Neo Inference Container Images.

Themen

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Kompilieren von Modellen: SDK

Unterstützte Instance-Typen und Frameworks