Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Amazon SageMaker Inference Recommender
Amazon SageMaker Inference Recommender ist eine Funktion von Amazon SageMaker AI. Sie reduziert den Zeitaufwand für die Produktion von Machine Learning (ML)-Modellen, indem Lasttests und die Modelloptimierung für alle ML-Instances von SageMaker AI automatisiert werden. Sie können Inference Recommender verwenden, um Ihr Modell auf einem Endpoint- oder serverlosen Inferenzendpunkt bereitzustellen, der die beste Leistung zu den niedrigsten Kosten bietet. Inference Recommender hilft Ihnen bei der Auswahl des besten Instance-Typs und der besten Konfiguration für Ihre ML-Modelle und Workloads. Dabei werden Faktoren wie die Anzahl der Instances, Containerparameter, Modelloptimierungen, maximale Parallelität und Speichergröße berücksichtigt.
Amazon SageMaker Inference Recommender berechnet Ihnen nur die Instances, die Sie während der Ausführung Ihrer Jobs verwenden.
Funktionsweise
Um Amazon SageMaker Inference Recommender zu verwenden, können Sie entweder ein SageMaker-AI-Modell erstellen oder ein Modell mit Ihren Modellartefakten in der SageMaker Model Registry registrieren. Verwenden Sie das AWS SDK für Python (Boto3) oder die SageMaker-AI-Konsole, um Benchmarking-Jobs für verschiedene SageMaker-AI-Endpunktkonfigurationen auszuführen. Inference Recommender-Jobs helfen Ihnen dabei, Kennzahlen zu Leistung und Ressourcennutzung zu sammeln und zu visualisieren, damit Sie entscheiden können, welchen Endpunkttyp und welche Konfiguration Sie wählen sollten.
Erste Schritte
Wenn Sie Amazon SageMaker Inference Recommender zum ersten Mal verwenden, empfehlen wir Ihnen, wie folgt vorzugehen:
-
Lesen Sie sich den Voraussetzungen für die Verwendung von Amazon SageMaker Inference Recommender Abschnitt durch, um sicherzustellen, dass Sie die Voraussetzungen für die Verwendung von Amazon SageMaker Inference Recommender erfüllen.
-
Lesen Sie sich den Empfehlungsaufträge mit Amazon SageMaker Inference Recommender Abschnitt durch, um Ihre ersten Inference Recommender-Empfehlungsjobs zu starten.
-
Sehen Sie sich das einführende Beispiel für das Amazon SageMaker Inference Recommender Jupyter Notebook
an, oder sehen Sie sich die Beispiel-Notebooks im folgenden Abschnitt an.
Beispiel-Notebooks
Die folgenden Beispiel-Jupyter-Notebooks können Ihnen bei den Workflows für mehrere Anwendungsfälle in Inference Recommender helfen:
-
Wenn Sie ein Einführungs-Notebook suchen, das ein TensorFlow-Modell bewertet, schauen Sie sich das TensorFlow-Notebook von SageMaker Inference Recommender
an. -
Wenn Sie ein HuggingFace-Modell vergleichen möchten, lesen Sie den SageMaker Inference Recommender für HuggingFace
-Notebooks. -
Wenn Sie ein XGBoost-Modell vergleichen möchten, schauen Sie sich das SageMaker Inference Recommender XGBoost-Notebook
an. -
Wenn Sie die CloudWatch-Metriken für Ihre Inference Recommender-Jobs überprüfen möchten, lesen Sie das Notebook SageMaker Inference Recommender CloudWatch-Metriken
.