Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Notebook-Tutorials zur Modellbewertung
Dieser Abschnitt enthält die folgenden Notebook-Tutorials, die Beispielcode und Erklärungen enthalten:
-
Wie bewertet man ein JumpStart Modell auf schnelle Stereotypisierung?
-
So bewerten Sie ein Amazon Bedrock-Modell auf die Genauigkeit der Textzusammenfassung.
Themen
Zusätzliche Notebooks
Das GitHub Verzeichnis fmeval
-
bedrock-claude-factual-knowledge.ipnyb
– Evaluiert ein anthropisches Claude 2-Modell, das auf Amazon Bedrock gehostet wird, auf Faktenwissen. -
byo-model-outputs.ipynb
— Wertet ein Falcon 7b-Modell aus, auf dem es JumpStart für Faktenwissen gehostet wird. Dabei bringen Sie Ihre eigenen Modellergebnisse ein, anstatt Inferenzanfragen an Ihr Modell zu senden. -
ChatGPT 3.5custom_model_runner_chat_gpt.ipnyb– Evaluiert ein benutzerdefiniertes Modell, Hugging Faceauf dem Faktenwissen gehostet wird.