Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Bewertung und Vergleich von SageMaker JumpStart Amazon-Textklassifizierungsmodellen
SageMaker KI JumpStart bietet mehrere Textklassifizierungsmodelle, die Text in vordefinierte Klassen einteilen. Diese Modelle übernehmen Aufgaben wie Stimmungsanalyse, Themenklassifizierung und Inhaltsmoderation. Die Auswahl des richtigen Modells für die Produktion erfordert eine sorgfältige Bewertung anhand wichtiger Kennzahlen wie Genauigkeit, F1-Score und Matthews Correlation Coefficient (MCC).
In diesem Leitfaden gehen Sie wie folgt vor:
Stellen Sie mehrere Textklassifizierungsmodelle (DistilBERT und BERT) aus dem Katalog bereit. JumpStart
Führen Sie umfassende Bewertungen von ausgewogenen, verzerrten und schwierigen Datensätzen durch.
Interpretieren Sie erweiterte Kennzahlen wie Matthews Correlation Coefficient (MCC) und Area Under the Curve Receiver Operating Characteristics.
Treffen Sie datengestützte Entscheidungen zur Modellauswahl mithilfe systematischer Vergleichsrahmen.
Richten Sie Produktionsbereitstellungen mit auto-scaling und CloudWatch Überwachung ein.
Laden Sie das vollständige Evaluierungsframework herunter: JumpStart Model Evaluation Package. Das Paket enthält Ergebnisse vor der Ausführung mit Beispielausgaben, sodass Sie sich eine Vorschau des Evaluierungsprozesses und der Kennzahlen ansehen können, bevor Sie die Modelle selbst implementieren.
Voraussetzungen
Stellen Sie vor dem Beginn sicher, dass Sie über Folgendes verfügen:
Grundkenntnisse in Python.
Verständnis von Konzepten der Textklassifizierung.
Zeit und Kosten: 45 Minuten Gesamtzeit. Die Kosten variieren je nach Instance-Typ und Nutzungsdauer. Aktuelle Tarife finden Sie unter SageMaker KI-Preise
Dieses Tutorial enthält Anweisungen zur step-by-step Bereinigung, mit denen Sie alle Ressourcen entfernen und laufende Gebühren vermeiden können.