E/A-Schnittstelle für den Bildklassifikationsalgorithmus - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

E/A-Schnittstelle für den Bildklassifikationsalgorithmus

Jedes der in TensorFlow Hub Models aufgeführten vortrainierten Modelle kann auf jeden Datensatz, der aus Textsätzen mit einer beliebigen Anzahl von Klassen besteht, fein abgestimmt werden. Das vortrainierte Modell fügt dem Text Embedding-Modell eine Klassifizierungsebene hinzu und initialisiert die Ebenenparameter mit Zufallswerten. Die Ausgabedimension der Klassifikationsschicht wird anhand der Anzahl der in den Eingabedaten erkannten Klassen bestimmt.

Denken Sie daran, wie Sie Ihre Trainingsdaten für die Eingabe in das Textklassifizierung-TensorFlow-Modell formatieren.

  • Eingabeformat für Trainingsdaten: Ein Verzeichnis, das eine data.csv Datei enthält. Jede Zeile der ersten Spalte sollte ganzzahlige Klassenbezeichnungen zwischen 0 und der Anzahl der Klassen haben. Jede Zeile der zweiten Spalte sollte die entsprechenden Textdaten enthalten.

Im Folgenden finden Sie ein Beispiel für eine CSV-Eingabedatei. Beachten Sie, dass die Datei keinen Header haben sollte. Die Datei sollte in einem Amazon-S3-Bucket mit einem Pfad gehostet werden, der dem folge nden ähnelt: s3://bucket_name/input_directory/. Beachten Sie, dass das Trailing / erforderlich ist.

| | | |---|---| |0 |hide new secretions from the parental units| |0 |contains no wit , only labored gags| |1 |that loves its characters and communicates something rather beautiful about human nature| |...|...|

Inkrementelles Training

Sie können das Training eines neuen Modells mit Artefakten aus einem Modell, das Sie zuvor mit SageMaker AI trainiert haben, vornehmen. Dieses inkrementelle Training verkürzt die Trainingsdauer, wenn Sie ein neues Modell mit denselben oder ähnlichen Daten trainieren möchten.

Anmerkung

Sie können ein Modell der Bildklassifizierung – TensorFlow in SageMaker AI nur mit einem anderen Modell der Bildklassifizierung – TensorFlow seeden, das in SageMaker AI trainiert wurde.

Sie können jeden Datensatz für das inkrementelle Training verwenden, solange der Klassensatz derselbe bleibt. Der inkrementelle Trainingsschritt ähnelt dem Feinabstimmungsschritt, aber anstatt mit einem vortrainierten Modell zu beginnen, beginnen Sie mit einem vorhandenen fein abgestimmten Modell.

Weitere Informationen zur Verwendung von inkrementellem Training mit dem Algorithmus Textklassifizierung – TensorFlow von SageMaker AI finden Sie im Beispiel-Notebook Einführung in JumpStart – Textklassifizierung.

Inferenz mit der Textklassifizierung – TensorFlow-Algorithmus

Sie können das fein abgestimmte Modell, das sich aus Ihrem TensorFlow-Textklassifizierungstraining ergibt, zu Inferenzzwecken hosten. Alle Rohtextformate für Inferenzen müssen vom Inhaltstyp sein application/x-text .

Das Ausführen von Inferenzen führt zu Wahrscheinlichkeitswerten, Klassenbezeichnungen für alle Klassen und dem vorhergesagten Label, das dem Klassenindex mit der höchsten Wahrscheinlichkeit entspricht, kodiert im JSON-Format. Das Modell Textklassifizierung – TensorFlow verarbeitet eine einzelne Zeichenfolge pro Anfrage und gibt nur eine Zeile aus. Nachfolgend finden Sie ein Beispiel für eine Antwort im JSON Lines-Format:

accept: application/json;verbose {"probabilities": [prob_0, prob_1, prob_2, ...], "labels": [label_0, label_1, label_2, ...], "predicted_label": predicted_label}

Wenn accept auf application/json gesetzt ist, gibt das Modell nur Wahrscheinlichkeiten aus.