Parameter für integrierte Algorithmen - Amazon SageMaker AI

Parameter für integrierte Algorithmen

In der folgenden Tabelle sind Parameter für jeden der von Amazon SageMaker AI bereitgestellten Algorithmen aufgelistet.

Name des Algorithmus Kanalname Trainingseingabemodus Dateityp Instance-Klasse Parallelisierbar
AutoGluon – Tabular "train" und (optional) "validation" Datei CSV CPU oder GPU (nur einzelne Instance) Nein
BlazingText "train" Datei oder Pipe Textdatei (ein Satz pro Zeile mit durch Leerzeichen getrennten Token) CPU oder GPU (nur einzelne Instance) Nein
Cat Boost "train" und (optional) "validation" Datei CSV CPU (nur einzelne Instance) Nein
DeepAR-Prognosen "train" und (optional) "test" Datei JSON-Lines oder Parquet CPU oder GPU Ja
Factorization Machines "train" und (optional) "test" Datei oder Pipe recordIO-protobuf CPU (GPU für Daten mit hoher Dichte) Ja
Bildklassifizierung – MXNet "train" und "validation", (optional) "train_lst", "validation_lst" und "model" Datei oder Pipe recordIO oder Bilddateien (JPEG oder PNG) GPU Ja
Bildklassifizierung – TensorFlow Training und Validierung Datei Bilddateien (.jpg, .jpeg oder .png) CPU oder GPU Ja (nur für mehrere GPUs auf einer einzelnen Instance)
IP Insights "train" und (optional) "validation" Datei CSV CPU oder GPU Ja
K-Means "train" und (optional) "test" Datei oder Pipe recordIO-protobuf oder CSV CPU- oder GPUCommon (einzelnes GPU-Gerät auf einer oder mehreren Instances) Nein
K-Nearest-Neighbors (k-NN) "train" und (optional) "test" Datei oder Pipe recordIO-protobuf oder CSV CPU- oder GPU (einzelnes GPU-Gerät auf einer oder mehreren Instances) Ja
LDA "train" und (optional) "test" Datei oder Pipe recordIO-protobuf oder CSV CPU (nur einzelne Instance) Nein
LightGBM "train/training" und (optional) "validation" Datei CSV CPU Ja
Lineares Lernen "train" und (optional) "validation", "test" oder beides Datei oder Pipe recordIO-protobuf oder CSV CPU oder GPU Ja
Neural Topic Modeling "train" und (optional) "validation", "test" oder beides Datei oder Pipe recordIO-protobuf oder CSV CPU oder GPU Ja
Object2Vec "train" und (optional) "validation", "test" oder beides Datei JSON-Lines CPU oder GPU (nur einzelne Instance) Nein
Objekterkennung – MXNet "train" und "validation", (optional) "train_annotation", "validation_annotation" und "model" Datei oder Pipe recordIO oder Bilddateien (JPEG oder PNG) GPU Ja
Objekterkennung – TensorFlow Training und Validierung Datei Bilddateien (.jpg, .jpeg oder .png) GPU Ja (nur für mehrere GPUs auf einer einzelnen Instance)
PCA "train" und (optional) "test" Datei oder Pipe recordIO-protobuf oder CSV CPU oder GPU Ja
Random Cut Forest "train" und (optional) "test" Datei oder Pipe recordIO-protobuf oder CSV CPU Ja
Semantische Segmentierung "train" und "validation", "train_annotation", "validation_annotation" und (optional) "label_map" und "model" Datei oder Pipe Abbildungsdateien GPU (nur einzelne Instance) Nein
Seq2Seq Modeling "train", "validation" und "vocab" Datei recordIO-protobuf GPU (nur einzelne Instance) Nein
TabTransformer "train" und (optional) "validation" Datei CSV CPU oder GPU (nur einzelne Instance) Nein
Textklassifizierung – TensorFlow Training und Validierung Datei CSV CPU oder GPU Ja (nur für mehrere GPUs auf einer einzelnen Instance)
XGBoost (0,90-1, 0,90-2, 1,0-1, 1,2-1, 1,2-21) "train" und (optional) "validation" Datei oder Pipe CSV, LibSVM oder Parquet CPU (oder GPU für 1.2-1) Ja

Algorithmen, die parallelisierbar sind, lassen sich für verteilte Trainings auf mehreren Datenverarbeitungs-Instances bereitstellen.

Die folgenden Themen enthalten Informationen zu Datenformaten, empfohlenen Amazon-EC2-Instance-Typen und CloudWatch-Protokollen, die allen von Amazon SageMaker AI bereitgestellten integrierten Algorithmen gemeinsam sind.

Anmerkung

Informationen zum Nachschlagen der Docker-Image-URIs der integrierten von SageMaker AI verwalteten Algorithmen, finden Sie unter Docker-Registry-Pfade und Beispielcode.