Unbeaufsichtigte integrierte SageMaker-AI-Algorithmen
Amazon SageMaker AI bietet mehrere integrierte Algorithmen, die für eine Vielzahl von unüberwachte Lernaufgaben wie Clustering, Dimensionsreduzierung, Mustererkennung und Anomalie-Erkennung verwendet werden können.
-
IP Insights–lernt die Nutzungsmuster für IPv4-Adressen kennen. Er wurde entwickelt, um Zuordnungen zwischen IPv4-Adressen und verschiedenen Entitys, wie beispielsweise Benutzer-IDs oder Kontonummern, zu erfassen.
-
k-Means-Algorithmus–versucht, diskrete Gruppierungen innerhalb von Daten zu finden, wobei Mitglieder einer Gruppe sich so ähnlich wie möglich sein sollen und sich so stark wie möglich von Mitgliedern anderer Gruppen unterscheiden sollen.
-
Algorithmus für die Hauptkomponentenanalyse (Principal Component Analysis, PCA)–reduziert die Dimensionalität (Anzahl der Features) innerhalb eines Datensatzes, indem Datenpunkte auf die ersten Hauptkomponenten projiziert werden. Ziel ist es, so viele Informationen oder Variationen wie möglich beizubehalten. Für Mathematiker sind die Hauptkomponenten Eigenvektoren der Kovarianzmatrix der Daten.
-
Random Cut Forest (RCF)-Algorithmus–erkennt anomale Datenpunkte innerhalb eines Datensatzes, die von ansonsten gut strukturierten oder gemusterten Daten abweichen.
| Name des Algorithmus | Kanalname | Trainingseingabemodus | Dateityp | Instance-Klasse | Parallelisierbar |
|---|---|---|---|---|---|
| IP Insights | "train" und (optional) "validation" | Datei | CSV | CPU oder GPU | Ja |
| K-Means | "train" und (optional) "test" | Datei oder Pipe | recordIO-protobuf oder CSV | CPU- oder GPUCommon (einzelnes GPU-Gerät auf einer oder mehreren Instances) | Nein |
| PCA | "train" und (optional) "test" | Datei oder Pipe | recordIO-protobuf oder CSV | GPU oder CPU | Ja |
| Random Cut Forest | "train" und (optional) "test" | Datei oder Pipe | recordIO-protobuf oder CSV | CPU | Ja |