Unbeaufsichtigte integrierte SageMaker-AI-Algorithmen - Amazon SageMaker AI

Unbeaufsichtigte integrierte SageMaker-AI-Algorithmen

Amazon SageMaker AI bietet mehrere integrierte Algorithmen, die für eine Vielzahl von unüberwachte Lernaufgaben wie Clustering, Dimensionsreduzierung, Mustererkennung und Anomalie-Erkennung verwendet werden können.

  • IP Insights–lernt die Nutzungsmuster für IPv4-Adressen kennen. Er wurde entwickelt, um Zuordnungen zwischen IPv4-Adressen und verschiedenen Entitys, wie beispielsweise Benutzer-IDs oder Kontonummern, zu erfassen.

  • k-Means-Algorithmus–versucht, diskrete Gruppierungen innerhalb von Daten zu finden, wobei Mitglieder einer Gruppe sich so ähnlich wie möglich sein sollen und sich so stark wie möglich von Mitgliedern anderer Gruppen unterscheiden sollen.

  • Algorithmus für die Hauptkomponentenanalyse (Principal Component Analysis, PCA)–reduziert die Dimensionalität (Anzahl der Features) innerhalb eines Datensatzes, indem Datenpunkte auf die ersten Hauptkomponenten projiziert werden. Ziel ist es, so viele Informationen oder Variationen wie möglich beizubehalten. Für Mathematiker sind die Hauptkomponenten Eigenvektoren der Kovarianzmatrix der Daten.

  • Random Cut Forest (RCF)-Algorithmus–erkennt anomale Datenpunkte innerhalb eines Datensatzes, die von ansonsten gut strukturierten oder gemusterten Daten abweichen.

Name des Algorithmus Kanalname Trainingseingabemodus Dateityp Instance-Klasse Parallelisierbar
IP Insights "train" und (optional) "validation" Datei CSV CPU oder GPU Ja
K-Means "train" und (optional) "test" Datei oder Pipe recordIO-protobuf oder CSV CPU- oder GPUCommon (einzelnes GPU-Gerät auf einer oder mehreren Instances) Nein
PCA "train" und (optional) "test" Datei oder Pipe recordIO-protobuf oder CSV GPU oder CPU Ja
Random Cut Forest "train" und (optional) "test" Datei oder Pipe recordIO-protobuf oder CSV CPU Ja