Input/Output Schnittstelle für den Factorization Machines-Algorithmus EC2-Instance-Empfehlung für den Factorization Machines-Algorithmus Beispiel-Notebooks

Faktorisierungsmaschinen Algorithmus

Eine Factorization Machines ist ein allgemeiner überwachter Lernalgorithmus, der sowohl für Klassifizierungs- als auch Regressionsaufgaben eingesetzt werden kann. Diese Erweiterung eines linearen Modells ist darauf ausgelegt, Interaktionen zwischen Funktionen innerhalb von hochdimensionalen Datensätzen mit geringer Dichte wirtschaftlich zu erfassen. Beispielsweise kann das Factorization Machine-Modell in einem System zur Klickprognose die Klickratenmuster erfassen, die bei der Platzierung von Werbung einer bestimmten Werbekategorie auf Seiten einer bestimmten Seitenkategorie beobachtet werden. Factorization Machines sind bei Aufgaben, die hochdimensionale Datensätze mit geringer Dichte umfassen (z. B. Klickprognosen und Artikelempfehlungen), eine gute Wahl.

Anmerkung

Die Amazon SageMaker AI-Implementierung des Factorization Machines-Algorithmus berücksichtigt nur paarweise Interaktionen (2. Ordnung) zwischen Funktionen.

Themen

Input/Output Schnittstelle für den Factorization Machines-Algorithmus

Der Factorization Machines-Algorithmus lässt sich entweder im binären Klassifizierungs- oder im Regressionsmodus ausführen. In beiden Modi kann neben dem Datensatz für den Trainingskanal auch eines für den Testkanal bereitgestellt werden. Die Bewertung hängt vom verwendeten Modus ab. Im Regressionsmodus wird der Testdatensatz mithilfe von RMSE (Root Mean Square Error, Wurzel des mittleren quadratischen Prognosefehlers) bewertet. Im binären Klassifizierungsmodus wird der Testdatensatz anhand von binärer Kreuzentropie (Protokollverlust), Genauigkeit (Grenzwert = 0,5) und F1-Bewertung (Schwellenwert = 0,5) bewertet.

Für das Training unterstützt der Factorization Machines-Algorithmus derzeit nur das recordIO-protobuf Format mit Float32 Tensoren. Da als Anwendungsfall in erster Linie Daten mit geringer Dichte in Frage kommen, ist CSV keine gute Wahl. Sowohl das Training im Datei- als auch im Pipe-Modus werden für Record IO-wrapped Protobuf unterstützt.

Für die Inferenz unterstützen Factorization Machines die application/json und x-recordio-protobuf Formate.

Für das Problem der binären Klassifizierung sagt der Algorithmus eine Bewertung und eine Bezeichnung voraus. Die Bezeichnung ist eine Zahl und kann entweder 0 oder 1 sein. Die Bewertung ist eine Zahl, die angibt, wie stark der Algorithmus glaubt, dass die Bezeichnung 1 sein sollte. Der Algorithmus berechnet zuerst die Bewertung und leitet aus dem Wert die Bezeichnung ab. Wenn die Punktzahl größer oder gleich 0,5 ist, ist die Bezeichnung 1.
Für das Problem der Regression wird nur eine Punktzahl zurückgegeben. Dies ist dann der vorausgesagte Wert. Beispiel: Wenn Factorization Machines verwendet wird, um eine Filmbewertung vorherzusagen, ist die Punktzahl die vorausgesagte Bewertung.

Weitere Informationen zu Trainings- und Inferenzdateiformaten finden Sie unter Factorization Machines-Beispiel-Notebook.

EC2-Instance-Empfehlung für den Factorization Machines-Algorithmus

Der Amazon SageMaker AI Factorization Machines-Algorithmus ist hochgradig skalierbar und kann über verteilte Instanzen hinweg trainiert werden. Wir empfehlen, für Training und Inferenz CPU-Instances bei Datensätzen mit sowohl geringer als auch hoher Dichte zu verwenden. In einigen Fällen kann sich das Training mit einer oder mehreren GPUs bei Daten mit hoher Dichte als vorteilhaft erweisen. Trainings mit GPUs sind nur für Daten hoher Dichte verfügbar. Verwenden Sie bei Daten mit geringer Dichte CPU-Instances. Der Factorization Machines-Algorithmus unterstützt P2-, P3-, G4dn- und G5-Instances für Training und Inferenz.

Factorization Machines-Beispiel-Notebook

Ein Beispielnotizbuch, das den Algorithmus von SageMaker AI Factorization Machines verwendet, um die Bilder handgeschriebener Ziffern von Null bis Neun im MNIST-Datensatz zu analysieren, finden Sie unter Eine Einführung in Factorization Machines with MNIST. Anweisungen zum Erstellen und Zugreifen auf Jupyter-Notebook-Instanzen, mit denen Sie das Beispiel in KI ausführen können, finden Sie unter. SageMaker SageMaker Amazon-Notebook-Instanzen Nachdem Sie eine Notebook-Instanz erstellt und geöffnet haben, wählen Sie den Tab SageMaker KI-Beispiele aus, um eine Liste aller KI-Beispiele zu sehen. SageMaker Die Beispiel-Notebooks für die Themenmodellierung, die NTM-Algorithmen verwenden, befinden sich im Abschnitt Einführung in Amazon-Algorithmen. Zum Öffnen eines Notebooks klicken Sie auf die Registerkarte Use (Verwenden) und wählen Sie Create copy (Kopie erstellen) aus.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Modell-Abstimmung

So funktioniert’s