LightGBM - Amazon SageMaker AI

LightGBM

LightGBM ist eine beliebte und effiziente Open-Source-Implementierung eines Baumalgorithmus mit Gradient Boosting. GBDT ist ein überwachter Lernalgorithmus, der versucht, eine Zielvariable genau vorherzusagen, indem Schätzungen aus einer Menge einfacherer und schwächerer Modelle kombiniert werden. LightGBM verwendet zusätzliche Techniken, um die Effizienz und Skalierbarkeit herkömmlicher GBDT erheblich zu verbessern. Diese Seite enthält Informationen zu Empfehlungen für Amazon-EC2-Instances und Beispiel-Notebooks für LightGBM.

Amazon-EC2-Instance-Empfehlung für den LightGBM-Algorithmus

SageMaker AI LightGBM unterstützt derzeit CPU-Training für Einzel-Instances und mehrere Instances. Geben Sie für CPU-Training mit mehreren Instances (verteiltes Training) einen instance_count größer als 1 an, wenn Sie Ihren Schätzer definieren. Weitere Informationen zu verteiltem Training mit LightGBM finden Sie unter Verteiltes Training mit Dask in Amazon SageMaker AI LightGBM.

LightGBM ist ein speichergebundenes Algorithmus (im Gegensatz zu einem rechnergebundenen). Daher ist eine Allzweck-Datenverarbeitungs-Instance (z. B. M5) die bessere Wahl gegenüber einer rechneroptimierten Instance (z. B. C5). Des Weiteren empfehlen wir, dass Sie in ausgewählten Instances genügend Gesamtspeicher zur Verfügung haben, um das Trainingsdaten aufzunehmen.

LightGBM-Beispiel-Notebooks

In der folgenden Tabelle sind verschiedene Beispiel-Notebooks aufgeführt, die sich mit verschiedenen Anwendungsfällen des LightGBM-Algorithmus von Amazon SageMaker AI befassen.

Titel des Notebooks Beschreibung

Tabellarische Klassifizierung mit dem LightGBM- und CatBoost-Algorithmus von Amazon SageMaker AI

Dieses Notebook demonstriert die Verwendung des LightGBM-Algorithmus von Amazon SageMaker AI zum Trainieren und Hosten eines tabellarischen Klassifikationsmodells.

Tabellarische Regression mit dem LightGBM- und CatBoost-Algorithmus von Amazon SageMaker AI

Dieses Notebook demonstriert die Verwendung des LightGBM-Algorithmus von Amazon SageMaker AI zum Trainieren und Hosten eines tabellarischen Regressionsmodells.

Verteiltes Training mit Dask in Amazon SageMaker AI LightGBM

Dieses Notebook demonstriert verteiltes Training mit dem LightGBM-Algorithmus von Amazon SageMaker AI unter Verwendung des Dask-Frameworks.

Anweisungen zum Erstellen von und Zugreifen auf Jupyter-Notebook-Instances, die Sie zum Ausführen des Beispiels in SageMaker AI verwenden können, finden Sie unter Notebook-Instances für Amazon SageMaker. Wenn Sie einer Notebook-Instance erstellt und geöffnet haben, wählen Sie die Registerkarte SageMaker-AI-Beispiele aus, um eine Liste aller SageMaker-AI-Beispiele anzuzeigen. Zum Öffnen eines Notebooks wählen Sie die Registerkarte Verwenden und dann Kopie erstellen aus.