LightGBM - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

LightGBM

LightGBM es una implementación de código abierto popular y eficiente del algoritmo Gradient Boosting Decision Tree (GBDT). GBDT es un algoritmo de aprendizaje supervisado que intenta predecir adecuadamente una variable objetivo mediante la combinación de un conjunto de estimaciones a partir de un conjunto de modelos más simples y más débiles. LightGBM utiliza técnicas adicionales para mejorar significativamente la eficiencia y la escalabilidad de la GBDT convencional. Esta página incluye información sobre las recomendaciones de instancias de Amazon EC2 y cuadernos de muestra para LightGBM.

Recomendación de instancias de Amazon EC2 para el algoritmo LightGBM

Actualmente, SageMaker AI LightGBM admite el entrenamiento de CPU en una o varias instancias. Para el entrenamiento de CPU en varias instancias (entrenamiento distribuido), especifique un valor instance_count mayor que 1 cuando defina su estimador. Para obtener más información sobre el entrenamiento distribuido con LightGBM, consulte Amazon SageMaker AI LightGBM Distributed training using Dask.

LightGBM es un algoritmo de vinculación de memoria (a diferencia de la vinculación de computación). Por lo tanto, una instancia de computación de uso general (por ejemplo, M5) es una opción mejor que una instancia optimizada para la computación (por ejemplo, C5). Además, recomendamos que disponga de suficiente memoria en total en las instancias seleccionadas para almacenar los datos de capacitación.

Ejemplos de cuadernos LightGBM

En la siguiente tabla, encontrará algunos cuadernos de muestra con distintos casos de uso del algoritmo LightGBM de Amazon SageMaker AI.

Título del cuaderno Descripción

Tabular classification with Amazon SageMaker AI LightGBM and CatBoost algorithm

Este cuaderno muestra el uso del algoritmo LightGBM de Amazon SageMaker AI para entrenar y alojar un modelo de clasificación tabular.

Tabular regression with Amazon SageMaker AI LightGBM and CatBoost algorithm

Este cuaderno muestra el uso del algoritmo LightGBM de Amazon SageMaker AI para entrenar y alojar un modelo de regresión tabular.

Amazon SageMaker AI LightGBM Distributed training using Dask

Este cuaderno muestra el entrenamiento distribuido con el algoritmo LightGBM de Amazon SageMaker AI mediante el marco Dask.

Para obtener instrucciones sobre cómo crear instancias de cuadernos de Jupyter que pueda utilizar para ejecutar el ejemplo en SageMaker AI (y sobre cómo acceder a estas instancias), consulte Instancias de Amazon SageMaker Notebook. Después de crear y abrir una instancia de cuaderno, seleccione la pestaña Ejemplos de SageMaker AI para ver una lista de todas las muestras de SageMaker AI. Para abrir un cuaderno, elija su pestaña Usar y elija Crear copia.