LightGBM - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

LightGBM

LightGBM est une implémentation open source populaire et efficace de l'algorithme d'arbre de décision avec renforcement de gradient (algorithme GBDT). L'algorithme GBDT est un algorithme d'apprentissage supervisé qui tente de prédire avec précision une variable cible en combinant un ensemble d'estimations à partir d'un jeu de modèles plus simples et plus faibles. LightGBM utilise des techniques supplémentaires pour améliorer considérablement l'efficacité et la capacité de mise à l’échelle de l'algorithme GBDT conventionnel. Cette page contient des informations sur les recommandations relatives aux instances Amazon EC2 et des exemples de blocs-notes pour LightGBM.

Recommandation d'instances Amazon EC2 pour l'algorithme LightGBM

LightGBM SageMaker AI prend actuellement en charge l’entraînement de processeur à une ou plusieurs instances. Pour l'entraînement de processeur à plusieurs instances (entraînement distribué), spécifiez une valeur instance_count supérieure à 1 lorsque vous définissez votre estimateur. Pour plus d’informations sur l’entraînement distribué avec LightGBM, consultez Amazon SageMaker AI LightGBM Distributed training using Dask.

LightGBM est un algorithme dépendant de la mémoire (par opposition à un algorithme dépendant du calcul). Par conséquent, une instance de calcul à usage général (par exemple, M5) constitue un meilleur choix qu'une instance optimisée pour le calcul (par exemple, C5). De plus, nous vous recommandons d'avoir suffisamment de mémoire totale dans les instances sélectionnées pour contenir les données d'entraînement.

Exemples de blocs-notes LightGBM

Le tableau suivant présente divers exemples de blocs-notes traitant de différents cas d’utilisation de l’algorithme LightGBM dans Amazon SageMaker AI.

Titre du bloc-notes Description

Tabular classification with Amazon SageMaker AI LightGBM and CatBoost algorithm

Ce bloc-notes illustre l’utilisation de l’algorithme LightGBM dans Amazon SageMaker AI pour entraîner et héberger un modèle de classification tabulaire.

Tabular regression with Amazon SageMaker AI LightGBM and CatBoost algorithm

Ce bloc-notes illustre l’utilisation de l’algorithme LightGBM dans Amazon SageMaker AI pour entraîner et héberger un modèle de régression tabulaire.

Amazon SageMaker AI LightGBM Distributed training using Dask

Ce bloc-notes illustre un entraînement distribué avec l’algorithme LightGBM Amazon SageMaker AI utilisant le cadre Dask.

Pour obtenir des instructions expliquant comment créer des instances de blocs-notes Jupyter et y accéder afin d’exécuter l’exemple dans SageMaker AI, consultez Instances de SageMaker blocs-notes Amazon. Après avoir créé et ouvert une instance de bloc-notes, cliquez sur l’onglet Exemples SageMaker AI pour afficher la liste de tous les exemples SageMaker AI. Pour ouvrir un bloc-notes, choisissez son onglet Use (Utiliser), puis Create copy (Créer une copie).