Peaufinage d’un modèle dans Studio - Amazon SageMaker AI

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Peaufinage d’un modèle dans Studio

Le peaufinage entraîne un modèle pré-entraîné sur un nouveau jeu de données sans partir de zéro. Ce processus, également connu sous le nom d’apprentissage par transfert, peut produire des modèles précis avec des jeux de données plus petits et moins de temps d’entraînement. Pour affiner les modèles de JumpStart base, accédez à une fiche détaillée du modèle dans l'interface utilisateur de Studio. Pour plus d'informations sur l'ouverture JumpStart dans Studio, consultezOuvrir et utiliser JumpStart dans Studio. Après avoir accédé à la carte détaillée du modèle de votre choix, choisissez Entraîner dans le coin supérieur droit. Notez que tous les modèles ne sont pas disponibles pour le peaufinage.

Important

Certains modèles de fondation nécessitent l’acceptation explicite d’un contrat de licence d’utilisateur final (CLUF) avant le peaufinage. Pour de plus amples informations, veuillez consulter Acceptation du CLUF dans Amazon Studio SageMaker .

Paramètres du modèle

Lorsque vous utilisez un modèle de JumpStart base préformé dans Amazon SageMaker Studio, l'emplacement de l'artefact du modèle (URI Amazon S3) est renseigné par défaut. Pour modifier l’URI Amazon S3 par défaut, choisissez Saisir l’emplacement d’un artefact de modèle. Tous les modèles ne prennent pas en charge la modification de l’emplacement d’un artefact de modèle.

Paramètres des données

Dans le champ Données, indiquez un point d’URI Amazon S3 vers l’emplacement de votre jeu de données d’entraînement. L’URI Amazon S3 par défaut pointe vers un exemple de jeu de données d’entraînement. Pour modifier l’URI Amazon S3 par défaut, choisissez Entrer le jeu de données d’entraînement et modifiez l’URI. N'oubliez pas de consulter la fiche détaillée du modèle dans Amazon SageMaker Studio pour obtenir des informations sur le formatage des données d'entraînement.

Hyperparamètres

Vous pouvez personnaliser les hyperparamètres de la tâche d'entraînement utilisés pour affiner le modèle. Les hyperparamètres disponibles pour chaque modèle réglable varient en fonction du modèle.

Les hyperparamètres suivants sont courants parmi les modèles :

  • Epochs (Époques) – Une époque est un cycle dans l'ensemble du jeu de données. Plusieurs intervalles complètent un lot, et plusieurs lots finissent par compléter une époque. Plusieurs époques sont exécutées jusqu'à ce que la précision du modèle atteigne un niveau acceptable ou lorsque le taux d'erreur descend en dessous d'un niveau acceptable.

  • Learning rate (Taux d'apprentissage) – Quantité de modifications que doivent subir les valeurs d'une époque à l'autre. Au fur et à mesure que le modèle est affiné, ses pondérations internes sont modifiées et les taux d'erreur sont vérifiés pour voir si le modèle s'améliore. Un taux d'apprentissage typique est de 0,1 ou 0,01, où 0,01 est un ajustement beaucoup plus petit et peut faire en sorte que l'entraînement prenne beaucoup de temps pour converger, alors que 0,1 est beaucoup plus grand et peut faire en sorte que l'entraînement dépasse les limites. Il s'agit de l'un des principaux hyperparamètres que vous pouvez ajuster pour l'entraînement de votre modèle. Notez que pour les modèles de texte, un taux d'apprentissage beaucoup plus faible (5e-5 pour BERT) peut donner lieu à un modèle plus précis.

  • Taille du lot : nombre d'enregistrements de l'ensemble de données à sélectionner pour chaque intervalle à envoyer à des GPUs fins d'entraînement.

Consultez les invites d’info-bulles et les informations supplémentaires figurant sur la carte détaillée du modèle dans l’interface utilisateur Studio pour en savoir plus sur les hyperparamètres spécifiques au modèle de votre choix.

Pour plus d’informations sur les hyperparamètres disponibles, consultez Hyperparamètres de peaufinage couramment pris en charge.

Déploiement

Spécifiez le type d’instance d’entraînement et l’emplacement de l’artefact de sortie pour votre tâche d’entraînement. Dans le cadre d’un peaufinage dans l’interface utilisateur Studio, vous ne pouvez choisir que des instances compatibles avec le modèle de votre choix. L'emplacement de l'artefact de sortie par défaut est le bucket par défaut de l' SageMaker IA. Pour modifier l’emplacement de l’artefact de sortie, choisissez Entrer l’emplacement de l’artefact de sortie, puis modifiez l’URI Amazon S3.

Sécurité

Spécifiez les paramètres de sécurité à utiliser pour votre tâche de formation, notamment le rôle IAM que l' SageMaker IA utilise pour former votre modèle, si votre formation doit se connecter à un cloud privé virtuel (VPC) et les clés de chiffrement pour sécuriser vos données.

Informations supplémentaires

Vous pouvez modifier le nom de la tâche d’entraînement dans le champ Informations supplémentaires. Vous pouvez également ajouter et supprimer des balises sous la forme de paires clé-valeur pour organiser et classer vos tâches d’entraînement de peaufinage.

Après avoir fourni des informations pour votre configuration de peaufinage, choisissez Soumettre. Si le modèle de fondation pré-entraîné que vous avez choisi d’optimiser nécessite l’acceptation explicite d’un contrat de licence d’utilisateur final (CLUF) avant l’entraînement, celui-ci est fourni dans une fenêtre contextuelle. Pour accepter les termes du CLUF, choisissez Accepter. Il vous incombe de vérifier et de respecter les contrats de licence applicables et de vous assurer qu'ils sont acceptables pour votre cas d'utilisation avant de télécharger ou d'utiliser un modèle.