Modes de débit
Amazon SageMaker Feature Store propose deux modèles de tarification au choix : les modes de débit à la demande (On-demand) et provisionné (Provisioned). On-demand fonctionne mieux pour un trafic moins prévisible, tandis que Provisioned fonctionne mieux pour un trafic constant et prévisible.
Vous avez la possibilité de basculer entre les modes de débit On-demand et Provisioned pour un groupe de caractéristiques donné, afin de vous adapter aux périodes pendant lesquelles les modèles de trafic des applications changent ou sont moins prévisibles. Vous pouvez mettre à jour le mode de débit de votre groupe de caractéristiques sur On-demand une seule fois par période de 24 heures. Le mode de débit peut être mis à jour par programmation à l’aide de l’API UpdateFeatureGroup ou via l’interface utilisateur de la console. Pour plus d’informations sur l’utilisation de la console, consultez Utilisation d’Amazon SageMaker Feature Store dans la console.
Vous pouvez utiliser le mode de débit Provisioned avec des groupes de caractéristiques uniquement hors ligne ou des groupes de caractéristiques avec le type de stockage Standard. Pour les autres configurations de stockage, le mode de débit On-demand est utilisé. Pour en savoir plus sur les configurations de stockage en ligne et hors ligne, consultez Magasin en ligne et Magasin hors ligne, respectivement.
Pour plus d’informations sur la tarification, consultez Tarification d’Amazon SageMaker
Rubriques
Mode de débit à la demande
Le mode débit On-demand (par défaut) fonctionne le mieux lorsque vous utilisez des groupes de caractéristiques avec une charge de travail inconnue, le trafic applicatif imprévisible et que vous ne pouvez pas prévoir les besoins en capacité.
Le mode On-demand vous facture les lectures et les écritures effectuées par votre application sur vos groupes de caractéristiques. Vous n’avez pas besoin de spécifier le débit de lecture et d’écriture que vous attendez de votre application, car Feature Store s’adapte instantanément à vos charges de travail à mesure qu’elles augmentent ou diminuent. Vous ne payez que pour ce que vous utilisez, qui est mesuré en ReadRequestsUnits et WriteRequestsUnits.
Vous pouvez activer le mode de débit On-demand à l’aide des API CreateFeatureGroup ou UpdateFeatureGroup ou via l’interface utilisateur de la console. Pour plus d’informations sur l’utilisation de l’interface utilisateur de la console, consultez Utilisation d’Amazon SageMaker Feature Store dans la console.
Important
Vous pouvez mettre à jour le mode de débit de votre groupe de caractéristiques sur On-demand une seule fois par période de 24 heures.
Mode de débit provisionné
Le mode de débit Provisioned fonctionne le mieux lorsque vous utilisez des groupes de caractéristiques dont les charges de travail sont prévisibles et que vous pouvez prévoir les besoins en capacité pour contrôler les coûts. Cela peut le rendre plus rentable pour certaines charges de travail pour lesquelles vous pouvez anticiper les exigences de débit à l’avance.
Lorsque vous définissez un groupe de caractéristiques en mode Provisioned, vous spécifiez des unités de capacité qui sont la quantité maximale de capacité qu’une application peut consommer à partir d’un groupe de caractéristiques. Si votre application dépasse la capacité de débit Provisioned, elle sera soumise à une limitation des demandes.
Vous trouverez ci-dessous des informations sur les unités de capacité de lecture et d’écriture.
-
L’extraction d’un seul enregistrement d’une taille maximale de 4 Ko à l’aide de l’API
GetRecordconsommera au moins 1 RCU (unité de capacité de lecture). L’extraction de données utiles plus importantes peut en exiger plus. Le nombre total d’unités de capacité de lecture requises dépend de la taille de l’élément, y compris de petites métadonnées par enregistrement ajoutées par le service Feature Store. -
Une seule demande d’écriture avec des données utiles de 1 Ko utilisant l’API
PutRecordconsommera au moins 1 WCU (unité de capacité d’écriture), les données utiles fractionnelles étant arrondies au Ko le plus proche. Il peut en consommer davantage en fonction de l’heure de l’événement, du statut de suppression de l’enregistrement et du statut de durée de vie (TTL). Pour plus d’informations sur TTL, consultez Durée de vie (TTL) pour les enregistrements.
Important
Lorsque vous définissez vos unités de capacité, tenez compte des points suivants :
-
Les capacités de lecture et d’écriture que vous provisionnez pour votre groupe de caractéristiques vous seront facturées, même si vous n’utilisez pas pleinement ces capacités
Provisioned. -
Si vous définissez une capacité de lecture ou d’écriture trop faible, vos demandes peuvent faire l’objet d’une limitation.
-
Dans certains cas, les enregistrements peuvent consommer une unité de capacité supplémentaire en raison des métadonnées au niveau des enregistrements ajoutées par le service Feature Store pour activer diverses caractéristiques.
-
L’extraction d’un sous-ensemble de caractéristiques à l’aide des API
GetRecordouBatchGetRecordconsommera toujours la RCU correspondant à l’enregistrement complet. -
En ce qui concerne la capacité d’écriture, vous devez provisionner deux fois la capacité maximale récente afin d’éviter une limitation lors du remplissage ou une ingestion massive susceptible d’entraîner un grand nombre d’écritures d’enregistrements historiques. Cela est dû au fait que l’écriture d’enregistrements historiques consomme de la capacité d’écriture supplémentaire.
-
Feature Store ne prend actuellement pas en charge l’autoscaling pour le mode
Provisioned.
Vous pouvez activer le mode de débit On-demand à l’aide des API CreateFeatureGroup ou UpdateFeatureGroup ou via l’interface utilisateur de la console. Pour plus d’informations sur l’utilisation de l’interface utilisateur de la console, consultez Utilisation d’Amazon SageMaker Feature Store dans la console.
Ce qui suit décrit comment augmenter ou diminuer le débit de la RCU et de la WCU pour vos groupes de caractéristiques lorsque le mode Provisioned est activé.
Augmentation du débit provisionné
Vous pouvez augmenter la RCU ou la WCU aussi souvent que nécessaire à l’aide de l’API UpdateFeatureGroup ou de l’interface utilisateur de la console.
Diminution du débit alloué
Vous pouvez réduire la RCU et la WCU (ou les deux) pour les groupes de caractéristiques à l’aide de l’API UpdateFeatureGroup ou de l’interface utilisateur de la console.
Il existe un quota par défaut concernant le nombre de diminutions de capacité Provisioned que vous pouvez effectuer chaque jour sur votre groupe de caractéristiques. Une journée est définie conformément à l’heure UTC (Universal Time Coordinated). Un jour donné, vous pouvez commencer par effectuer jusqu’à quatre diminutions en une heure tant que vous n’avez pas encore effectué d’autres diminutions durant cette journée. Par la suite, vous pouvez effectuer une diminution supplémentaire par heure, à condition qu’il n’y ait pas eu de diminution au cours de l’heure précédente. Cela porte effectivement le nombre maximum de réductions par jour à 27 (4 réductions durant la première heure, et 1 réduction pour chacune des 23 fenêtres de 1 heure suivantes).
Métriques du mode de débit
Un groupe de caractéristiques en mode On-demand émettra les métriques ConsumedReadRequestsUnits et ConsumedWriteRequestsUnits. Un groupe de caractéristiques en mode Provisioned émettra les métriques ConsumedReadCapacityUnits et ConsumedWriteCapacityUnits. Pour plus d’informations sur les métriques de Feature Store, consultez Métriques Amazon SageMaker Feature Store.
Limites du mode de débit
Chacun Compte AWS dispose de quotas ou de limites de service par défaut qui sont appliqués pour garantir la disponibilité et gérer les risques liés à la facturation. Pour en savoir plus sur les quotas et les limites par défaut, consultez Quotas, règles de dénomination et types de données.
Dans certains cas, ces limites peuvent être inférieures à celles indiquées dans la documentation. Si vous avez besoin de limites plus élevées, vous pouvez soumettre une demande d’augmentation. Il est judicieux de le faire avant d’atteindre les limites actuelles pour éviter toute interruption de travail. Pour en savoir plus sur les quotas de service et sur la manière de demander une augmentation des quotas, consultez Quotas de service AWS.