Dimensionamento automatico dei modelli di Amazon SageMaker AI
Amazon SageMaker AI supporta il dimensionamento automatico dei modelli ospitati. Dimensionamento automatico modifica dinamicamente il numero di istanze assegnate a un modello in risposta alle variazioni nel carico di lavoro. Quando il carico di lavoro aumenta, la scalabilità automatica offre più istanze online. Quando il carico di lavoro diminuisce, la scalabilità automatica rimuove le istanze non necessarie in modo da non pagare per le istanze assegnate che non vengono utilizzate.
Argomenti
Configurazione del modello di scalabilità automatica con la console
Controllare lo stato di un’attività di dimensionamento descrivendo le attività di dimensionamento
Test del caricamento della configurazione di scalabilità automatica
Utilizzare CloudFormation per creare una policy di dimensionamento
Aggiornare gli endpoint che utilizzano il dimensionamento automatico
Eliminare gli endpoint configurati per il dimensionamento automatico