Allarmi e log per il monitoraggio delle metriche da endpoint serverless

Per monitorare il tuo endpoint serverless, puoi utilizzare Amazon CloudWatch alarms. CloudWatch è un servizio che raccoglie metriche in tempo reale dalle tue applicazioni e risorse. AWS Un allarme controlla i parametri man mano che vengono raccolti e ti dà la possibilità di specificare in anticipo una soglia e le azioni da intraprendere in caso di superamento di tale soglia. Ad esempio, l' CloudWatch allarme può inviare una notifica se l'endpoint supera una soglia di errore. Configurando gli CloudWatch allarmi, ottieni visibilità sulle prestazioni e sulla funzionalità del tuo endpoint. Per ulteriori informazioni sugli CloudWatch allarmi, consulta Using Amazon CloudWatch alarms nella Amazon CloudWatch User Guide.

Monitoraggio con CloudWatch

I parametri riportati di seguito sono un elenco esaustivo di parametri per gli endpoint serverless. Qualsiasi parametro non elencato di seguito non viene pubblicato per gli endpoint serverless. Per informazioni sui seguenti parametri, consulta Monitorare Amazon SageMaker AI con Amazon CloudWatch.

Parametri degli endpoint comuni

Queste CloudWatch metriche sono le stesse pubblicate per gli endpoint in tempo reale.

La OverheadLatency metrica tiene traccia di tutta la latenza aggiuntiva aggiunta dall' SageMaker IA, inclusa l'ora di avvio a freddo per il lancio di nuove risorse di elaborazione per gli endpoint serverless. Rispetto agli endpoint serverless on-demand, OverheadLatency per gli endpoint serverless con provisioning di simultaneità sono generalmente significativamente inferiori.

Gli endpoint serverless possono anche utilizzare i parametri Invocations4XXErrors, Invocations5XXErrors, Invocations, ModelLatency, ModelSetupTime e MemoryUtilization. Per ulteriori informazioni su questi parametri, consulta SageMaker Metriche di invocazione degli endpoint AI.

Parametri comuni degli endpoint serverless

Queste CloudWatch metriche sono pubblicate sia per gli endpoint serverless on-demand che per gli endpoint serverless con Provisioned Concurrency.

Nome parametro Description Unit/Stats

Nome parametro	Description	Unit/Stats
`ServerlessConcurrentExecutionsUtilization`	Il numero di esecuzioni simultanee diviso per il numero massimo di simultaneità.	Unità: nessuna Statistiche valide: medio, massimo, minimo

ServerlessConcurrentExecutionsUtilization

Il numero di esecuzioni simultanee diviso per il numero massimo di simultaneità.

Unità: nessuna

Statistiche valide: medio, massimo, minimo

Endpoint serverless con parametri di provisioning di simultaneità

Queste CloudWatch metriche sono pubblicate per gli endpoint serverless con Provisioned Concurrency.

Nome parametro	Description	Unit/Stats
`ServerlessProvisionedConcurrencyExecutions`	Il numero di esecuzioni simultanee gestite dall'endpoint.	Unità: numero Statistiche valide: medio, massimo, minimo
`ServerlessProvisionedConcurrencyUtilization`	Il numero di esecuzioni simultanee diviso per il numero di simultaneità allocato.	Unità: nessuna Statistiche valide: medio, massimo, minimo
`ServerlessProvisionedConcurrencyInvocations`	Il numero di richieste `InvokeEndpoint` gestite dal provisioning di simultaneità.	Unità: numero Statistiche valide: medio, massimo, minimo
`ServerlessProvisionedConcurrencySpilloverInvocations`	Il numero di richieste `InvokeEndpoint` non gestite dal provisioning di simultaneità, ovvero gestite da Inferenza Serverless on-demand.	Unità: numero Statistiche valide: medio, massimo, minimo

Log

Se desideri monitorare i log dal tuo endpoint per il debug o l'analisi dei progressi, puoi utilizzare Amazon Logs. CloudWatch Il gruppo di SageMaker AI-provided log che puoi usare per gli endpoint serverless è. /aws/sagemaker/Endpoints/[EndpointName] Per ulteriori informazioni sull'utilizzo dei CloudWatch log in SageMaker AI, consulta. CloudWatch Registri per Amazon SageMaker AI Per ulteriori informazioni sui CloudWatch log, consulta What is Amazon CloudWatch Logs? nella Amazon CloudWatch Logs User Guide.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Eliminazione di un endpoint serverless

Dimensionamento automatico del provisioning simultaneo per un endpoint serverless