Monitoraggio delle risorse AWS in Amazon SageMaker AI - Amazon SageMaker AI

Monitoraggio delle risorse AWS in Amazon SageMaker AI

Il monitoraggio è importante per mantenere l’affidabilità, la disponibilità e le prestazioni di SageMaker AI e delle altre soluzioni AWS. AWS fornisce i seguenti strumenti di monitoraggio per controllare SageMaker AI, segnalare eventuali problemi ed eseguire azioni automatiche quando appropriato:

  • Amazon CloudWatch monitora le risorse AWS e le applicazioni che esegui su AWS in tempo reale. Puoi raccogliere i parametri e tenerne traccia, creare pannelli di controllo personalizzati e impostare allarmi per inviare una notifica o intraprendere azioni quando un parametro specificato raggiunge una determinata soglia. Ad esempio, puoi impostare CloudWatch perché tenga traccia dell'uso della CPU o di altri parametri delle tue istanze Amazon EC2 e avviare automaticamente nuove istanze quando necessario. Per ulteriori informazioni, consultare la Guida per l'utente di Amazon CloudWatch.

  • Amazon CloudWatch Logs consente di monitorare, archiviare e accedere ai file di log dalle istanze EC2, AWS CloudTrail e da altre origini. CloudWatch Logs è in grado di monitorare le informazioni nei file di log e notificare quando vengono raggiunte determinate soglie. Puoi inoltre archiviare i dati del log in storage estremamente durevole. Per ulteriori informazioni, consulta la Guida per l'utente di Amazon CloudWatch Logs.

  • AWS CloudTrail acquisisce le chiamate API e gli eventi correlati effettuati da o per conto del tuo account AWS e fornisce i file di log a un bucket Amazon S3 specificato. Puoi identificare quali utenti e account hanno richiamato AWS, l'indirizzo IP di origine da cui sono state effettuate le chiamate e quando sono avvenute. Per ulteriori informazioni, consultare la Guida per l'utente AWS CloudTrail.

  • Eventi CloudWatch eroga un flusso quasi in tempo reale di eventi di sistema che descrivono le modifiche alle risorse AWS. Crea regole CloudWatch Events per reagire a una modifica dello stato in un job di addestramento o in un processo di ottimizzazione degli iperparametri o di trasformazione in batch di SageMaker AI.