Monitoraggio delle risorse AWS in Amazon SageMaker AI
Il monitoraggio è importante per mantenere l’affidabilità, la disponibilità e le prestazioni di SageMaker AI e delle altre soluzioni AWS. AWS fornisce i seguenti strumenti di monitoraggio per controllare SageMaker AI, segnalare eventuali problemi ed eseguire azioni automatiche quando appropriato:
-
Amazon CloudWatch monitora le risorse AWS e le applicazioni che esegui su AWS in tempo reale. Puoi raccogliere i parametri e tenerne traccia, creare pannelli di controllo personalizzati e impostare allarmi per inviare una notifica o intraprendere azioni quando un parametro specificato raggiunge una determinata soglia. Ad esempio, puoi impostare CloudWatch perché tenga traccia dell'uso della CPU o di altri parametri delle tue istanze Amazon EC2 e avviare automaticamente nuove istanze quando necessario. Per ulteriori informazioni, consultare la Guida per l'utente di Amazon CloudWatch.
-
Amazon CloudWatch Logs consente di monitorare, archiviare e accedere ai file di log dalle istanze EC2, AWS CloudTrail e da altre origini. CloudWatch Logs è in grado di monitorare le informazioni nei file di log e notificare quando vengono raggiunte determinate soglie. Puoi inoltre archiviare i dati del log in storage estremamente durevole. Per ulteriori informazioni, consulta la Guida per l'utente di Amazon CloudWatch Logs.
-
AWS CloudTrail acquisisce le chiamate API e gli eventi correlati effettuati da o per conto del tuo account AWS e fornisce i file di log a un bucket Amazon S3 specificato. Puoi identificare quali utenti e account hanno richiamato AWS, l'indirizzo IP di origine da cui sono state effettuate le chiamate e quando sono avvenute. Per ulteriori informazioni, consultare la Guida per l'utente AWS CloudTrail.
-
Eventi CloudWatch eroga un flusso quasi in tempo reale di eventi di sistema che descrivono le modifiche alle risorse AWS. Crea regole CloudWatch Events per reagire a una modifica dello stato in un job di addestramento o in un processo di ottimizzazione degli iperparametri o di trasformazione in batch di SageMaker AI.