View a markdown version of this page

Real-time inferenza - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Real-time inferenza

Real-time l'inferenza è ideale per carichi di lavoro di inferenza in cui sono previsti requisiti in tempo reale, interattivi e a bassa latenza. Puoi implementare il tuo modello su servizi di hosting SageMaker AI e ottenere un endpoint che può essere utilizzato per l'inferenza. Questi endpoint sono completamente gestiti e supportano il dimensionamento automatico (vedi Ridimensionamento automatico dei modelli di SageMaker intelligenza artificiale di Amazon). Puoi monitorare singole istanze e contenitori sui tuoi endpoint con metriche avanzate (vedi). Parametri avanzati di Amazon SageMaker AI per gli endpoint di inferenza