Real-time inferenza

Real-time l'inferenza è ideale per carichi di lavoro di inferenza in cui sono previsti requisiti in tempo reale, interattivi e a bassa latenza. Puoi implementare il tuo modello su servizi di hosting SageMaker AI e ottenere un endpoint che può essere utilizzato per l'inferenza. Questi endpoint sono completamente gestiti e supportano il dimensionamento automatico (vedi Ridimensionamento automatico dei modelli di SageMaker intelligenza artificiale di Amazon). Puoi monitorare singole istanze e contenitori sui tuoi endpoint con metriche avanzate (vedi). Parametri avanzati di Amazon SageMaker AI per gli endpoint di inferenza

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Risolvi gli errori del suggeritore di inferenza

Implementare modelli