

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Real-time inferenza
<a name="realtime-endpoints"></a>

 Real-time l'inferenza è ideale per carichi di lavoro di inferenza in cui sono previsti requisiti in tempo reale, interattivi e a bassa latenza. Puoi implementare il tuo modello su servizi di hosting SageMaker AI e ottenere un endpoint che può essere utilizzato per l'inferenza. Questi endpoint sono completamente gestiti e supportano il dimensionamento automatico (vedi [Ridimensionamento automatico dei modelli di SageMaker intelligenza artificiale di Amazon](endpoint-auto-scaling.md)). Puoi monitorare singole istanze e contenitori sui tuoi endpoint con metriche avanzate (vedi). [Parametri avanzati di Amazon SageMaker AI per gli endpoint di inferenza](monitoring-cloudwatch-enhanced-metrics.md)

**Topics**
+ [Implementazione di modelli per l’inferenza in tempo reale](realtime-endpoints-deploy-models.md)
+ [Invocare modelli per l’inferenza in tempo reale](realtime-endpoints-test-endpoints.md)
+ [Richiama gli endpoint con le API OpenAI-compatible](realtime-endpoints-openai-compatible.md)
+ [Endpoints](realtime-endpoints-manage.md)
+ [Opzioni di hosting](realtime-endpoints-options.md)
+ [Ridimensionamento automatico dei modelli di SageMaker intelligenza artificiale di Amazon](endpoint-auto-scaling.md)
+ [Volumi di archiviazione delle istanze](host-instance-storage.md)
+ [Convalida dei modelli in produzione](model-validation.md)
+ [Spiegabilità online con Clarify SageMaker](clarify-online-explainability.md)
+ [Esegui la distribuzione su più tipi di istanze con pool di istanze](realtime-endpoints-heterogeneous.md)
+ [Fine-tune modelli con componenti di inferenza dell'adattatore](realtime-endpoints-adapt.md)