Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Amazon SageMaker Inference Recommender
Amazon SageMaker Inference Recommender è una funzionalità di Amazon SageMaker AI. Riduce il tempo necessario per mettere in produzione i modelli di machine learning (ML) automatizzando i test di carico e ottimizzando i modelli nelle istanze ML di SageMaker AI. Puoi usare il suggeritore di inferenza per implementare il tuo modello su un endpoint di inferenza in tempo reale o senza server che offre le migliori prestazioni al minor costo. Inference Recommender aiuta a selezionare il tipo di istanza e la configurazione migliori per i tuoi modelli e carichi di lavoro ML. Considera fattori come il conteggio di istanze, i parametri del container, le ottimizzazioni dei modelli, la simultaneità massima e la dimensione della memoria.
Amazon SageMaker Inference Recommender addebita solo le istanze utilizzate durante l'esecuzione dei processi.
Come funziona
Per utilizzare Amazon SageMaker Inference Recommender, puoi creare un modello SageMaker AI o registrare un modello in SageMaker Model Registry con gli artefatti del modello. Utilizza AWS SDK per Python (Boto3) o la console di SageMaker AI per eseguire processi di benchmark per diverse configurazioni di endpoint di SageMaker AI. I processi di suggerimento delle inferenze ti aiutano a raccogliere e visualizzare i parametri relative di tutte le prestazioni e sull'utilizzo delle risorse per aiutarti a decidere quale tipo e configurazione di endpoint scegliere.
Come iniziare
Se utilizzi Amazon SageMaker Inference Recommender per la prima volta, ti consigliamo di eseguire quanto segue:
-
Consulta la sezione Prerequisiti per l’utilizzo di Amazon SageMaker Inference Recommender per assicurarti di aver rispettato i requisiti di utilizzo di Amazon SageMaker Inference Recommender.
-
Consulta la sezione Processi di raccomandazione con Amazon SageMaker Inference Recommender per avviare i primi processi di raccomandazione del suggeritore di inferenza.
-
Consulta l'esempio introduttivo di notebook Jupyter
di Amazon SageMaker Inference Recommender o i notebook di esempio nella sezione successiva.
Notebook di esempio
Il seguente esempio di notebook Jupyter può aiutarti con i flussi di lavoro per diversi casi d'uso nel suggeritore di inferenza:
-
Se desideri un notebook introduttivo che esegua il benchmark di un modello TensorFlow, consulta il notebook SageMaker Inference Recommender TensorFlow
. -
Se vuoi eseguire un benchmark di un modello HuggingFace, consulta il notebook SageMaker Inference Recommender per HuggingFace
. -
Se vuoi eseguire un benchmark di un modello XGBoost, consulta il notebook XGBoost del suggeritore di inferenza SageMaker
. -
Se desideri esaminare i parametri di CloudWatch per i processi del suggeritore di inferenza, consulta il notebook dei parametri di CloudWatch del suggeritore di inferenza SageMaker
.