Distribuzione di modelli su un endpoint - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Distribuzione di modelli su un endpoint

In Amazon SageMaker Canvas, puoi distribuire i tuoi modelli su un endpoint per fare previsioni. SageMaker L'intelligenza artificiale ti fornisce l'infrastruttura ML per ospitare il tuo modello su un endpoint con le istanze di calcolo che preferisci. Quindi, puoi invocare l'endpoint (inviare una richiesta di previsione) e ottenere una previsione in tempo reale dal tuo modello. Con questa funzionalità, puoi utilizzare il modello in produzione per rispondere alle richieste in arrivo e puoi integrarlo con applicazioni e flussi di lavoro esistenti.

Per iniziare, devi disporre di un modello pronto per l’implementazione. Puoi distribuire versioni di modelli personalizzate che hai creato, modelli Amazon SageMaker JumpStart Foundation e modelli di base ottimizzati JumpStart . Per ulteriori informazioni sulla creazione di un modello in Canvas, consulta Funzionamento dei modelli personalizzati. Per ulteriori informazioni sui modelli di JumpStart base in Canvas, consulta. Modelli di base generativi di intelligenza artificiale in Canvas SageMaker

Consulta la sezione Permissions management, quindi inizia a creare nuove distribuzioni nella sezione Deploy a model.

Gestione delle autorizzazioni

Per impostazione predefinita, disponi delle autorizzazioni per distribuire modelli sugli endpoint di SageMaker AI Hosting. SageMaker L'intelligenza artificiale concede queste autorizzazioni per tutti i profili utente Canvas nuovi ed esistenti tramite la AmazonSageMakerCanvasFullAccesspolicy, che è allegata al ruolo di esecuzione AWS IAM per il dominio SageMaker AI che ospita l'applicazione Canvas.

Se l'amministratore di Canvas sta configurando un nuovo dominio o profilo utente, quando configura il dominio e segue le istruzioni preliminari contenute inPrerequisiti per la configurazione di Amazon Canvas SageMaker , SageMaker AI attiva le autorizzazioni di distribuzione del modello tramite l'opzione Abilita la distribuzione diretta dei modelli Canvas, che è abilitata per impostazione predefinita.

L’amministratore di Canvas può gestire le autorizzazioni per distribuire il modello anche a livello di profilo utente. Ad esempio, se l’amministratore non intende concedere le autorizzazioni di implementazione dei modelli a tutti i profili utente durante la configurazione di un dominio, può concederle a utenti specifici dopo aver creato il dominio.

La procedura seguente spiega come modificare le autorizzazioni di implementazione dei modelli per un profilo utente specifico:

  1. Apri la console SageMaker AI all'indirizzo. https://console.aws.amazon.com/sagemaker/

  2. Nel riquadro di navigazione a sinistra, scegli Configurazioni admin.

  3. In Configurazioni admin, scegli Domini.

  4. Dall’elenco di domini, seleziona il dominio del profilo utente.

  5. Nella pagina Dettagli del dominio, seleziona la scheda Profili utente.

  6. Scegli il tuo Profilo utente.

  7. Nella pagina del profilo utente, seleziona la scheda Configurazioni app.

  8. Nella sezione Canvas, scegli Modifica.

  9. Nella sezione Configurazione di MLOps, disattiva l’interruttore Abilita l’implementazione diretta dei modelli Canvas per abilitare le autorizzazioni di implementazione.

  10. Scegli Invia per salvare le modifiche alle impostazioni del dominio.

Il profilo utente ora dispone delle autorizzazioni di implementazione dei modelli.

Dopo aver concesso le autorizzazioni al dominio o al profilo utente, assicurati che l’utente si disconnetta dall’applicazione Canvas e acceda nuovamente per applicare le modifiche alle autorizzazioni.

Distribuzione di un modello

Per iniziare a distribuire il modello, crea una nuova distribuzione in Canvas e specifica la versione del modello che desideri distribuire, oltre all'infrastruttura ML, ad esempio il tipo e il numero di istanze di calcolo che desideri utilizzare per ospitare il modello.

Canvas suggerisce un tipo e un numero di istanze predefiniti in base al tipo di modello, oppure puoi saperne di più sui vari tipi di istanze SageMaker AI nella pagina SageMaker dei prezzi di Amazon. L'addebito si basa sul prezzo dell'istanza SageMaker AI mentre l'endpoint è attivo.

Quando implementate i modelli di JumpStart base, avete anche la possibilità di specificare la durata del tempo di implementazione. Puoi implementare il modello su un endpoint a tempo indeterminato (il che significa che l’endpoint resta attivo fino a quando non elimini l’implementazione). Oppure, se hai bisogno dell'endpoint solo per un breve periodo di tempo e desideri ridurre i costi, puoi implementare il modello su un endpoint per un determinato periodo di tempo, dopodiché l' SageMaker IA spegne l'endpoint per te.

Nota

Se implementi un modello per un periodo di tempo specificato, resta connesso all’applicazione Canvas per tutta la durata dell’endpoint. Se ti disconnetti o elimini l’applicazione, Canvas non può chiudere l’endpoint all’ora specificata.

Dopo aver distribuito il modello su un endpoint di inferenza in tempo reale di SageMaker AI Hosting, puoi iniziare a fare previsioni richiamando l'endpoint.

Esistono diversi modi per implementare un modello dall’applicazione Canvas. Puoi accedere all'opzione di distribuzione del modello tramite uno dei seguenti metodi:

  • Nella pagina I miei modelli dell’applicazione Canvas, puoi scegliere il modello da implementare. Quindi, dalla pagina Versioni del modello, scegli l’icona Altre opzioni ( Vertical ellipsis icon representing a menu or more options. ) accanto a una versione del modello e seleziona Implementa.

  • Nella pagina dei dettagli di una versione del modello, nella scheda Analizza, scegli l’opzione Implementa.

  • Nella pagina dei dettagli di una versione del modello, nella scheda Prevedi, scegli l’icona Altre opzioni ( Vertical ellipsis icon representing a menu or more options. ) nella parte superiore della pagina e seleziona Implementa.

  • Nella pagina MLOps dell’applicazione Canvas, scegli la scheda Implementazioni e seleziona Crea implementazione.

  • Per i modelli di JumpStart base e i modelli di base ottimizzati, vai alla pagina dei modelli dell'applicazione Canvas. Ready-to-use Scegli Genera, estrai e riepiloga il contenuto. Quindi, trova il modello di JumpStart base o il modello di base ottimizzato che desideri implementare. Scegli il modello e, nella pagina della chat del modello, scegli il pulsante Implementa.

Tutti questi metodi aprono il pannello laterale Distribuisci modello, in cui puoi specificare la configurazione di distribuzione per il tuo modello. Per distribuire il modello da questo pannello, procedi come segue:

  1. (Facoltativo) Se crei un’implementazione dalla pagina MLOps, puoi scegliere l’opzione Seleziona modello e versione. Utilizza i menu a discesa per selezionare il modello e la versione del modello che desideri distribuire.

  2. Immetti un nome nel campo Nome distribuzione.

  3. (Solo per i modelli di JumpStart base e i modelli di base ottimizzati) Scegli una durata di implementazione. Seleziona Indefinito per lasciare l’endpoint attivo finché non lo chiudi oppure seleziona Specifica durata e indica per quanto tempo desideri che l’endpoint rimanga attivo.

  4. Per quanto riguarda il tipo di istanza, l' SageMaker intelligenza artificiale rileva un tipo e un numero di istanza predefiniti adatti al tuo modello. Tuttavia, puoi modificare il tipo di istanza che desideri utilizzare per ospitare il modello.

    Nota

    Se esaurisci la quota di istanze per il tipo di istanza scelto sul tuo AWS account, puoi richiedere un aumento della quota. Per ulteriori informazioni sulle quote predefinite e su come richiedere un aumento, consulta gli endpoint e le quote di Amazon SageMaker AI nella guida di riferimento AWSgenerale.

  5. Per quanto riguarda il numero di istanze, puoi impostare il numero di istanze attive utilizzate per il tuo endpoint. SageMaker L'intelligenza artificiale rileva un numero predefinito adatto al tuo modello, ma puoi modificare questo numero.

  6. Quando sei pronto per distribuire il modello, scegli Distribuisci.

Il modello dovrebbe ora essere distribuito su un endpoint.