

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Distribuisci modelli JumpStart utilizzando Amazon Studio SageMaker
<a name="sagemaker-hyperpod-model-deployment-deploy-js-ui"></a>

I passaggi seguenti illustrano come distribuire modelli JumpStart utilizzando Amazon SageMaker Studio.

## Prerequisiti
<a name="sagemaker-hyperpod-model-deployment-deploy-js-ui-prereqs"></a>

Verifica di aver configurato le funzionalità di inferenza sui tuoi SageMaker HyperPod cluster Amazon. Per ulteriori informazioni, consulta [Configurazione dei HyperPod cluster per l'implementazione dei modelli](sagemaker-hyperpod-model-deployment-setup.md). 

## Crea una distribuzione HyperPod
<a name="sagemaker-hyperpod-model-deployment-deploy-js-ui-create"></a>

1. In Amazon SageMaker Studio, apri la pagina di **JumpStart**destinazione dal riquadro di navigazione a sinistra. 

1. In **Tutti i modelli pubblici**, scegli un modello da implementare.
**Nota**  
Se hai selezionato un modello gated, dovrai accettare il Contratto di licenza con l’utente finale (EULA).

1. Scegli **SageMaker HyperPod**.

1. In **Impostazioni di distribuzione**, JumpStart consiglierà un'istanza per la distribuzione. Se necessario, puoi modificare queste impostazioni.

   1. Se modifichi il **tipo di istanza**, assicurati che sia compatibile con il **HyperPod cluster** scelto. Se non ci sono istanze compatibili, dovrai selezionare un nuovo **HyperPod cluster** o contattare l'amministratore per aggiungere istanze compatibili al cluster.

   1. Per dare priorità all’implementazione del modello, installa il componente aggiuntivo per la governance delle attività, crea allocazioni delle risorse di calcolo e imposta le classificazioni delle attività per la policy del cluster. Una volta completata questa operazione, dovrebbe apparire un’opzione per selezionare una priorità per l’implementazione del modello, che può essere utilizzata per la prelazione di altre implementazioni e attività nel cluster. 

   1. Inserisci il namespace al quale l’amministratore ti ha fornito l’accesso. Potrebbe essere necessario contattare direttamente l’amministratore per ottenere il namespace esatto. Una volta fornito un namespace valido, il pulsante **Implementa** dovrebbe diventare attivo per implementare il modello.

   1. **Se il tipo di istanza è partizionato (abilitato per MIG), seleziona un tipo di partizione GPU.**

   1. Se desideri abilitare L2 KVCache o il routing intelligente per velocizzare l'inferenza LLM, abilitalo. Per impostazione predefinita, è abilitata solo la cache L1 KV. [Per ulteriori dettagli su KVCache e Intelligent routing, consulta Model Deployment. SageMaker HyperPod ](sagemaker-hyperpod-model-deployment.md)

1. Scegli **Implementa** e attendi la creazione dell’**endpoint**.

1. Dopo aver creato l’**endpoint**, seleziona **Testa inferenza**.

## Modifica una distribuzione HyperPod
<a name="sagemaker-hyperpod-model-deployment-deploy-js-ui-edit"></a>

1. In Amazon SageMaker Studio, seleziona **Compute** e poi **HyperPodCluster dal riquadro** di navigazione a sinistra. 

1. In **Implementazioni**, scegli la distribuzione del HyperPod cluster che desideri modificare.

1. Dall’icona con tre puntini verticali (⋮), scegli **Modifica**.

1. In **Impostazioni di distribuzione**, puoi abilitare o disabilitare **Auto-scaling**e modificare il numero **massimo** di repliche.

1. Seleziona **Salva**.

1. Lo **stato** diventa **Aggiornamento in corso**. Quando viene visualizzato di nuovo lo stato **In servizio**, le modifiche sono complete e viene visualizzato un messaggio di conferma.

## Eliminare una distribuzione HyperPod
<a name="sagemaker-hyperpod-model-deployment-deploy-js-ui-delete"></a>

1. In Amazon SageMaker Studio, seleziona **Compute** e poi **HyperPodCluster dal riquadro** di navigazione a sinistra. 

1. In **Implementazioni**, scegli la distribuzione del HyperPod cluster che desideri modificare.

1. Dall’icona con tre puntini verticali (⋮), scegli **Elimina**.

1. Nella **finestra Elimina HyperPod distribuzione**, seleziona la casella di controllo.

1. Scegli **Elimina**.

1. Lo **stato** diventa **Eliminazione in corso**. Una volta eliminata la HyperPod distribuzione, verrà visualizzato un messaggio di conferma.