Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
SageMaker HyperPod Guida introduttiva di Amazon
Questa guida rapida ti guida nella creazione del tuo primo HyperPod cluster con orchestrazioni Slurm e Amazon EKS (EKS). Scegli l'orchestrazione più adatta alle esigenze della tua infrastruttura per iniziare. SageMaker HyperPod
In questo argomento:
Crea un cluster orchestrato da SLURM SageMaker HyperPod
Segui questi passaggi per creare il tuo primo SageMaker HyperPod cluster con l'orchestrazione Slurm.
Apri la console Amazon SageMaker AI all'indirizzo https://console.aws.amazon.com/sagemaker/
. -
Scegli HyperPod Clusters nel riquadro di navigazione a sinistra, quindi Cluster Management.
-
Nella pagina SageMaker HyperPod Cluster, scegli Crea HyperPod cluster.
-
Nel menu a discesa Crea HyperPod cluster, scegli Orchestrated by Slurm.
-
Nella pagina di creazione del cluster, scegli Configurazione rapida. Con questa opzione, puoi iniziare immediatamente con le impostazioni predefinite. SageMaker L'intelligenza artificiale creerà nuove risorse come VPC, sottoreti, gruppi di sicurezza, bucket Amazon S3, ruolo IAM e FSx for Lustre nel processo di creazione del cluster.
-
In Impostazioni generali, specifica un nome per il nuovo cluster. Dopo la creazione del cluster, non è più possibile modificarne il nome.
-
In Gruppi di istanze, scegli Aggiungi gruppo. Ogni gruppo di istanze può essere configurato in modo diverso ed è possibile creare un cluster eterogeneo composto da più gruppi di istanze con vari tipi di istanze. Per implementare un cluster, devi aggiungere almeno un gruppo di istanze. Puoi aggiungere un gruppo di istanze alla volta. Per creare più gruppi di istanze, ripeti il processo per ogni gruppo.
Segui questa procedura per aggiungere un gruppo di istanze.
-
In Tipo di gruppo di istanze, scegli un tipo per il tuo gruppo di istanze. Per questo avvio rapido, scegli Controller (head) per
my-controller-group, Login permy-login-groupe Calcolo (worker) perworker-group-1. -
In Nome, specifica un nome per il gruppo di istanze. Per questo avvio rapido, crea tre gruppi di istanze denominati
my-controller-group,my-login-groupeworker-group-1. -
In Capacità dell’istanza, scegli la capacità on demand o un piano di addestramento per riservare le tue risorse di calcolo.
-
Per Tipo di istanza, scegli l’istanza per il gruppo di istanze. Per questo avvio rapido, seleziona
ml.c5.xlargepermy-controller-group,ml.m5.4xlargepermy-login-groupeml.trn1.32xlargeperworker-group-1.Assicurati di scegliere il tipo di istanza con quote sufficienti nel tuo account oppure richiedi quote aggiuntive seguendo le istruzioni riportate in SageMaker HyperPod quote.
-
In Quantità istanze. specifica un numero intero che non sia maggiore della quota dell’istanza per l’utilizzo del cluster. Per questo avvio rapido, inserisci 1 in tutti e tre i gruppi.
-
In Zona di disponibilità di destinazione, scegli la zona di disponibilità in cui allocare le istanze. La zona di disponibilità deve corrispondere alla posizione della capacità di calcolo accelerata.
-
Per Volume di archiviazione aggiuntivo per istanza (GB) (facoltativo), specifica un numero intero compreso tra 1 e 16.384 per impostare la dimensione di un volume Elastic Block Store (EBS) aggiuntivo in gigabyte (GB). Il volume EBS è collegato a ciascuna istanza del gruppo di istanze. Il percorso di montaggio predefinito per il volume EBS aggiuntivo è
/opt/sagemaker. Dopo aver creato correttamente il cluster, è possibile accedere tramite SSH alle istanze del cluster (nodi) e verificare che il volume EBS sia montato correttamente eseguendo il comandodf -h. Il collegamento di un volume EBS aggiuntivo fornisce un’archiviazione stabile, fuori istanza e con persistenza indipendente, come descritto nella sezione Amazon EBS volumes in Amazon Elastic Block Store User Guide. -
Scegli Aggiungi gruppo di istanze.
-
-
In Impostazioni predefinite di configurazione rapida, rivedi le impostazioni predefinite. Questa sezione elenca tutte le impostazioni predefinite per la creazione del cluster, incluse tutte le nuove AWS risorse che verranno create durante il processo di creazione del cluster.
-
Seleziona Invia.
Per ulteriori informazioni, consulta Guida introduttiva all' SageMaker HyperPod utilizzo della console SageMaker AI.
Crea un cluster orchestrato da EKS SageMaker HyperPod
Segui questi passaggi per creare il tuo primo SageMaker HyperPod cluster con l'orchestrazione di Amazon EKS.
Apri la console Amazon SageMaker AI all'indirizzo https://console.aws.amazon.com/sagemaker/
. -
Scegli HyperPod Clusters nel riquadro di navigazione a sinistra, quindi Cluster Management.
-
Nella pagina SageMaker HyperPod Cluster, scegli Crea HyperPod cluster.
-
Nel menu a discesa Crea HyperPod cluster, scegli Orchestrated by Amazon EKS.
-
Nella pagina di creazione del cluster, scegli Configurazione rapida. Con questa opzione, puoi iniziare immediatamente con le impostazioni predefinite. SageMaker L'intelligenza artificiale creerà nuove risorse come VPC, sottoreti, gruppi di sicurezza, bucket Amazon S3, ruolo IAM e FSx for Lustre nel processo di creazione del cluster.
-
In Impostazioni generali, specifica un nome per il nuovo cluster. Dopo la creazione del cluster, non è più possibile modificarne il nome.
-
In Gruppi di istanze, scegli Aggiungi gruppo. Ogni gruppo di istanze può essere configurato in modo diverso ed è possibile creare un cluster eterogeneo composto da più gruppi di istanze con vari tipi di istanze. Per implementare un cluster, devi aggiungere almeno un gruppo di istanze. Puoi aggiungere un gruppo di istanze alla volta. Per creare più gruppi di istanze, ripeti il processo per ogni gruppo.
Segui questa procedura per aggiungere un gruppo di istanze.
-
In Tipo di gruppo di istanze, scegli Standard o Gruppo di istanze limitato (RIG). Di solito si sceglie Standard perché fornisce un ambiente di calcolo generico senza limitazioni di sicurezza aggiuntive. Gruppo di istanze limitato (RIG) è un ambiente specializzato per la personalizzazione di modelli di fondazione come Amazon Nova. Per ulteriori informazioni sulla configurazione di RIG per la personalizzazione dei modelli Amazon Nova, consulta Personalizzazione di Amazon Nova su Amazon SageMaker HyperPod.
-
In Nome, specifica un nome per il gruppo di istanze.
-
In Capacità dell’istanza, scegli la capacità on demand o un piano di addestramento per riservare le tue risorse di calcolo.
-
Per Tipo di istanza, scegli l’istanza per il gruppo di istanze. Assicurati di scegliere il tipo di istanza con quote sufficienti nel tuo account oppure richiedi quote aggiuntive seguendo le istruzioni riportate in SageMaker HyperPod quote.
-
In Quantità istanze. specifica un numero intero che non sia maggiore della quota dell’istanza per l’utilizzo del cluster. Per questo avvio rapido, inserisci 1 in tutti e tre i gruppi.
-
In Zona di disponibilità di destinazione, scegli la zona di disponibilità in cui allocare le istanze. La zona di disponibilità deve corrispondere alla posizione della capacità di calcolo accelerata.
-
Per Volume di archiviazione aggiuntivo per istanza (GB) (facoltativo), specifica un numero intero compreso tra 1 e 16.384 per impostare la dimensione di un volume Elastic Block Store (EBS) aggiuntivo in gigabyte (GB). Il volume EBS è collegato a ciascuna istanza del gruppo di istanze. Il percorso di montaggio predefinito per il volume EBS aggiuntivo è
/opt/sagemaker. Dopo aver creato correttamente il cluster, è possibile accedere tramite SSH alle istanze del cluster (nodi) e verificare che il volume EBS sia montato correttamente eseguendo il comandodf -h. Il collegamento di un volume EBS aggiuntivo fornisce un’archiviazione stabile, fuori istanza e con persistenza indipendente, come descritto nella sezione Amazon EBS volumes in Amazon Elastic Block Store User Guide. -
Per Controlli approfonditi dell’integrità delle istanze, scegli un’opzione. I controlli dell’integrità approfonditi monitorano l’integrità dell’istanza durante la creazione e dopo gli aggiornamenti software, ripristinando automaticamente le istanze difettose con riavvii o sostituzioni, se abilitati.
-
Scegli Aggiungi gruppo di istanze.
-
-
In Impostazioni predefinite di configurazione rapida, rivedi le impostazioni predefinite. Questa sezione elenca tutte le impostazioni predefinite per la creazione del cluster, incluse tutte le nuove AWS risorse che verranno create durante il processo di creazione del cluster.
-
Seleziona Invia.
Per ulteriori informazioni, consulta Creazione di un SageMaker HyperPod cluster con l'orchestrazione di Amazon EKS.
Invio di carichi di lavoro
Segui questi tutorial del workshop per inviare carichi di lavoro di esempio.