Aggiornamento del software della piattaforma SageMaker HyperPod - Amazon SageMaker AI

Aggiornamento del software della piattaforma SageMaker HyperPod

Quando crei il cluster SageMaker HyperPod, SageMaker HyperPod seleziona un’Amazon Machine Image (AMI) corrispondente alla versione Kubernetes del cluster Amazon EKS.

Esegui update-cluster-software per aggiornare i cluster esistenti con software e patch di sicurezza forniti dal servizio SageMaker HyperPod. Per --cluster-name, specifica il nome o l’ARN del cluster da aggiornare.

Importante
  • Quando viene chiamata questa API, SageMaker HyperPod non svuota né ridistribuisce i processi (Pod) in esecuzione sui nodi. Controlla la presenza di processi in esecuzione sui nodi prima di chiamare questa API.

  • Il processo di applicazione delle patch sostituisce il volume root con l’AMI aggiornata, il che significa che i dati precedenti archiviati nel volume root dell’istanza andranno persi. Assicurati di eseguire il backup dei dati dal volume root dell’istanza su Amazon S3 o Amazon FSx per Lustre.

  • Tutti i nodi del cluster sono soggetti a tempi di inattività (i nodi appaiono come <NotReady> nell’output dikubectl get node) durante l’applicazione delle patch. Ti consigliamo di terminare tutti i carichi di lavoro prima di applicare le patch e di riprenderli al termine dell’applicazione delle patch.

    Se la patch di sicurezza non riesce, è possibile recuperare i messaggi di errore eseguendo l’API DescribeCluster come indicato in Descrizione di un cluster.

aws sagemaker update-cluster-software --cluster-name your-hyperpod-cluster

Quando chiami l’API UpdateClusterSoftware, SageMaker HyperPod aggiorna la versione Kubernetes dei nodi selezionando la DLAMI di SageMaker HyperPod più recente in base alla versione Kubernetes del cluster Amazon EKS. Quindi, esegue gli script del ciclo di vita nel bucket Amazon S3 che hai specificato durante la creazione o l’aggiornamento del cluster.

Puoi verificare la versione kubelet di un nodo con il comando kubectl describe node.

La versione Kubernetes dei nodi del cluster SageMaker HyperPod non si aggiorna automaticamente quando aggiorni la versione del cluster Amazon EKS. Dopo aver aggiornato la versione Kubernetes per il cluster Amazon EKS, devi utilizzare l’API UpdateClusterSoftware per aggiornare i nodi del cluster SageMaker HyperPod alla stessa versione Kubernetes.

Consigliamo di aggiornare il cluster SageMaker HyperPod dopo aver aggiornato i nodi del cluster Amazon EKS e di evitare che ci sia una differenza di versione superiore a una tra la versione del cluster Amazon EKS e quella dei nodi del cluster SageMaker HyperPod.

Il team di assistenza SageMaker HyperPod distribuisce regolarmente nuovi DLAMI di SageMaker HyperPod per migliorare la sicurezza e l’esperienza degli utenti. Consigliamo di continuare ad aggiornare la DLAMI di SageMaker HyperPod alla versione più recente. Per i futuri aggiornamenti alla DLAMI di SageMaker HyperPod per l’applicazione delle patch di sicurezza, consulta Note di rilascio di Amazon SageMaker HyperPod.

Nota

Puoi eseguire questa API solo in modo programmatico. La funzionalità di applicazione delle patch non è implementata nell’interfaccia utente della console SageMaker HyperPod.