SageMaker HyperPod AMI-Versionen für Amazon EKS - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

SageMaker HyperPod AMI-Versionen für Amazon EKS

In den folgenden Versionshinweisen werden die neuesten Updates für Amazon SageMaker HyperPod AMI-Versionen für Amazon EKS-Orchestration beschrieben. Jeder Versionshinweis enthält eine zusammengefasste Liste der Pakete, die im Amazon EKS-Support vorinstalliert oder vorkonfiguriert sind. SageMaker HyperPod DLAMIs Jedes DLAMI basiert auf AL2 023 und unterstützt eine bestimmte Kubernetes-Version. Informationen zu HyperPod DLAMI-Releases für Slurm-Orchestrierung finden Sie unter. SageMaker HyperPod AMI-Veröffentlichungen für Slurm Informationen zu SageMaker HyperPod Feature-Releases von Amazon finden Sie unter SageMaker HyperPod Versionshinweise von Amazon.

SageMaker Hyperpod AMI-Veröffentlichungen für Amazon EKS: 22. November 2025

Allgemeine AMI-Updates

SageMaker Unterstützung für Hyperpod DLAMI für Amazon EKS

Diese Veröffentlichung umfasst folgende Updates:

Kubernetes v1.28
  • AL2 ist jetzt veraltet. Kubernetes AMI basiert auf AL2 023.

  • AL2 (x86_64):

    • Linux-Kernelversion: 5.10

    • Glibc-Version: 2.26

    • OpenSSL-Version: 1.0.2k-fips

    • FSx Lustre-Clientversion: 2.12.8

    • Docker-Version: Docker-Version 25.0.13, Build 0bab007

    • Runc-Version: 1.3.3

    • Container-Version: enthaltenes Github. com/containerd/containerd 1,7,27

    • AWS-CLI v2-Version: aws-cli/1.42.71 Python/3.10.17 Linux/5.10.245-241.978.amzn2.x86_64 botocore/1.40.71

    • als Neuronx DMS-Version: 2.24.7.0

    • NVIDIA-Treiberversion: 570.195.03

    • CUDA-Version: 12.2

    • ENA-Treiberversion: 2.15.0g

    • Python-Version: 3.7.16

    • Kubernetes-Version: v1.28.15-eks-473151a

    • Version für iptables-Dienste: 1.8.4

    • Nginx-Version: 1.20.1

    • nvme-CLI-Version: 1.11.1

    • Epel-Release-Version: 7

    • Stress-Version: 1.0.4

    • gesammelte Version: 5.8.1

    • ACL-Version: 2.2.51

    • Rsyslog-Version: 8.24.0

    • Lustre-Client-Version: 2.12.8

    • Systemd-Version: 219

    • OpenSSH-Version: 7.4

    • Sudo-Version: 1.8.23

    • GCC-Version: 7.3.1

    • cmake-Version: 2.8.12.2

    • Git-Version: 2.47.3

    • Version erstellen: 3.82

    • Cloudwatch-Agent-Version: 1.300060.1

    • NFS-Utils-Version: 1.3.0

    • LVM2-Version: 2.02.187

    • ec2-Instance-Connect-Version: 1.1

    • aws-cfn-bootstrap Ausführung: 2.0

    • RDMA-Core-Version: 59.

  • AL2023 (x86_64):

    • Linux-Kernelversion: 6.1

    • Glibc-Version: 2.34

    • OpenSSL-Version: 3.2.2

    • FSx Lustre-Client-Version: 2.15.6

    • Runc-Version: 1.3.3

    • Container-Version: enthaltenes Github. com/containerd/containerd 1,7,27

    • als Neuronx DMS-Version: 2.24.7.0

    • NVIDIA-Treiberversion: 580.95.05

    • CUDA-Version: 12.8

    • ENA-Treiberversion: 2.15.0g

    • Python-Version: 3.9.24

    • Kubernetes-Version: v1.28.15-eks-473151a

    • Version für iptables-Dienste: 1.8.8

    • Nginx-Version: 1.28.0

    • nvme-cli-Version: 2.13 1.13

    • Stress-Version: 1.0.7

    • gesammelte Version: 5.12.0.

    • ACL-Version: 2.3.1

    • Lustre-Client-Version: 2.15.6

    • Systemd-Version: 252

    • OpenSSH-Version: 8.7

    • Sudo-Version: 1.9.15

    • GCC-Version: 11.5.0

    • cmake-Version: 3.22.2

    • Git-Version: 2.50.1

    • Version erstellen: 4.3

    • Cloudwatch-Agent-Version: 1.300060.1

    • NFS-Utils-Version: 2.5.4

    • LVM2-Version: 2.03.16

    • ec2-Instance-Connect-Version: 1.1

    • aws-cfn-bootstrap Ausführung: 2.0

    • RDMA-Core-Version: 59.

Kubernetes v1.29
  • AL2 ist jetzt veraltet. Kubernetes AMI basiert auf AL2 023.

  • AL2 (x86_64):

    • Linux-Kernelversion: 5.10

    • Glibc-Version: 2.26

    • OpenSSL-Version: 1.0.2k-fips

    • FSx Lustre-Clientversion: 2.12.8

    • Docker-Version: Docker-Version 25.0.13, Build 0bab007

    • Runc-Version: 1.3.3

    • Container-Version: enthaltenes Github. com/containerd/containerd 1,7,27

    • AWS-CLI v2-Version: aws-cli/1.42.71 Python/3.10.17 Linux/5.10.245-241.978.amzn2.x86_64 botocore/1.40.71

    • als Neuronx DMS-Version: 2.24.7.0

    • NVIDIA-Treiberversion: 570.195.03

    • CUDA-Version: 12.2

    • ENA-Treiberversion: 2.15.0g

    • Python-Version: 3.7.16

    • Kubernetes-Version: v1.29.15-eks-473151a

    • Version für iptables-Dienste: 1.8.4

    • Nginx-Version: 1.20.1

    • nvme-CLI-Version: 1.11.1

    • Epel-Release-Version: 7

    • Stress-Version: 1.0.4

    • gesammelte Version: 5.8.1

    • ACL-Version: 2.2.51

    • Rsyslog-Version: 8.24.0

    • Lustre-Client-Version: 2.12.8

    • Systemd-Version: 219

    • OpenSSH-Version: 7.4

    • Sudo-Version: 1.8.23

    • GCC-Version: 7.3.1

    • cmake-Version: 2.8.12.2

    • Git-Version: 2.47.3

    • Version erstellen: 3.82

    • Cloudwatch-Agent-Version: 1.300060.1

    • NFS-Utils-Version: 1.3.0

    • LVM2-Version: 2.02.187

    • ec2-Instance-Connect-Version: 1.1

    • aws-cfn-bootstrap Ausführung: 2.0

    • RDMA-Core-Version: 59.

  • AL2023 (x86_64):

    • Linux-Kernelversion: 6.1

    • Glibc-Version: 2.34

    • OpenSSL-Version: 3.2.2

    • FSx Lustre-Client-Version: 2.15.6

    • Runc-Version: 1.3.3

    • Container-Version: enthaltenes Github. com/containerd/containerd 1,7,27

    • als Neuronx DMS-Version: 2.24.7.0

    • NVIDIA-Treiberversion: 580.95.05

    • CUDA-Version: 12.8

    • ENA-Treiberversion: 2.15.0g

    • Python-Version: 3.9.24

    • Kubernetes-Version: v1.29.15-eks-473151a

    • Version für iptables-Dienste: 1.8.8

    • Nginx-Version: 1.28.0

    • nvme-cli-Version: 2.13 1.13

    • Stress-Version: 1.0.7

    • gesammelte Version: 5.12.0.

    • ACL-Version: 2.3.1

    • Lustre-Client-Version: 2.15.6

    • Systemd-Version: 252

    • OpenSSH-Version: 8.7

    • Sudo-Version: 1.9.15

    • GCC-Version: 11.5.0

    • cmake-Version: 3.22.2

    • Git-Version: 2.50.1

    • Version erstellen: 4.3

    • Cloudwatch-Agent-Version: 1.300060.1

    • NFS-Utils-Version: 2.5.4

    • LVM2-Version: 2.03.16

    • ec2-Instance-Connect-Version: 1.1

    • aws-cfn-bootstrap Ausführung: 2.0

    • RDMA-Core-Version: 59.

Kubernetes v1.30
  • AL2 ist jetzt veraltet. Kubernetes AMI basiert auf AL2 023.

  • AL2 (x86_64):

    • Linux-Kernelversion: 5.10

    • Glibc-Version: 2.26

    • OpenSSL-Version: 1.0.2k-fips

    • FSx Lustre-Clientversion: 2.12.8

    • Docker-Version: Docker-Version 25.0.13, Build 0bab007

    • Runc-Version: 1.3.2

    • Container-Version: enthaltenes Github. com/containerd/containerd 1,7,27

    • AWS-CLI v2-Version: aws-cli/1.42.69 Python/3.10.17 Linux/5.10.245-241.976.amzn2.x86_64 botocore/1.40.69

    • als Neuronx DMS-Version: 2.24.7.0

    • NVIDIA-Treiberversion: 570.195.03

    • CUDA-Version: 12.2

    • ENA-Treiberversion: 2.15.0g

    • Python-Version: 3.7.16

    • Kubernetes-Version: v1.30.11-eks-473151a

    • Version für iptables-Dienste: 1.8.4

    • Nginx-Version: 1.20.1

    • nvme-CLI-Version: 1.11.1

    • Epel-Release-Version: 7

    • Stress-Version: 1.0.4

    • gesammelte Version: 5.8.1

    • ACL-Version: 2.2.51

    • Rsyslog-Version: 8.24.0

    • Lustre-Client-Version: 2.12.8

    • Systemd-Version: 219

    • OpenSSH-Version: 7.4

    • Sudo-Version: 1.8.23

    • GCC-Version: 7.3.1

    • cmake-Version: 2.8.12.2

    • Git-Version: 2.47.3

    • Version erstellen: 3.82

    • Cloudwatch-Agent-Version: 1.300060.1

    • NFS-Utils-Version: 1.3.0

    • LVM2-Version: 2.02.187

    • ec2-Instance-Connect-Version: 1.1

    • aws-cfn-bootstrap Ausführung: 2.0

    • RDMA-Core-Version: 58.

  • AL2023 (x86_64):

    • Linux-Kernelversion: 6.1

    • Glibc-Version: 2.34

    • OpenSSL-Version: 3.2.2

    • FSx Lustre-Client-Version: 2.15.6

    • Runc-Version: 1.3.3

    • Container-Version: enthaltenes Github. com/containerd/containerd 1,7,27

    • als Neuronx DMS-Version: 2.24.7.0

    • NVIDIA-Treiberversion: 580.95.05

    • CUDA-Version: 12.8

    • ENA-Treiberversion: 2.15.0g

    • Python-Version: 3.9.24

    • Kubernetes-Version: v1.30.11-eks-473151a

    • Version für iptables-Dienste: 1.8.8

    • Nginx-Version: 1.28.0

    • nvme-cli-Version: 2.13 1.13

    • Stress-Version: 1.0.7

    • gesammelte Version: 5.12.0.

    • ACL-Version: 2.3.1

    • Lustre-Client-Version: 2.15.6

    • Systemd-Version: 252

    • OpenSSH-Version: 8.7

    • Sudo-Version: 1.9.15

    • GCC-Version: 11.5.0

    • cmake-Version: 3.22.2

    • Git-Version: 2.50.1

    • Version erstellen: 4.3

    • Cloudwatch-Agent-Version: 1.300060.1

    • NFS-Utils-Version: 2.5.4

    • LVM2-Version: 2.03.16

    • ec2-Instance-Connect-Version: 1.1

    • aws-cfn-bootstrap Ausführung: 2.0

    • RDMA-Core-Version: 59.

Kubernetes v1.31
  • AL2 ist jetzt veraltet. Kubernetes AMI basiert auf AL2 023.

  • AL2 (x86_64):

    • Linux-Kernelversion: 5.10

    • Glibc-Version: 2.26

    • OpenSSL-Version: 1.0.2k-fips

    • FSx Lustre-Clientversion: 2.12.8

    • Docker-Version: Docker-Version 25.0.13, Build 0bab007

    • Runc-Version: 1.3.3

    • Container-Version: enthaltenes Github. com/containerd/containerd 1,7,27

    • AWS-CLI v2-Version: aws-cli/1.42.71 Python/3.10.17 Linux/5.10.245-241.978.amzn2.x86_64 botocore/1.40.71

    • als Neuronx DMS-Version: 2.24.7.0

    • NVIDIA-Treiberversion: 570.195.03

    • CUDA-Version: 12.2

    • ENA-Treiberversion: 2.15.0g

    • Python-Version: 3.7.16

    • Kubernetes-Version: v1.31.7-eks-473151a

    • Version für iptables-Dienste: 1.8.4

    • Nginx-Version: 1.20.1

    • nvme-CLI-Version: 1.11.1

    • Epel-Release-Version: 7

    • Stress-Version: 1.0.4

    • gesammelte Version: 5.8.1

    • ACL-Version: 2.2.51

    • Rsyslog-Version: 8.24.0

    • Lustre-Client-Version: 2.12.8

    • Systemd-Version: 219

    • OpenSSH-Version: 7.4

    • Sudo-Version: 1.8.23

    • GCC-Version: 7.3.1

    • cmake-Version: 2.8.12.2

    • Git-Version: 2.47.3

    • Version erstellen: 3.82

    • Cloudwatch-Agent-Version: 1.300060.1

    • NFS-Utils-Version: 1.3.0

    • LVM2-Version: 2.02.187

    • ec2-Instance-Connect-Version: 1.1

    • aws-cfn-bootstrap Ausführung: 2.0

    • RDMA-Core-Version: 59.

  • AL2023 (x86_64):

    • Linux-Kernelversion: 6.1

    • Glibc-Version: 2.34

    • OpenSSL-Version: 3.2.2

    • FSx Lustre-Client-Version: 2.15.6

    • Runc-Version: 1.3.3

    • Container-Version: enthaltenes Github. com/containerd/containerd 1,7,27

    • als Neuronx DMS-Version: 2.24.7.0

    • NVIDIA-Treiberversion: 580.95.05

    • CUDA-Version: 12.8

    • ENA-Treiberversion: 2.15.0g

    • Python-Version: 3.9.24

    • Kubernetes-Version: v1.31.13-eks-113cf36

    • Version für iptables-Dienste: 1.8.8

    • Nginx-Version: 1.28.0

    • nvme-cli-Version: 2.13 1.13

    • Stress-Version: 1.0.7

    • gesammelte Version: 5.12.0.

    • ACL-Version: 2.3.1

    • Lustre-Client-Version: 2.15.6

    • Systemd-Version: 252

    • OpenSSH-Version: 8.7

    • Sudo-Version: 1.9.15

    • GCC-Version: 11.5.0

    • cmake-Version: 3.22.2

    • Git-Version: 2.50.1

    • Version erstellen: 4.3

    • Cloudwatch-Agent-Version: 1.300060.1

    • NFS-Utils-Version: 2.5.4

    • LVM2-Version: 2.03.16

    • ec2-Instance-Connect-Version: 1.1

    • aws-cfn-bootstrap Ausführung: 2.0

    • RDMA-Core-Version: 59.

  • AL2203 (): ARM64

    • Linux-Kernelversion: 6.12

    • Glibc-Version: 2.34

    • OpenSSL-Version: 3.2.2

    • FSx Lustre-Client-Version: 2.15.6

    • Runc-Version: 1.3.3

    • Container-Version: enthaltenes Github. com/containerd/containerd 1,7,27

    • NVIDIA-Treiberversion: 580.95.05

    • CUDA-Version: 12.8

    • ENA-Treiberversion: 2.15.0g

    • Python-Version: 3.9.24

    • Kubernetes-Version: v1.31.13-eks-113cf36

    • Version für iptables-Dienste: 1.8.8

    • Nginx-Version: 1.28.0

    • nvme-cli-Version: 2.13 1.13

    • Stress-Version: 1.0.7

    • gesammelte Version: 5.12.0.

    • ACL-Version: 2.3.1

    • Lustre-Client-Version: 2.15.6

    • nvidia-imex-Version: 580.95.05

    • Systemd-Version: 252

    • OpenSSH-Version: 8.7

    • Sudo-Version: 1.9.15

    • GCC-Version: 11.5.0

    • cmake-Version: 3.22.2

    • Git-Version: 2.50.1

    • Version erstellen: 4.3

    • Cloudwatch-Agent-Version: 1.300060.1

    • NFS-Utils-Version: 2.5.4

    • LVM2-Version: 2.03.16

    • ec2-Instance-Connect-Version: 1.1

    • aws-cfn-bootstrap Ausführung: 2.0

    • RDMA-Core-Version: 58.

Kubernetes v1.32
  • AL2 ist jetzt veraltet. Kubernetes AMI basiert auf AL2 023.

  • AL2 (x86_64):

    • Linux-Kernelversion: 5.10

    • Glibc-Version: 2.26

    • OpenSSL-Version: 1.0.2k-fips

    • FSx Lustre-Clientversion: 2.12.8

    • Docker-Version: Docker-Version 25.0.13, Build 0bab007

    • Runc-Version: 1.3.3

    • Container-Version: enthaltenes Github. com/containerd/containerd 1,7,27

    • AWS-CLI v2-Version: aws-cli/1.42.74 Python/3.10.17 Linux/5.10.245-241.978.amzn2.x86_64 botocore/1.40.74

    • als Neuronx DMS-Version: 2.24.7.0

    • NVIDIA-Treiberversion: 570.195.03

    • CUDA-Version: 12.2

    • ENA-Treiberversion: 2.15.0g

    • Python-Version: 3.7.16

    • Kubernetes-Version: v1.32.3-eks-473151a

    • Version für iptables-Dienste: 1.8.4

    • Nginx-Version: 1.20.1

    • nvme-CLI-Version: 1.11.1

    • Epel-Release-Version: 7

    • Stress-Version: 1.0.4

    • gesammelte Version: 5.8.1

    • ACL-Version: 2.2.51

    • Rsyslog-Version: 8.24.0

    • Lustre-Client-Version: 2.12.8

    • Systemd-Version: 219

    • OpenSSH-Version: 7.4

    • Sudo-Version: 1.8.23

    • GCC-Version: 7.3.1

    • cmake-Version: 2.8.12.2

    • Git-Version: 2.47.3

    • Version erstellen: 3.82

    • Cloudwatch-Agent-Version: 1.300060.1

    • NFS-Utils-Version: 1.3.0

    • LVM2-Version: 2.02.187

    • ec2-Instance-Connect-Version: 1.1

    • aws-cfn-bootstrap Ausführung: 2.0

    • RDMA-Core-Version: 59.

  • AL2023 (x86_64):

    • Linux-Kernelversion: 6.1

    • Glibc-Version: 2.34

    • OpenSSL-Version: 3.2.2

    • FSx Lustre-Client-Version: 2.15.6

    • Runc-Version: 1.3.3

    • Container-Version: enthaltenes Github. com/containerd/containerd 1,7,27

    • als Neuronx DMS-Version: 2.24.7.0

    • NVIDIA-Treiberversion: 580.95.05

    • CUDA-Version: 12.8

    • ENA-Treiberversion: 2.15.0g

    • Python-Version: 3.9.24

    • Kubernetes-Version: v1.32.9-eks-113cf36

    • Version für iptables-Dienste: 1.8.8

    • Nginx-Version: 1.28.0

    • nvme-cli-Version: 2.13 1.13

    • Stress-Version: 1.0.7

    • gesammelte Version: 5.12.0.

    • ACL-Version: 2.3.1

    • Lustre-Client-Version: 2.15.6

    • Systemd-Version: 252

    • OpenSSH-Version: 8.7

    • Sudo-Version: 1.9.15

    • GCC-Version: 11.5.0

    • cmake-Version: 3.22.2

    • Git-Version: 2.50.1

    • Version erstellen: 4.3

    • Cloudwatch-Agent-Version: 1.300060.1

    • NFS-Utils-Version: 2.5.4

    • LVM2-Version: 2.03.16

    • ec2-Instance-Connect-Version: 1.1

    • aws-cfn-bootstrap Ausführung: 2.0

    • RDMA-Core-Version: 59.

  • AL2203 (): ARM64

    • Linux-Kernelversion: 6.12

    • Glibc-Version: 2.34

    • OpenSSL-Version: 3.2.2

    • FSx Lustre-Client-Version: 2.15.6

    • Runc-Version: 1.3.3

    • Container-Version: enthaltenes Github. com/containerd/containerd 1,7,27

    • NVIDIA-Treiberversion: 580.95.05

    • CUDA-Version: 12.8

    • ENA-Treiberversion: 2.15.0g

    • Python-Version: 3.9.24

    • Kubernetes-Version: v1.32.9-eks-113cf36

    • Version für iptables-Dienste: 1.8.8

    • Nginx-Version: 1.28.0

    • nvme-cli-Version: 2.13 1.13

    • Stress-Version: 1.0.7

    • gesammelte Version: 5.12.0.

    • ACL-Version: 2.3.1

    • Lustre-Client-Version: 2.15.6

    • nvidia-imex-Version: 580.95.05

    • Systemd-Version: 252

    • OpenSSH-Version: 8.7

    • Sudo-Version: 1.9.15

    • GCC-Version: 11.5.0

    • cmake-Version: 3.22.2

    • Git-Version: 2.50.1

    • Version erstellen: 4.3

    • Cloudwatch-Agent-Version: 1.300060.1

    • NFS-Utils-Version: 2.5.4

    • LVM2-Version: 2.03.16

    • ec2-Instance-Connect-Version: 1.1

    • aws-cfn-bootstrap Ausführung: 2.0

    • RDMA-Core-Version: 58.

Kubernetes v1.33
  • AL2023 (x86_64):

    • Linux-Kernelversion: 6.1

    • Glibc-Version: 2.34

    • OpenSSL-Version: 3.2.2

    • FSx Lustre-Client-Version: 2.15.6

    • Runc-Version: 1.3.3

    • Container-Version: enthaltenes Github. com/containerd/containerd 1,7,27

    • als Neuronx DMS-Version: 2.24.7.0

    • NVIDIA-Treiberversion: 580.95.05

    • CUDA-Version: 12.8

    • ENA-Treiberversion: 2.15.0g

    • Python-Version: 3.9.24

    • Kubernetes-Version: v1.33.5-eks-113cf36

    • Version für iptables-Dienste: 1.8.8

    • Nginx-Version: 1.28.0

    • nvme-cli-Version: 2.13 1.13

    • Stress-Version: 1.0.7

    • gesammelte Version: 5.12.0.

    • ACL-Version: 2.3.1

    • Lustre-Client-Version: 2.15.6

    • Systemd-Version: 252

    • OpenSSH-Version: 8.7

    • Sudo-Version: 1.9.15

    • GCC-Version: 11.5.0

    • cmake-Version: 3.22.2

    • Git-Version: 2.50.1

    • Version erstellen: 4.3

    • Cloudwatch-Agent-Version: 1.300060.1

    • NFS-Utils-Version: 2.5.4

    • LVM2-Version: 2.03.16

    • ec2-Instance-Connect-Version: 1.1

    • aws-cfn-bootstrap Ausführung: 2.0

    • RDMA-Core-Version: 59.

  • AL2203 (): ARM64

    • Linux-Kernelversion: 6.12

    • Glibc-Version: 2.34

    • OpenSSL-Version: 3.2.2

    • FSx Lustre-Client-Version: 2.15.6

    • Runc-Version: 1.3.3

    • Container-Version: enthaltenes Github. com/containerd/containerd 1,7,27

    • NVIDIA-Treiberversion: 580.95.05

    • CUDA-Version: 12.8

    • ENA-Treiberversion: 2.15.0g

    • Python-Version: 3.9.24

    • Kubernetes-Version: v1.33.5-eks-113cf36

    • Version für iptables-Dienste: 1.8.8

    • Nginx-Version: 1.28.0

    • nvme-cli-Version: 2.13 1.13

    • Stress-Version: 1.0.7

    • gesammelte Version: 5.12.0.

    • ACL-Version: 2.3.1

    • Lustre-Client-Version: 2.15.6

    • nvidia-imex-Version: 580.95.05

    • Systemd-Version: 252

    • OpenSSH-Version: 8.7

    • Sudo-Version: 1.9.15

    • GCC-Version: 11.5.0

    • cmake-Version: 3.22.2

    • Git-Version: 2.50.1

    • Version erstellen: 4.3

    • Cloudwatch-Agent-Version: 1.300060.1

    • NFS-Utils-Version: 2.5.4

    • LVM2-Version: 2.03.16

    • ec2-Instance-Connect-Version: 1.1

    • aws-cfn-bootstrap Ausführung: 2.0

    • RDMA-Core-Version: 58.

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 07. November 2025

Allgemeine AMI-Updates

SageMaker HyperPod Unterstützung für DLAMI für Amazon EKS

Diese Veröffentlichung umfasst folgende Updates:

Kubernetes v1.28
  • Amazon Linux 2 ist jetzt veraltet. Kubernetes AMI basiert auf AL2 023.

  • AL2 (x86_64):

    • NVIDIA-Treiberversion: 570.195.03

    • CUDA-Version: 12.8

    • Kubernetes-Version: 1.28.15

  • AL2023 (x86_64):

    • NVIDIA-Treiberversion: 580.95.05

    • CUDA-Version: 13.0

    • Kubernetes-Version: 1.28.15

  • Zu den Paket-Updates gehören Boto3-, Botocore-, Pip-, Regex-, Psutil- und Nvidia-Container-Toolkit-Komponenten.

  • Paket hinzugefügt: annotated-doc 0.0.3

Kubernetes v1.29
  • Amazon Linux 2 ist jetzt veraltet. Kubernetes AMI basiert auf AL2 023.

  • AL2 (x86_64):

    • NVIDIA-Treiberversion: 570.195.03

    • CUDA-Version: 12.8

    • Kubernetes-Version: 1.29.15

  • AL2023 (x86_64):

    • NVIDIA-Treiberversion: 580.95.05

    • CUDA-Version: 13.0

    • Kubernetes-Version: 1.29.15

  • Zu den Paket-Updates gehören Kernel-Updates, Glibc-Updates und verschiedene Systembibliotheken.

  • Paket hinzugefügt: annotated-doc 0.0.3

Kubernetes v1.30
  • Amazon Linux 2 ist jetzt veraltet. Kubernetes AMI basiert auf AL2 023.

  • AL2 (x86_64):

    • NVIDIA-Treiberversion: 570.195.03

    • CUDA-Version: 12.8

    • Kubernetes-Version: 1.30.11

  • AL2023 (x86_64):

    • NVIDIA-Treiberversion: 580.95.05

    • CUDA-Version: 13.0

    • Kubernetes-Version: 1.30.11

  • Zu den Paket-Updates gehören Kernel-Livepatch-Updates und Systembibliotheksupdates.

  • Paket hinzugefügt: annotated-doc 0.0.3

Kubernetes v1.31
  • Amazon Linux 2 ist jetzt veraltet. Kubernetes AMI basiert auf AL2 023.

  • AL2 (x86_64):

    • NVIDIA-Treiberversion: 570.195.03

    • CUDA-Version: 12.8

    • Kubernetes-Version: 1.31.7

  • AL2023 (x86_64):

    • NVIDIA-Treiberversion: 580.95.05

    • CUDA-Version: 13.0

    • Kubernetes-Version: 1.31.13

  • AL2023 (Arm):

    • NVIDIA-Treiberversion: 580.95.05

    • CUDA-Version: 13.0

    • Kubernetes-Version: 1.31.13

    • Kernelversion: 6.12.46-66.121.amzn2023.aarch64

  • Zu den Paket-Updates gehören umfangreiche Systembibliotheksupdates, Kernel-Updates und Boost-Bibliotheksupdates.

  • Pakete hinzugefügt: apr-util-lmdb, kernel-livepatch-6.1.156-177.286

Kubernetes v1.32
  • Amazon Linux 2 ist jetzt veraltet. Kubernetes AMI basiert auf AL2 023.

  • AL2 (x86_64):

    • NVIDIA-Treiberversion: 570.195.03

    • CUDA-Version: 12.8

    • Kubernetes-Version: 1.32.3

    • AWSIAM-Authentifikator-Version: v0.6.29

  • AL2023 (x86_64):

    • NVIDIA-Treiberversion: 580.95.05

    • CUDA-Version: 13.0

    • Kubernetes-Version: 1.32.9

  • AL2203 (arm):

    • NVIDIA-Treiberversion: 580.95.05

    • CUDA-Version: 13.0

    • Kubernetes-Version: 1.32.9

    • Kernelversion: 6.12.46-66.121.amzn2023.aarch64

  • Zu den Paket-Updates gehören Kernel-Livepatch-Updates und Systembibliotheksupdates.

  • Paket hinzugefügt: annotated-doc 0.0.3

Kubernetes v1.33
  • AL2023 (x86_64):

    • NVIDIA-Treiberversion: 580.95.05

    • CUDA-Version: 13.0

    • Kubernetes-Version: 1.33.5

    • Kernelversion: 6.1.155-176.282.amzn2023.x86_64

  • AL2023 (Arm):

    • NVIDIA-Treiberversion: 580.95.05

    • CUDA-Version: 13.0

    • Kubernetes-Version: 1.33.5

    • Kernelversion: 6.12.46-66.121.amzn2023.aarch64

  • Zu den Paket-Updates gehören umfangreiche Systembibliotheksupdates, Kernel-Updates und Boost-Bibliotheksupdates.

  • Hinzugefügte Pakete: apr-util-lmdb, Kernel-Livepatch-Updates

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 29. Oktober 2025

Allgemeine AMI-Updates

SageMaker HyperPod Unterstützung für DLAMI für Amazon EKS

Diese Veröffentlichung umfasst folgende Updates:

Kubernetes v1.28
  • Amazon Linux 2 ist jetzt veraltet. Kubernetes AMI basiert auf AL2 023.

  • AL2 (x86_64):

    • NVIDIA-Treiberversion: 570.195.03

    • CUDA-Version: 12.8

    • Kubernetes-Version: 1.28.15

  • AL2023 (x86_64):

    • NVIDIA-Treiberversion: 580.95.05

    • CUDA-Version: 13.0

    • Kubernetes-Version: 1.28.15

  • Zu den Paket-Updates gehören Boto3-, Botocore-, Pip-, Regex-, Psutil- und Nvidia-Container-Toolkit-Komponenten.

  • Paket hinzugefügt: annotated-doc 0.0.3

Kubernetes v1.29
  • Amazon Linux 2 ist jetzt veraltet. Kubernetes AMI basiert auf AL2 023.

  • AL2 (x86_64):

    • NVIDIA-Treiberversion: 570.195.03

    • CUDA-Version: 12.8

    • Kubernetes-Version: 1.29.15

  • AL2023 (x86_64):

    • NVIDIA-Treiberversion: 580.95.05

    • CUDA-Version: 13.0

    • Kubernetes-Version: 1.29.15

  • Zu den Paket-Updates gehören Kernel-Updates, Glibc-Updates und verschiedene Systembibliotheken.

  • Paket hinzugefügt: annotated-doc 0.0.3

Kubernetes v1.30
  • Amazon Linux 2 ist jetzt veraltet. Kubernetes AMI basiert auf AL2 023.

  • AL2 (x86_64):

    • NVIDIA-Treiberversion: 570.195.03

    • CUDA-Version: 12.8

    • Kubernetes-Version: 1.30.11

  • AL2023 (x86_64):

    • NVIDIA-Treiberversion: 580.95.05

    • CUDA-Version: 13.0

    • Kubernetes-Version: 1.30.11

  • Zu den Paket-Updates gehören Kernel-Livepatch-Updates und Systembibliotheksupdates.

  • Paket hinzugefügt: annotated-doc 0.0.3

Kubernetes v1.31
  • Amazon Linux 2 ist jetzt veraltet. Kubernetes AMI basiert auf AL2 023.

  • AL2 (x86_64):

    • NVIDIA-Treiberversion: 570.195.03

    • CUDA-Version: 12.8

    • Kubernetes-Version: 1.31.7

  • AL2023 (x86_64):

    • NVIDIA-Treiberversion: 580.95.05

    • CUDA-Version: 13.0

    • Kubernetes-Version: 1.31.13

  • AL2023 (Arm):

    • NVIDIA-Treiberversion: 580.95.05

    • CUDA-Version: 13.0

    • Kubernetes-Version: 1.31.13

    • Kernelversion: 6.12.46-66.121.amzn2023.aarch64

  • Zu den Paket-Updates gehören umfangreiche Systembibliotheksupdates, Kernel-Updates und Boost-Bibliotheksupdates.

  • Pakete hinzugefügt: apr-util-lmdb, kernel-livepatch-6.1.156-177.286

Kubernetes v1.32
  • Amazon Linux 2 ist jetzt veraltet. Kubernetes AMI basiert auf AL2 023.

  • AL2 (x86_64):

    • NVIDIA-Treiberversion: 570.195.03

    • CUDA-Version: 12.8

    • Kubernetes-Version: 1.32.3

  • AL2023 (x86_64):

    • NVIDIA-Treiberversion: 580.95.05

    • CUDA-Version: 13.0

    • Kubernetes-Version: 1.32.9

  • AL2203 (arm):

    • NVIDIA-Treiberversion: 580.95.05

    • CUDA-Version: 13.0

    • Kubernetes-Version: 1.32.9

    • Kernelversion: 6.12.46-66.121.amzn2023.aarch64

  • Zu den Paket-Updates gehören Kernel-Livepatch-Updates und Systembibliotheksupdates.

  • Paket hinzugefügt: annotated-doc 0.0.3

Kubernetes v1.33
  • AL2023 (x86_64):

    • NVIDIA-Treiberversion: 580.95.05

    • CUDA-Version: 13.0

    • Kubernetes-Version: 1.33.5

    • Kernelversion: 6.1.155-176.282.amzn2023.x86_64

  • AL2023 (Arm):

    • NVIDIA-Treiberversion: 580.95.05

    • CUDA-Version: 13.0

    • Kubernetes-Version: 1.33.5

    • Kernelversion: 6.12.46-66.121.amzn2023.aarch64

  • Zu den Paket-Updates gehören umfangreiche Systembibliotheksupdates, Kernel-Updates und Boost-Bibliotheksupdates.

  • Hinzugefügte Pakete: apr-util-lmdb, Kernel-Livepatch-Updates

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 22. Oktober 2025

AL2x86

Anmerkung

Amazon Linux 2 ist jetzt veraltet. Das Kubernetes-AMI basiert auf AL2 023.

Die Basisversion von DLAMI ist hier verfügbar.

  • EKS-Versionen 1.28 — 1.32

  • Diese Version enthält CVE-Patches für die betroffenen NVIDIA-Treiberpakete, die im Nvidia Security Bulletin vom Oktober zu finden sind.

  • NVIDIA SMI

    NVIDIA-SMI 570.195.03 Driver Version: 570.195.03 CUDA Version: 12.8
  • Hauptversionen

    Name des Pakets version
    framework_version 70
    gdr_kopieren 2.4.1
    unterstützte_ec2_Instanzen G4dn, G5, G6, G6, G6e, P4d, P4de, P5, P5e, P5en
    efa_version 1.43.3
    ebs_volume_type gp3
    nvidia_driver 570.195.03
    python_Ort /3,10 usr/bin/python
    nvidia_cuda_stack /-12,4 usr/local/cuda-12.1,/usr/local/cuda-12.2,/usr/local/cuda-12.3,/usr/local/cuda
    ssm_agent_version 3.3.3050.0
    Kernelversion 5.10.244-240.965.amzn2.x86_64
    Nvidia_Container-Toolkit-Version 1.17.8
    ofi_nccl_version 1.16.3
    betriebssystem_ Amazon Linux 2
    default_cuda /-12,1/ usr/local/cuda
    compute_architecture x86_64
  • Hinzugefügte Pakete: In dieser Version wurden keine Pakete hinzugefügt.

  • Aktualisierte Pakete

    Name des Pakets vorherige Version neue Version
    boto3 1.40.46 1,40,49
    botocore 1,40,46 1,40,49
    Fastapi 0,118,0 0,1118,2
    Dateisperre 3.19.1 3.20,0
    lib_metadata importieren 8.7.0 8.0.0
    jaraco.context 6.0.1 5.3.0
    jaraco.functools 4.3.0 4.0.1
    Matplotlib 3.10.6 3.10,7
    Paketerstellung 25 24,2
    Plattformverzeichnisse 4.4.0 4.5.0
    Propcache 0.4.0 0.4.1
    reich 14.1.0 14,2,0
    Tomli 2.2.1 2.3.0
    types-python-dateutil 2.9.0.20250822 2.9.0.20251008
    virtualenv 20,34,0 20,35,1
    Websocket-Client 1.8.0 1.9.0
  • Entfernte Pakete: In dieser Version wurden keine Pakete entfernt.

AL20.23x86

Die Basisversion von DLAMI ist hier verfügbar.

  • EKS-Versionen 1.28 — 1.32. Keine Veröffentlichung für EKS-Version 1.33.

  • Diese Version enthält CVE-Patches für die betroffenen NVIDIA-Treiberpakete, die im Nvidia Security Bulletin vom Oktober zu finden sind.

  • NVIDIA SMI

    NVIDIA-SMI 580.95.05 Driver Version: 580.95.05 CUDA Version: 13.0
  • Hauptversionen

    Name des Pakets version
    gdr_copy 2.5.1
    unterstützte_ec2_Instanzen G4dn, G5, G6, G6, G6e, P4d, P4de, P5, P5e, P5en, P6-B200
    efa_version 1.43.3
    ebs_volume_type gp3
    nvidia_gds-Version 1.15.0.42
    nvidia_driver 580.95.05
    python_Ort /3.9 usr/bin/python
    nvidia_cuda_stack /-13,0 usr/local/cuda-12.6,/usr/local/cuda-12.8,/usr/local/cuda-12.9,/usr/local/cuda
    ssm_agent_version 3.3.3050.0
    Kernelversion 6.1.153-175.280.amzn2023.x86_64
    Nvidia_Container-Toolkit-Version 1.17.8
    dcgm-Version 4.4.1
    ofi_nccl_version 1.16.3
    betriebssystem_ Amazon Linux 2023.9.20250929
    default_cuda /-12,9/ usr/local/cuda
    compute_architecture x86_64
  • Hinzugefügte Pakete: In dieser Version wurden keine Pakete hinzugefügt.

  • Aktualisierte Pakete

    Name des Pakets vorherige Version neue Version
    boto3 1.40.46 1,40,49
    botocore 1,40,46 1,40,49
    Fastapi 0,118,0 0,1118,2
    GDR-Kopie 2,5-1 2,5.1-1
    Gdrcopy-Stufe 2,5-1 2,5.1-1
    gdrcopy-kmod 2,5-1 dkms 2,5.1-1 dkms
    jaraco.context 6.0.1 5.3.0
    jaraco.functools 4.3.0 4.0.1
    weitere Iter-Tools 10.8.0 10.3.0
    Paketerstellung 25 24,2
    Propcache 0.4.0 0.4.1
    pydantisch 2.11.10 2.12.0
    pydantischer Kern 2,33,2 2,41,1
    reich 14.1.0 14,2,0
    types-python-dateutil 2.9.0.20250822 2.9.0.20251008
    Erweiterungen eingeben 4.12.2 4.15,0
    virtualenv 20,34,0 20,35,1
    Websocket-Client 1.8.0 1.9.0
  • Entfernte Pakete: In dieser Version wurden keine Pakete entfernt.

AL2023 ARM64

Die Basisversion von DLAMI ist hier verfügbar.

  • EKS-Versionen 1.31 bis 1.33.

  • Diese Version enthält CVE-Patches für die betroffenen NVIDIA-Treiberpakete, die im Nvidia Security Bulletin vom Oktober zu finden sind.

  • NVIDIA SMI

    NVIDIA-SMI 580.95.05 Driver Version: 580.95.05 CUDA Version: 13.0
  • Hauptversionen

    Name des Pakets version
    gdr_copy 2.5
    unterstützte_ec2_Instanzen G5g, P6e-00 GB2
    efa_version 1.43.3
    ebs_volume_type gp3
    nvidia_driver 580.95.05
    python_Ort /3.9 usr/bin/python
    nvidia_cuda_stack /-13,0 usr/local/cuda-12.6,/usr/local/cuda-12.8,/usr/local/cuda-12.9,/usr/local/cuda
    ssm_agent_version 3.3.3050.0
    Kernelversion 6.12.46-66.121.amzn2023.aarch64
    Version des nvidia_container_toolkit_ 1.17.8
    dcgm-Version 4.4.1
    ofi_nccl_version 1.16.3
    betriebssystem_ Amazon Linux 2023.9.20250929
    default_cuda /-12,9/ usr/local/cuda
    compute_architecture aarch64
  • Hinzugefügte Pakete: In dieser Version wurden keine Pakete hinzugefügt.

  • Aktualisierte Pakete

    Name des Pakets vorherige Version neue Version
    aiohttp 3.12.15 3.13,0
    attrs 25.3.0 25,4,0
    boto3 1,40,45 1,40,49
    botocore 1,40,45 1,40,49
    Katzen 25.2.0 25,3,0
    zertifizieren 2025.8.3 2025,1,5
    efa 2.17.2-1.amzn2023 2.17.3-1. amzn2023
    schnelle API 0,118,0 0,1118,2
    eingefrorene Liste 1.7.0 1.8.0
    lib_metadata importieren 8.7.0 8.0.0
    jaraco.context 5.3.0 6.0.1
    multidikt 6.6.4 6.7.0
    Narwale 2.6.0 2.7.0
    nh3 0.3.0 0.3.1
    Propcache 0.3.2 0.4.1
    pydantisch 2.11.9 2.12.0
    pydantischer Kern 2,33,2 2,41,1
    Pylint 3.3.8 3.3.9
    python-json-logger 3.3.0 4.0.0
    reich 14.1.0 14,2,0
    Tomli 2.2.1 2.0.1
    types-python-dateutil 2.9.0.20250822 2.9.0.20251008
    virtualenv 20,34,0 20,35,1
    Websocket-Client 1.8.0 1.9.0
    Mädchen 1.20.1 1.22.0
    Reißverschluss 3.19.2 3,23,0
  • Entfernte Pakete: In dieser Version wurden keine Pakete entfernt.

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 29. September 2025

Allgemeine AMI-Updates

  • Das neue SageMaker HyperPod AMI für Amazon EKS 1.33 wurde veröffentlicht. Weitere Informationen finden Sie unter SageMaker HyperPod AMI-Versionen für Amazon EKS: 29. September 2025.

    Wichtig
    • Die Beta-Kubernetes-API für dynamische Ressourcenzuweisung ist in dieser Version standardmäßig aktiviert.

      • Diese API verbessert die Planung und Überwachung von Workloads, die Ressourcen erfordern, wie z. GPUs

      • Diese API wurde von der Open-Source-Kubernetes-Community entwickelt und könnte sich in future Versionen von Kubernetes ändern. Bevor Sie die API verwenden, sollten Sie die Kubernetes-Dokumentation lesen und sich darüber informieren, wie sie sich auf Ihre Workloads auswirkt.

    • HyperPod veröffentlicht kein HyperPod Amazon Linux 2-AMI für Kubernetes 1.33. AWSempfiehlt, auf Version 023 zu migrieren. AL2 Weitere Informationen finden Sie unter Upgrade von Amazon Linux 2 auf Version AL2 023.

Weitere Informationen finden Sie unter Kubernetes v1.33.

SageMaker HyperPod Unterstützung für DLAMI für Amazon EKS

Diese Veröffentlichung umfasst folgende Updates:

Kubernetes v1.28
  • Amazon Linux 2 ist jetzt veraltet. Kubernetes AMI basiert auf AL2 023.

  • NVIDIA SMI:

    • NVIDIA-Treiberversion: 570.172.08

    • CUDA-Version: 12.8

  • Pakete:

    • Sprachen und Kernbibliotheken:

      • GCC: 11.5.0-5.amzn2023.0.5

      • GCC 14:14.2.1-7.amzn2023.0.1

      • Java: 17.016+8-1.amzn2023.1

      • Perl: 5.32.1-477.amzn2023.0.7

      • Python: 3.9.23-1.amzn2023.0.3

      • Gehe zu: 3.2.0-37.amzn2023

      • Rost: 1.89.0-1.amzn2023.0.2

    • Kernbibliotheken:

      • GLibc: 2.34-196.amzn2023.0.1

      • OpenSSL: 3.2.2-1.amzn2023.0.1

      • Zlib: 1.2.11-33.amzn2023.0.5

      • XZ-Dienstprogramme: 5.2.5-9.amzn2023.0.2

      • Util-Linux: 2.37.4-1.amzn2023.0.4

    • Neuron:

      • aws-neuronx-dkms: 2.23.9.0-dkms

      • aws-neuronx-tools: 2,25,145,0-1

    • EFA:

      • efa-Treiber: 2.17.2-1.amzn2023

      • efa-Konfiguration: 1.18-1.amzn2023

      • Version von efa nv: 1.2.2-1.amzn2023

      • efa-Profil: 1.7-1.amzn2023

    • Kernel:

      • Kernel: 6.1.148-173.267.amzn2023

      • Kernel-Entwicklung: 6.1.148-173.267.amzn2023

      • Kernel-Header: 6.1.148-173.267.amzn2023

      • Kernel-Tools: 6.1.148-173.267.amzn2023

      • Zusätzliche Kernel-Module: 6.1.148-173.267.amzn2023

      • Kernel-Live-Patch: 1.0-0.amzn2023

    • Nvidia:

      • Nvidia-Container-Toolkit: 1.17.8-1

      • Basis des Nvidia-Container-Toolkits: 1.17.8-1

      • libnvidia-container: 1.17.8-1 (mit Tools)

      • NVIDIA Fabric Manager: 570.172.08-1

      • libnvidia-nscq: 570.172.08-1

Kubernetes v1.29
  • Amazon Linux 2 ist jetzt veraltet. Kubernetes AMI basiert auf AL2 023.

  • NVIDIA SMI:

    • NVIDIA-Treiberversion: 570.172.08

    • CUDA-Version: 12.8

  • Pakete:

    • Sprachen und Kernbibliotheken:

      • GCC: 11.5.0-5.amzn2023.0.5

      • GCC 14:14.2.1-7.amzn2023.0.1

      • Java: 17.016+8-1.amzn2023.1

      • Perl: 5.32.1-477.amzn2023.0.7

      • Python: 3.9.23-1.amzn2023.0.3

      • Gehe zu: 3.2.0-37.amzn2023

      • Rost: 1.89.0-1.amzn2023.0.2

    • Kernbibliotheken:

      • GLibc: 2.34-196.amzn2023.0.1

      • OpenSSL: 3.2.2-1.amzn2023.0.1

      • Zlib: 1.2.11-33.amzn2023.0.5

      • XZ-Dienstprogramme: 5.2.5-9.amzn2023.0.2

      • Util-Linux: 2.37.4-1.amzn2023.0.4

    • Neuron:

      • aws-neuronx-dkms: 2.23.9.0-dkms

      • aws-neuronx-tools: 2,25,145,0-1

    • EFA:

      • efa-Treiber: 2.17.2-1.amzn2023

      • efa-Konfiguration: 1.18-1.amzn2023

      • Version von efa nv: 1.2.2-1.amzn2023

      • efa-Profil: 1.7-1.amzn2023

    • Kernel:

      • Kernel: 6.1.148-173.267.amzn2023

      • Kernel-Entwicklung: 6.1.148-173.267.amzn2023

      • Kernel-Header: 6.1.148-173.267.amzn2023

      • Kernel-Tools: 6.1.148-173.267.amzn2023

      • Zusätzliche Kernel-Module: 6.1.148-173.267.amzn2023

      • Kernel-Live-Patch: 1.0-0.amzn2023

    • Nvidia:

      • Nvidia-Container-Toolkit: 1.17.8-1

      • Basis des Nvidia-Container-Toolkits: 1.17.8-1

      • libnvidia-container: 1.17.8-1 (mit Tools)

      • NVIDIA Fabric Manager: 570.172.08-1

      • libnvidia-nscq: 570.172.08-1

Kubernetes v1.30
  • Amazon Linux 2 ist jetzt veraltet. Kubernetes AMI basiert auf AL2 023.

  • NVIDIA SMI:

    • NVIDIA-Treiberversion: 570.172.08

    • CUDA-Version: 12.8

  • Pakete:

    • Sprachen und Kernbibliotheken:

      • GCC: 11.5.0-5.amzn2023.0.5

      • GCC 14:14.2.1-7.amzn2023.0.1

      • Java: 17.016+8-1.amzn2023.1

      • Perl: 5.32.1-477.amzn2023.0.7

      • Python: 3.9.23-1.amzn2023.0.3

      • Gehe zu: 3.2.0-37.amzn2023

      • Rost: 1.89.0-1.amzn2023.0.2

    • Kernbibliotheken:

      • GLibc: 2.34-196.amzn2023.0.1

      • OpenSSL: 3.2.2-1.amzn2023.0.1

      • Zlib: 1.2.11-33.amzn2023.0.5

      • XZ-Dienstprogramme: 5.2.5-9.amzn2023.0.2

      • Util-Linux: 2.37.4-1.amzn2023.0.4

    • Neuron:

      • aws-neuronx-dkms: 2.23.9.0-dkms

      • aws-neuronx-tools: 2,25,145,0-1

    • EFA:

      • efa-Treiber: 2.17.2-1.amzn2023

      • efa-Konfiguration: 1.18-1.amzn2023

      • Version von efa nv: 1.2.2-1.amzn2023

      • efa-Profil: 1.7-1.amzn2023

    • Kernel:

      • Kernel: 6.1.148-173.267.amzn2023

      • Kernel-Entwicklung: 6.1.148-173.267.amzn2023

      • Kernel-Header: 6.1.148-173.267.amzn2023

      • Kernel-Tools: 6.1.148-173.267.amzn2023

      • Zusätzliche Kernel-Module: 6.1.148-173.267.amzn2023

      • Kernel-Live-Patch: 1.0-0.amzn2023

    • Nvidia:

      • Nvidia-Container-Toolkit: 1.17.8-1

      • Basis des Nvidia-Container-Toolkits: 1.17.8-1

      • libnvidia-container: 1.17.8-1 (mit Tools)

      • NVIDIA Fabric Manager: 570.172.08-1

      • libnvidia-nscq: 570.172.08-1

Kubernetes v1.31
  • Amazon Linux 2 ist jetzt veraltet. Kubernetes AMI basiert auf AL2 023.

  • NVIDIA SMI:

    • NVIDIA-Treiberversion: 570.172.08

    • CUDA-Version: 12.8

  • Pakete:

    • Sprachen und Kernbibliotheken:

      • GCC: 11.5.0-5.amzn2023.0.5

      • GCC 14:14.2.1-7.amzn2023.0.1

      • Java: 17.016+8-1.amzn2023.1

      • Perl: 5.32.1-477.amzn2023.0.7

      • Python: 3.9.23-1.amzn2023.0.3

      • Gehe zu: 3.2.0-37.amzn2023

      • Rost: 1.89.0-1.amzn2023.0.2

    • Kernbibliotheken:

      • GLibc: 2.34-196.amzn2023.0.1

      • OpenSSL: 3.2.2-1.amzn2023.0.1

      • Zlib: 1.2.11-33.amzn2023.0.5

      • XZ-Dienstprogramme: 5.2.5-9.amzn2023.0.2

      • Util-Linux: 2.37.4-1.amzn2023.0.4

    • Neuron:

      • aws-neuronx-dkms: 2.23.9.0-dkms

      • aws-neuronx-tools: 2,25,145,0-1

    • EFA:

      • efa-Treiber: 2.17.2-1.amzn2023

      • efa-Konfiguration: 1.18-1.amzn2023

      • Version von efa nv: 1.2.2-1.amzn2023

      • efa-Profil: 1.7-1.amzn2023

    • Kernel:

      • Kernel: 6.1.148-173.267.amzn2023

      • Kernel-Entwicklung: 6.1.148-173.267.amzn2023

      • Kernel-Header: 6.1.148-173.267.amzn2023

      • Kernel-Tools: 6.1.148-173.267.amzn2023

      • Zusätzliche Kernel-Module: 6.1.148-173.267.amzn2023

      • Kernel-Live-Patch: 1.0-0.amzn2023

    • Nvidia:

      • Nvidia-Container-Toolkit: 1.17.8-1

      • Basis des Nvidia-Container-Toolkits: 1.17.8-1

      • libnvidia-container: 1.17.8-1 (mit Tools)

      • NVIDIA Fabric Manager: 570.172.08-1

      • libnvidia-nscq: 570.172.08-1

Kubernetes v1.32
  • Amazon Linux 2 ist jetzt veraltet. Kubernetes AMI basiert auf AL2 023.

  • NVIDIA SMI:

    • NVIDIA-Treiberversion: 570.172.08

    • CUDA-Version: 12.8

  • Pakete:

    • Sprachen und Kernbibliotheken:

      • GCC: 11.5.0-5.amzn2023.0.5

      • GCC 14:14.2.1-7.amzn2023.0.1

      • Java: 17.016+8-1.amzn2023.1

      • Perl: 5.32.1-477.amzn2023.0.7

      • Python: 3.9.23-1.amzn2023.0.3

      • Gehe zu: 3.2.0-37.amzn2023

      • Rost: 1.89.0-1.amzn2023.0.2

    • Kernbibliotheken:

      • GLibc: 2.34-196.amzn2023.0.1

      • OpenSSL: 3.2.2-1.amzn2023.0.1

      • Zlib: 1.2.11-33.amzn2023.0.5

      • XZ-Dienstprogramme: 5.2.5-9.amzn2023.0.2

      • Util-Linux: 2.37.4-1.amzn2023.0.4

    • Neuron:

      • aws-neuronx-dkms: 2.23.9.0-dkms

      • aws-neuronx-tools: 2,25,145,0-1

    • EFA:

      • efa-Treiber: 2.17.2-1.amzn2023

      • efa-Konfiguration: 1.18-1.amzn2023

      • Version von efa nv: 1.2.2-1.amzn2023

      • efa-Profil: 1.7-1.amzn2023

    • Kernel:

      • Kernel: 6.1.148-173.267.amzn2023

      • Kernel-Entwicklung: 6.1.148-173.267.amzn2023

      • Kernel-Header: 6.1.148-173.267.amzn2023

      • Kernel-Tools: 6.1.148-173.267.amzn2023

      • Zusätzliche Kernel-Module: 6.1.148-173.267.amzn2023

      • Kernel-Live-Patch: 1.0-0.amzn2023

    • Nvidia:

      • Nvidia-Container-Toolkit: 1.17.8-1

      • Basis des Nvidia-Container-Toolkits: 1.17.8-1

      • libnvidia-container: 1.17.8-1 (mit Tools)

      • NVIDIA Fabric Manager: 570.172.08-1

      • libnvidia-nscq: 570.172.08-1

Kubernetes v1.33

Die folgende Tabelle enthält Informationen zu den Komponenten in dieser AMI-Version und den entsprechenden Versionen.

component AL2023_x86 AL2023_arm64
EKS v1.33.4 v1.33.4
amazon-ssm-agent 3.3.2299.0-1.amzn2023 3.3.2299,0-1. amzn2023
aws-neuronx-dkms 2.23.9.0-dkms
containerd 1.7.27-1.eks.amzn2023.0.4 1.7.27-1.eks.amzn2023.0.4
efa 2.17.2-1.amzn2023 2.17.2-1. amzn2023
ena 2,14,1 g 2,14,1 g
kernel 6.12.40-64.114.amzn2023
Kernel 6.12 6.12.40-64.114.amzn2023
kmod-nvidia-latest-dkms 570,172,08-1. amzn2023 570,172,08-1.el9
nvidia-container-toolkit 1,17,8-1 1,17,8-1
runc 1.2.6-1.amzn2023.0.1 1.2.6-1.amzn2023.0.1

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 25. August 2025

SageMaker HyperPod Unterstützung für DLAMI für Amazon EKS

Diese Veröffentlichung umfasst folgende Updates:

Kubernetes v1.28

NVIDIA SMI:

  • Nvidia-Treiberversion: 570.172.08

  • CUDA-Version: 12.8

Hinzugefügte Pakete:

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Aktualisierte Pakete:

  • gdk-pixbuf2.x86_64: 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • kernel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libgs.x86_64: 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • microcode_ctl.x86_64: 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64: 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

Entfernte Pakete:

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Geändertes Repository:

  • libnvidia-container-tools.x86_64: cuda-Rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64: cuda-Rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64: cuda-Rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64: cuda-Rhel8-x86_64 → nvidia-container-toolkit

Kubernetes v1.29

NVIDIA SMI:

  • Nvidia-Treiberversion: 570.172.08

  • CUDA-Version: 12.8

Hinzugefügte Pakete:

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Aktualisierte Pakete:

  • gdk-pixbuf2.x86_64: 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • kernel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libgs.x86_64: 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • microcode_ctl.x86_64: 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64: 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

Entfernte Pakete:

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Geändertes Repository:

  • libnvidia-container-tools.x86_64: cuda-Rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64: cuda-Rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64: cuda-Rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64: cuda-Rhel8-x86_64 → nvidia-container-toolkit

Kubernetes v1.30

NVIDIA SMI:

  • Nvidia-Treiberversion: 570.172.08

  • CUDA-Version: 12.8

Hinzugefügte Pakete:

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Aktualisierte Pakete:

  • aws-neuronx-dkms.noarch: 2.22.2.0-dkms → 2.23.9.0-dkms

  • efa.x86_64: 2.15.3-1.amzn2 → 2.17.2-1.amzn2

  • efa-nv-peermem.x86_64:1.2.1-1.amzn2 → 1.2.2-1.amzn2

  • gdk-pixbuf2.x86_64: 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • ibacm.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • infiniband-diags.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • kernel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libfabric-aws.x86_64: 2.1.0amzn3.0-1.amzn2 → 2.1.0amzn5.0-1.amzn2

  • libfabric-aws-devel.x86_64:2.1.0 amzn3.0-1.amzn2 → 2.1.0 amzn5.0-1.amzn2

  • libgs.x86_64: 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • libibumad.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs-core.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs-utils.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libnccl-ofi.x86_64: 1.15.0-1.amzn2 → 1.16.2-1.amzn2

  • librdmacm.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • librdmacm-utils.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • microcode_ctl.x86_64: 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64: 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

  • rdma-core.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • rdma-core-devel.x86_64:57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

Entfernte Pakete:

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Geändertes Repository:

  • libnvidia-container-tools.x86_64: cuda-Rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64: cuda-Rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64: cuda-Rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64: cuda-Rhel8-x86_64 → nvidia-container-toolkit

Kubernetes v1.31

NVIDIA SMI:

  • Nvidia-Treiberversion: 570.172.08

  • CUDA-Version: 12.8

Hinzugefügte Pakete:

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Aktualisierte Pakete:

  • gdk-pixbuf2.x86_64: 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • kernel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libgs.x86_64: 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • microcode_ctl.x86_64: 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64: 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

Entfernte Pakete:

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Geändertes Repository:

  • libnvidia-container-tools.x86_64: cuda-Rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64: cuda-Rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64: cuda-Rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64: cuda-Rhel8-x86_64 → nvidia-container-toolkit

Kubernetes v1.32

NVIDIA SMI:

  • Nvidia-Treiberversion: 570.172.08

  • CUDA-Version: 12.8

Hinzugefügte Pakete:

  • kernel-livepatch-5.10.240-238.955.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Aktualisierte Pakete:

  • aws-neuronx-dkms.noarch: 2.22.2.0-dkms → 2.23.9.0-dkms

  • efa.x86_64: 2.15.3-1.amzn2 → 2.17.2-1.amzn2

  • efa-nv-peermem.x86_64:1.2.1-1.amzn2 → 1.2.2-1.amzn2

  • gdk-pixbuf2.x86_64: 2.36.12-3.amzn2 → 2.36.12-3.amzn2.0.2

  • ibacm.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • infiniband-diags.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • kernel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-devel.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-headers.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • kernel-tools.x86_64: 5.10.239-236.958.amzn2 → 5.10.240-238.955.amzn2

  • libfabric-aws.x86_64: 2.1.0amzn3.0-1.amzn2 → 2.1.0amzn5.0-1.amzn2

  • libfabric-aws-devel.x86_64:2.1.0 amzn3.0-1.amzn2 → 2.1.0 amzn5.0-1.amzn2

  • libgs.x86_64: 9.54.0-9.amzn2.0.11 → 9.54.0-9.amzn2.0.12

  • libibumad.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs-core.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libibverbs-utils.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • libnccl-ofi.x86_64: 1.15.0-1.amzn2 → 1.16.2-1.amzn2

  • librdmacm.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • librdmacm-utils.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • microcode_ctl.x86_64: 2:2.1-47.amzn2.4.24 → 2:2.1-47.amzn2.4.25

  • pam.x86_64: 1.1.8-23.amzn2.0.2 → 1.1.8-23.amzn2.0.4

  • rdma-core.x86_64: 57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

  • rdma-core-devel.x86_64:57.amzn1-1.amzn2.0.2 → 58.amzn0-1.amzn2.0.2

Entfernte Pakete:

  • kernel-livepatch-5.10.239-236.958.x86_64 1.0-0.amzn2 amzn2extra-kernel-5.10

Geändertes Repository:

  • libnvidia-container-tools.x86_64: cuda-Rhel8-x86_64 → nvidia-container-toolkit

  • libnvidia-container1.x86_64: cuda-Rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit.x86_64: cuda-Rhel8-x86_64 → nvidia-container-toolkit

  • nvidia-container-toolkit-base.x86_64: cuda-Rhel8-x86_64 → nvidia-container-toolkit

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 12. August 2025

Das AMI umfasst Folgendes:

  • Unterstützter AWS Service: Amazon EC2

  • Betriebssystem: Amazon Linux 2023

  • Rechenarchitektur: ARM64

  • Die neueste verfügbare Version ist für die folgenden Pakete installiert:

    • Linux-Kernel: 6.12

    • FSx Glanz

    • Docker

    • AWS CLIv2 bei /usr/bin/aws

    • NVIDIA DCGM

    • Nvidia-Container-Toolkit:

      • Befehl Version: nvidia-container-cli -V

    • NVIDIA-Docker2:

      • Befehl Version: nvidia-docker version

    • NVIDIA-IMEX: v570.172.08-1

  • NVIDIA-Treiber: 570.158.01

  • NVIDIA CUDA 12.4, 12.5, 12.6, 12.8 Stapel:

    • Installationsverzeichnisse CUDA, NCCL und cuDDN: /usr/local/cuda-xx.x/

      • Beispiel: /usr/local/cuda-12.8/, /usr/local/cuda-12.8/

    • Kompilierte NCCL-Version:

      • Für das CUDA-Verzeichnis von 12.4, kompilierte NCCL-Version 2.22.3+ .4 CUDA12

      • Für das CUDA-Verzeichnis 12.5, kompilierte NCCL-Version 2.22.3+ .5 CUDA12

      • Für das CUDA-Verzeichnis von 12.6, kompilierte NCCL-Version 2.24.3+ .6 CUDA12

      • Für das CUDA-Verzeichnis von 12.8, kompilierte NCCL-Version 2.27.5+. CUDA12

    • Standard-CUDA: 12.8

      • PATH /usr/local/cuda zeigt auf CUDA 12.8

      • Die folgenden Umgebungsvariablen wurden aktualisiert:

        • LD_LIBRARY_PATHzu haben /usr/local/cuda-12.8/lib:/usr/local/cuda-12.8/lib64:/usr/local/cuda-12.8:/usr/local/cuda-12.8/targets/sbsa-linux/lib:/usr/local/cuda-12.8/nvvm/lib64:/usr/local/cuda-12.8/extras/CUPTI/lib64

        • PATHzu haben /usr/local/cuda-12.8/bin/:/usr/local/cuda-12.8/include/

        • Für jede andere CUDA-Version aktualisieren Sie bitte LD_LIBRARY_PATH entsprechend.

  • EFA-Installationsprogramm: 1.42.0

  • Nvidia GDRCopy: 2.5.1

  • AWSDas OFI NCCL-Plugin wird mit dem EFA-Installationsprogramm geliefert

    • Pfade /opt/amazon/ofi-nccl/lib und /opt/amazon/ofi-nccl/efa werden hinzugefügt. LD_LIBRARY_PATH

  • AWS CLIv2 bei /usr/local/bin/aws

  • EBS-Volumetyp: gp3

  • Python: /usr/bin/python3.9

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 6. August 2025

SageMaker HyperPod Unterstützung für DLAMI für Amazon EKS

Sie AMIs beinhalten die folgenden Updates:

K8s v1.28
  • Neuron-Pakete:

    • aws-neuronx-collectives: 2.27.34.0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23.9.0-dkms

    • aws-neuronx-runtime-lib: 2.27.23.0_8deec4dbf-1

    • aws-neuronx-k8-Erweiterung: 2.27.7.0-1

    • aws-neuronx-k8-Scheduler: 2.27.7.0-1

    • aws-neuronx-tools: 2.25.145.0-1

K8s v1.29
  • Neuron-Pakete:

    • aws-neuronx-collectives: 2,27,34,0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23.9.0-dkms

    • aws-neuronx-runtime-lib: 2.27.23.0_8deec4dbf-1

    • aws-neuronx-k8-Erweiterung: 2.27.7.0-1

    • aws-neuronx-k8-Scheduler: 2.27.7.0-1

    • aws-neuronx-tools: 2.25.145.0-1

K8s v1.30
  • Neuron-Pakete:

    • aws-neuronx-collectives: 2,27,34,0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23.9.0-dkms

    • aws-neuronx-runtime-lib: 2.27.23.0_8deec4dbf-1

    • aws-neuronx-k8-Erweiterung: 2.27.7.0-1

    • aws-neuronx-k8-Scheduler: 2.27.7.0-1

    • aws-neuronx-tools: 2.25.145.0-1

K8s v1.31
  • Neuron-Pakete:

    • aws-neuronx-collectives: 2,27,34,0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23.9.0-dkms

    • aws-neuronx-runtime-lib: 2.27.23.0_8deec4dbf-1

    • aws-neuronx-k8-Erweiterung: 2.27.7.0-1

    • aws-neuronx-k8-Scheduler: 2.27.7.0-1

    • aws-neuronx-tools: 2.25.145.0-1

K8s v1.32
  • Neuron-Pakete:

    • aws-neuronx-collectives: 2,27,34,0_ec8cd5e8b-1

    • aws-neuronx-dkms: 2.23.9.0-dkms

    • aws-neuronx-runtime-lib: 2.27.23.0_8deec4dbf-1

    • aws-neuronx-k8-Erweiterung: 2.27.7.0-1

    • aws-neuronx-k8-Scheduler: 2.27.7.0-1

    • aws-neuronx-tools: 2.25.145.0-1

Wichtig
  • Deep Learning Base OSS Nvidia-Treiber AMI (Amazon Linux 2) Version 70.3

  • Deep-Learning-Base-proprietäres Nvidia-Treiber-AMI (Amazon Linux 2) -AMI 6.8.4

  • Neueste Unterstützung für CUDA 12.8

  • Der Nvidia-Treiber wurde von 570.158.01 auf 570.172.08 aktualisiert, um die im Nvidia-Sicherheitsbulletin für Juli enthaltenen CVE-Probleme zu beheben

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 31. Juli 2025

Amazon unterstützt SageMaker HyperPod jetzt ein neues AMI für Amazon EKS-Cluster, das das Basisbetriebssystem auf Amazon Linux 2023 aktualisiert. Diese Version bietet mehrere Verbesserungen gegenüber Amazon Linux 2 (AL2). HyperPod veröffentlicht AMIs regelmäßig neue Versionen. Wir empfehlen, dass Sie alle Ihre HyperPod Cluster auf den neuesten und sichersten Versionen von ausführen, um Sicherheitslücken AMIs zu schließen und veraltete Software und Bibliotheken auslaufen zu lassen.

Wichtige Upgrades

  • Betriebssystem: Amazon Linux 2023 (aktualisiert von Amazon Linux 2 oder AL2)

  • Package Manager: DNF ist das Standard-Paketverwaltungstool und ersetzt YUM, das in AL2

  • Netzwerkdienst: systemd-networkd verwaltet Netzwerkschnittstellen und ersetzt dhclient ISC, das in verwendet wird AL2

  • Linux-Kernel: Version 6.1, aktualisiert gegenüber dem in verwendeten Kernel AL2

  • Glibc: Version 2.34, aktualisiert von der Version in AL2

  • GCC: Version 11.5.0, aktualisiert von der Version in AL2

  • NFS: Version 1:2.6 .1, aktualisiert von Version 1:1.3 .4 in AL2

  • NVIDIA-Treiber: Version 570.172.08, eine neuere Treiberversion

  • Python: Version 3.9, ersetzt Python 2.7, das in verwendet wurde AL2

  • NVME: Version 1.11.1, eine neuere Version des Treibers NVMe

Vor dem Upgrade

Vor dem Upgrade sollten Sie einige wichtige Dinge wissen. Mit AL2 023 wurden im Vergleich zu mehrere Pakete hinzugefügt, aktualisiert oder entfernt. AL2 Wir empfehlen dringend, dass Sie Ihre Anwendungen mit AL2 023 testen, bevor Sie Ihre Cluster aktualisieren. Eine umfassende Liste aller Paketänderungen in Version AL2 023 finden Sie unter Paketänderungen in Amazon Linux 2023.

Im Folgenden sind einige der wesentlichen Änderungen zwischen AL2 und AL2 023 aufgeführt:

  • Python 3.10: Das wichtigste Update neben dem Betriebssystem ist das Python-Versionsupgrade. Nach dem Upgrade haben Cluster standardmäßig Python 3.10. Obwohl einige verteilte Python-3.8-Training-Workloads möglicherweise mit Python 3.10 kompatibel sind, empfehlen wir dringend, dass Sie Ihre spezifischen Workloads separat testen. Wenn sich die Migration zu Python 3.10 als schwierig erweist, Sie Ihren Cluster dennoch für andere neue Funktionen aktualisieren möchten, können Sie eine ältere Python-Version installieren, indem Sie den Befehl yum install python-xx.x mit Lebenszyklusskripten verwenden, bevor Sie Workloads ausführen. Stellen Sie sicher, dass Sie sowohl Ihre vorhandenen Lebenszyklus-Skripts als auch Ihren Anwendungscode auf Kompatibilität testen.

  • Durchsetzung der NVIDIA-Laufzeit: AL2 023 erzwingt strikt die Laufzeitanforderungen für NVIDIA-Container, was dazu führt, dass Container mit hartcodierten NVIDIA-Umgebungsvariablen (wieNVIDIA_VISIBLE_DEVICES: "all") auf reinen CPU-Knoten fehlschlagen (während diese Einstellungen AL2 ignoriert werden, wenn keine GPU-Treiber vorhanden sind). Sie können die Durchsetzung außer Kraft setzen, indem Sie sie NVIDIA_VISIBLE_DEVICES: "void" in Ihrer Pod-Spezifikation festlegen oder indem Sie reine CPU-Images verwenden.

  • cgroup v2: AL2 023 bietet die nächste Generation einheitlicher Kontrollgruppenhierarchien (cgroup v2). cgroup v2 wird für Container-Laufzeiten verwendet und wird auch von verwendet. systemd AL2023 enthält zwar immer noch Code, mit dem das System mithilfe von cgroup v1 ausgeführt werden kann, dies ist jedoch keine empfohlene Konfiguration.

  • Amazon VPC CNI und eksctl Versionen: AL2 023 erfordert außerdem, dass Ihre Amazon VPC CNI-Version 1.16.2 oder höher und Ihre eksctl Version 0.176.0 oder höher ist.

  • EFA on FSx for Lustre: Sie können EFA on FSx für Lustre jetzt verwenden, wodurch Sie eine Anwendungsleistung erzielen können, die mit lokalen Clustern AI/ML oder HPC-Clustern (High Performance Computing) vergleichbar ist, und gleichzeitig von der Skalierbarkeit, Flexibilität und Elastizität von Cloud Computing profitieren.

Für ein Upgrade auf Version AL2 023 ist außerdem eine Mindestversion 1.0.643.0_1.0.192.0 von Health Monitoring Agent erforderlich. Führen Sie das folgende Verfahren durch, um den Health Monitoring Agent zu aktualisieren:

  1. Wenn Sie HyperPod Lifecycle-Skripts aus dem GitHub Repository verwenden awsome-distributed-training, stellen Sie sicher, dass Sie die neueste Version abrufen. Frühere Versionen sind nicht mit AL2 023 kompatibel. Das neue Lifecycle-Skript stellt sicher, dass der zusätzliche bereitgestellte Speicher für das Abrufen von Container-Images in AL2 023 containerd verwendet wird.

  2. Rufen Sie die neueste Version des HyperPod CLI-Git-Repositorys auf.

  3. Aktualisieren Sie Abhängigkeiten mit dem folgenden Befehl: helm dependencies update helm_chart/HyperPodHelmChart

  4. Wie in Schritt 4 in der README-Datei von erwähnt HyperPodHelmChart, führen Sie den folgenden Befehl aus, um die Version der Abhängigkeiten zu aktualisieren, die auf dem Cluster ausgeführt werden: helm upgrade dependencies helm_chart/HyperPodHelmChart -namespace kube-system

Workloads, die auf aktualisierten EKS-Clustern getestet wurden

Im Folgenden sind einige Anwendungsfälle aufgeführt, in denen das Upgrade getestet wurde:

  • Abwärtskompatibilität: Beliebte verteilte Trainingsjobs, die beinhalten, PyTorch sollten auf dem neuen AMI abwärtskompatibel sein. Da Ihre Workloads jedoch von bestimmten Python- oder Linux-Bibliotheken abhängen können, empfehlen wir, zuerst in einem kleineren Maßstab oder einer Teilmenge von Knoten zu testen, bevor Sie Ihre größeren Cluster aktualisieren.

  • Beschleunigertests: Es wurden Jobs für verschiedene Instance-Typen getestet, wobei sowohl NVIDIA-Beschleuniger (für die P- und G-Instance-Familien) als auch AWS Neuron-Beschleuniger (für Trn-Instances) verwendet wurden.

So aktualisieren Sie Ihr AMI und die zugehörigen Workloads

Sie können mithilfe einer der folgenden Methoden ein Upgrade auf das neue AMI durchführen:

  • Verwenden Sie die Create-Cluster-API, um einen neuen Cluster mit dem neuesten AMI zu erstellen.

  • Verwenden Sie die update-cluster-softwareAPI, um Ihren vorhandenen Cluster zu aktualisieren. Beachten Sie, dass diese Option alle Lebenszyklusskripts erneut ausführt.

Während des Aktualisierungsvorgangs ist der Cluster nicht verfügbar. Wir empfehlen, diese Ausfallzeit einzuplanen und die Trainingslast nach Abschluss des Upgrades von einem vorhandenen Checkpoint aus neu zu starten. Als bewährte Methode empfehlen wir Ihnen, Tests an einem kleineren Cluster durchzuführen, bevor Sie Ihre größeren Cluster aktualisieren.

Wenn der Befehl zum Aktualisieren fehlschlägt, identifizieren Sie zunächst die Fehlerursache. Nehmen Sie bei Fehlern im Lebenszyklus-Skript die erforderlichen Korrekturen an Ihren Skripts vor und versuchen Sie es erneut. Bei allen anderen Problemen, die nicht gelöst werden können, wenden Sie sich an AWS Support.

Fehlerbehebung

Verwenden Sie den folgenden Abschnitt, um bei der Behebung von Problemen zu helfen, die beim Upgrade auf Version AL2 023 auftreten.

Wie behebe ich Fehler, z. B. "nvml error: driver not loaded: unknown" auf Clusterknoten, die nur mit CPUs arbeiten?

Wenn Container, die auf AL2 CPU-Amazon-EKS-Knoten funktionierten, jetzt auf AL2 023 fehlschlagen, enthält Ihr Container-Image möglicherweise hartcodierte NVIDIA-Umgebungsvariablen. Sie können mit dem folgenden Befehl nach fest codierten Umgebungsvariablen suchen:

docker inspect image:tag | grep -i nvidia

AL2023 setzt diese Anforderungen strikt durch, während es bei reinen CPU-Knoten milder AL2 war. Eine Lösung besteht darin, die AL2 023-Erzwingung zu überschreiben, indem Sie bestimmte NVIDIA-Umgebungsvariablen in Ihrer Amazon EKS-Pod-Spezifikation festlegen, wie im folgenden Beispiel gezeigt:

yaml containers: - name: your-container image: your-image:tag env: - name: NVIDIA_VISIBLE_DEVICES value: "void" - name: NVIDIA_DRIVER_CAPABILITIES value: ""

Eine weitere Alternative besteht darin, Container-Images (wiepytorch/pytorch:latest-cpu) nur für die CPU zu verwenden oder benutzerdefinierte Images ohne NVIDIA-Abhängigkeiten zu erstellen.

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 15. Juli 2025

SageMaker HyperPod Unterstützung für DLAMI für Amazon EKS

Sie AMIs beinhalten die folgenden Updates:

K8s v1.28
  • Neuester NVIDIA-Treiber: 550.163.01

  • Standard-CUDA: 12.4

  • EFA-Installationsprogramm: 1.38.0

  • Neuron-Pakete:

    • aws-neuronx-dkms.noarch: 2.22.2.0-dkms

    • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

    • aws-neuronx-tools.x86_64:2.18.3.0-1

    • aws-neuron-dkms.noarch: 2.3.26.0-dkms

    • aws-neuron-k8-plugin.x86_64: 1.9.3.0-1

    • aws-neuron-k8-Scheduler.x86_64: 1.9.3.0-1

    • aws-neuron-runtime.x86_64: 1.6.24.0-1

    • aws-neuron-runtime-base.x86_64: 1.6.21.0-1

    • aws-neuron-tools.x86_64: 2.1.4.0-1

    • aws-neuronx-collectives.x86_64:2,26.43.0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64:0.2.3.0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64:0,16,2,0-1

    • aws-neuronx-gpsimd-tools.x86_64:0,16.1.0_0a6506a47-1

    • aws-neuronx-k8-Plugin.x86_64:2.26.26.0-1

    • aws-neuronx-k8-Scheduler.x86_64: 2.26.26.0-1

    • aws-neuronx-runtime-lib.x86_64:2.26.42.0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64:2,24,54,0-1

    • tensorflow-model-server-neuron.x86_64: 2.8.0.2.3.0.0-0

    • tensorflow-model-server-neuronx.x86_64: 2.10.1.2.12.2.0-0

K8s v1.29
  • Nvidia-Treiberversion: 550.163.01

  • CUDA-Version: 12.4

  • EFA-Installationsprogramm: 1.38.0

  • Neuron-Pakete:

    • aws-neuronx-dkms.noarch: 2.22.2.0-dkms

    • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

    • aws-neuronx-tools.x86_64:2.18.3.0-1

    • aws-neuron-dkms.noarch: 2.3.26.0-dkms

    • aws-neuron-k8-plugin.x86_64: 1.9.3.0-1

    • aws-neuron-k8-Scheduler.x86_64: 1.9.3.0-1

    • aws-neuron-runtime.x86_64: 1.6.24.0-1

    • aws-neuron-runtime-base.x86_64: 1.6.21.0-1

    • aws-neuron-tools.x86_64: 2.1.4.0-1

    • aws-neuronx-collectives.x86_64:2,26.43.0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64:0.2.3.0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64:0,16,2,0-1

    • aws-neuronx-gpsimd-tools.x86_64:0,16.1.0_0a6506a47-1

    • aws-neuronx-k8-Plugin.x86_64:2.26.26.0-1

    • aws-neuronx-k8-Scheduler.x86_64: 2.26.26.0-1

    • aws-neuronx-runtime-lib.x86_64:2.26.42.0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64:2,24,54,0-1

    • tensorflow-model-server-neuron.x86_64: 2.8.0.2.3.0.0-0

    • tensorflow-model-server-neuronx.x86_64: 2.10.1.2.12.2.0-0

K8s v1.30
  • Nvidia-Treiberversion: 550.163.01

  • CUDA-Version: 12.4

  • Version des EFA-Installationsprogramms: 1.38.0

  • Neuron-Pakete:

    • aws-neuronx-dkms.noarch: 2.22.2.0-dkms

    • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

    • aws-neuronx-tools.x86_64:2.18.3.0-1

    • aws-neuron-dkms.noarch: 2.3.26.0-dkms

    • aws-neuron-k8-plugin.x86_64: 1.9.3.0-1

    • aws-neuron-k8-Scheduler.x86_64: 1.9.3.0-1

    • aws-neuron-runtime.x86_64: 1.6.24.0-1

    • aws-neuron-runtime-base.x86_64: 1.6.21.0-1

    • aws-neuron-tools.x86_64: 2.1.4.0-1

    • aws-neuronx-collectives.x86_64:2,26.43.0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64:0.2.3.0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64:0,16,2,0-1

    • aws-neuronx-gpsimd-tools.x86_64:0,16.1.0_0a6506a47-1

    • aws-neuronx-k8-Plugin.x86_64:2.26.26.0-1

    • aws-neuronx-k8-Scheduler.x86_64: 2.26.26.0-1

    • aws-neuronx-runtime-lib.x86_64:2.26.42.0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64:2,24,54,0-1

    • tensorflow-model-server-neuron.x86_64: 2.8.0.2.3.0.0-0

    • tensorflow-model-server-neuronx.x86_64: 2.10.1.2.12.2.0-0

K8s v1.31
  • Nvidia-Treiberversion: 550.163.01

  • CUDA-Version: 12.4

  • Version des EFA-Installationsprogramms: 1.38.0

  • Neuron-Pakete:

    • aws-neuronx-dkms.noarch: 2.22.2.0-dkms

    • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

    • aws-neuronx-tools.x86_64:2.18.3.0-1

    • aws-neuron-dkms.noarch: 2.3.26.0-dkms

    • aws-neuron-k8-plugin.x86_64: 1.9.3.0-1

    • aws-neuron-k8-Scheduler.x86_64: 1.9.3.0-1

    • aws-neuron-runtime.x86_64: 1.6.24.0-1

    • aws-neuron-runtime-base.x86_64: 1.6.21.0-1

    • aws-neuron-tools.x86_64: 2.1.4.0-1

    • aws-neuronx-collectives.x86_64:2,26.43.0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64:0.2.3.0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64:0,16,2,0-1

    • aws-neuronx-gpsimd-tools.x86_64:0,16.1.0_0a6506a47-1

    • aws-neuronx-k8-Plugin.x86_64:2.26.26.0-1

    • aws-neuronx-k8-Scheduler.x86_64: 2.26.26.0-1

    • aws-neuronx-runtime-lib.x86_64:2.26.42.0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64:2,24,54,0-1

    • tensorflow-model-server-neuron.x86_64: 2.8.0.2.3.0.0-0

    • tensorflow-model-server-neuronx.x86_64: 2.10.1.2.12.2.0-0

K8s v1.32
  • Nvidia-Treiberversion: 550.163.01

  • CUDA-Version: 12.4

  • Version des EFA-Installationsprogramms: 1.38.0

  • Neuron-Pakete:

    • aws-neuronx-dkms.noarch: 2.22.2.0-dkms

    • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

    • aws-neuronx-tools.x86_64:2.18.3.0-1

    • aws-neuron-dkms.noarch: 2.3.26.0-dkms

    • aws-neuron-k8-plugin.x86_64: 1.9.3.0-1

    • aws-neuron-k8-Scheduler.x86_64: 1.9.3.0-1

    • aws-neuron-runtime.x86_64: 1.6.24.0-1

    • aws-neuron-runtime-base.x86_64: 1.6.21.0-1

    • aws-neuron-tools.x86_64: 2.1.4.0-1

    • aws-neuronx-collectives.x86_64:2,26.43.0_47cc904ea-1

    • aws-neuronx-gpsimd-customop.x86_64:0.2.3.0-1

    • aws-neuronx-gpsimd-customop-lib.x86_64:0,16,2,0-1

    • aws-neuronx-gpsimd-tools.x86_64:0,16.1.0_0a6506a47-1

    • aws-neuronx-k8-Plugin.x86_64:2.26.26.0-1

    • aws-neuronx-k8-Scheduler.x86_64: 2.26.26.0-1

    • aws-neuronx-runtime-lib.x86_64:2.26.42.0_2ff3b5c7d-1

    • aws-neuronx-tools.x86_64:2,24,54,0-1

    • tensorflow-model-server-neuron.x86_64: 2.8.0.2.3.0.0-0

    • tensorflow-model-server-neuronx.x86_64: 2.10.1.2.12.2.0-0

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 09. Juni 2025

SageMaker HyperPod Unterstützung für DLAMI für Amazon EKS

Neuron SDK Updates
  • aws-neuronx-dkms.noarch: 2.21.37.0 (von 2.20.74.0)

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 22. Mai 2025

Allgemeine AMI-Updates

SageMaker HyperPod Unterstützung für DLAMI für Amazon EKS

Deep Learning Base AMI AL2
  • Neuester NVIDIA-Treiber: 550.163.01

  • CUDA-Stack-Updates:

    • Standard-CUDA: 12.1

    • NCCL-Version: 2.22.3

  • EFA-Installationsprogramm: 1.38.0

  • AWSOFI NCCL: 1.13.2

  • Linux-Kernel: 5.10

  • GDRCopy: 2,4

Wichtig
  • Aktualisierung des NVIDIA Container Toolkit 1.17.4: Die Einbindung von CUDA-kompatiblen Bibliotheken ist nun deaktiviert.

  • EFA-Updates von 1.37 auf 1.38:

    • AWSDas OFI-NCCL-Plugin befindet sich jetzt in/-nccl opt/amazon/ofi

    • Der vorherige Speicherort /opt//ist veraltet aws-ofi-nccl

Neuron SDK Updates
  • aws-neuronx-dkms.noarch: 2.20.74.0 (von 2.20.28.0)

  • aws-neuronx-collectives.x86_64:2.25.65.0_9858ac9a1-1 (von 2.24.59.0_838c7fc8b-1)

  • aws-neuronx-runtime-lib.x86_64: 2.25.57.0_166c7a468-1 (von 2.24.53.0_f239092cc-1)

  • aws-neuronx-tools.x86_64: 2.23.9.0 (von 2.22.61.0)

  • aws-neuronx-gpsimd-customop-lib.x86_64: 0.15.12.0 (von 0.14.12.0)

  • aws-neuronx-gpsimd-tools.x86_64:0.15.1.0_5d31b6a3f (von 0.14.6.0_241eb69f4)

  • aws-neuronx-k8-plugin.x86_64: 2.25.24.0 (von 2.24.23.0)

  • aws-neuronx-k8-scheduler.x86_64: 2.25.24.0 (von 2.24.23.0)

Hinweise zu Support:

  • AMI-Komponenten, einschließlich CUDA-Versionen, können basierend auf der Framework-Supportrichtlinie entfernt oder geändert werden

  • Die Kernel-Version ist aus Kompatibilitätsgründen festgelegt. Benutzer sollten Updates vermeiden, sofern sie nicht für Sicherheitspatches erforderlich sind

  • Bei EC2 Instanzen mit mehreren Netzwerkkarten finden Sie Informationen zur korrekten Einrichtung im EFA-Konfigurationshandbuch

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 07. Mai 2025

Installed the latest version ofAWSNeuron SDK
  • tensorflow-model-server-neuron.x86_64 2.8.0.2.3.0.0-0 Neuron

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 28. April 2025

Verbesserungen für K8s

SageMaker HyperPod Unterstützung für DLAMI für Amazon EKS

Installed the latest version ofAWSNeuron SDK
  • aws-neuronx-dkms.noarch: 2.20.28.0-dkms

  • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1

  • aws-neuronx-tools.x86_64:2.18.3.0-1

  • aws-neuron-dkms.noarch: 2.3.26.0-dkms

  • aws-neuron-k8-plugin.x86_64: 1.9.3.0-1

  • aws-neuron-k8-Scheduler.x86_64: 1.9.3.0-1

  • aws-neuron-runtime.x86_64: 1.6.24.0-1

  • aws-neuron-runtime-base.x86_64: 1.6.21.0-1

  • aws-neuron-tools.x86_64: 2.1.4.0-1

  • aws-neuronx-collectives.x86_64:2,24,59,0_838c7fc8b-1

  • aws-neuronx-gpsimd-customop.x86_64:0,2.3.0-1

  • aws-neuronx-gpsimd-customop-lib.x86_64:0,14.12.0-1

  • aws-neuronx-gpsimd-tools.x86_64:0,14.6.0_241eb69f4-1

  • aws-neuronx-k8-plugin.x86_64:2.24.23.0-1

  • aws-neuronx-k8-Scheduler.x86_64: 2.24.23.0-1

  • aws-neuronx-runtime-lib.x86_64:2.24.53.0_f239092cc-1

  • aws-neuronx-tools.x86_64: 2,22.61,0-1

  • tensorflow-model-server-neuronx.x86_64: 2.10.1.2.12.2.0-0

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 18. April 2025

Allgemeine AMI-Updates

  • Neues SageMaker HyperPod AMI für Amazon EKS 1.32.1.

SageMaker HyperPod Unterstützung für DLAMI für Amazon EKS

AMIs Dazu gehören die folgenden:

Deep Learning EKS AMI 1.32.1
  • Amazon-EKS-Komponenten

    • Kubernetes-Version: 1.32.1

    • Containerd-Version: 1.7.27

    • Runc-Version: 1.1.14

    • AWSIAM-Authentifikator: 0.6.29

  • Amazon SSM Agent: 3.3.1611.0

  • Linux-Kernel: 5.10.235

  • OSS-Nvidia-Treiber: 550.163.01

  • NVIDIA CUDA: 12.4

  • EFA-Installationsprogramm: 1.38.0

  • GDRCopy: 2.4.1-1

  • Nvidia-Container-Toolkit: 1.17.6

  • AWSOFI NCCL: 1.13.2

  • aws-neuronx-tools: 2,18,3,0

  • aws-neuronx-runtime-lib: 2,24,53,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,20,28,0

  • aws-neuronx-collectives: 2,24,59,0

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 18. Februar 2025

Verbesserungen für K8s

  • Das Nvidia-Container-Toolkit wurde von Version 1.17.3 auf Version 1.17.4 aktualisiert.

  • Das Problem, dass Kunden nach einem Neustart keine Verbindung zu Knoten herstellen konnten, wurde behoben.

  • Die Version des Elastic Fabric Adapter (EFA) wurde von 1.37.0 auf 1.38.0 aktualisiert.

  • Die EFA enthält jetzt das AWS OFI-NCCL-Plugin, das sich im /opt/amazon/ofi-nccl Verzeichnis statt im ursprünglichen Pfad befindet. /opt/aws-ofi-nccl/ Sollten Sie Ihre Umgebungsvariable LD_LIBRARY_PATH aktualisieren müssen, stellen Sie sicher, dass Sie den Pfad so ändern, dass er auf den neuen /opt/amazon/ofi-nccl-Speicherort des OFI-NCCL-Plugins verweist.

  • Das Emacs-Paket wurde aus diesen entfernt. DLAMIs Sie können Emacs von GNU Emac aus installieren.

SageMaker HyperPod Unterstützung für DLAMI für Amazon EKS

Installed the latest version of neuron SDK
  • aws-neuronx-dkms.noarch: 2.19.64.0-dkms @neuron

  • aws-neuronx-oci-hook.x86_64: 2.4.4.0-1 @neuron

  • aws-neuronx-tools.x86_64: 2.18.3.0-1 @neuron

  • aws-neuronx-collectives.x86_64:2.23.135.0_3e70920f2-1-Neuron

  • aws-neuronx-gpsimd-customop.x86_64: 0.2.3.0-1 Neuron

  • aws-neuronx-gpsimd-customop-lib.x86_64

  • aws-neuronx-gpsimd-tools.x86_64:0.13.2.0_94ba34927-1 Neuron

  • aws-neuronx-k8-plugin.x86_64: 2.23.45.0-1 Neuron

  • aws-neuronx-k8-Scheduler.x86_64: 2.23.45.0-1 Neuron

  • aws-neuronx-runtime-lib.x86_64:2.23.112.0_9b5179492-1 Neuron

  • aws-neuronx-tools.x86_64:2.20.204.0-1 Neuron

  • tensorflow-model-server-neuronx.x86_64

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 22. Januar 2025

Allgemeine AMI-Updates

  • Neues SageMaker HyperPod AMI für Amazon EKS 1.31.2.

SageMaker HyperPod Unterstützung für DLAMI für Amazon EKS

AMIs Dazu gehören die folgenden:

Deep Learning EKS AMI 1.31
  • Amazon-EKS-Komponenten

    • Kubernetes-Version: 1.31.2

    • Containerd-Version: 1.7.23

    • Runc-Version: 1.1.14

    • AWSIAM-Authentifikator: 0.6.26

  • Amazon SSM Agent: 3.3.987

  • Linux-Kernel: 5.10.230

  • OSS-Nvidia-Treiber: 550.127.05

  • NVIDIA CUDA: 12.4

  • EFA-Installationsprogramm: 1.37.0

  • GDRCopy: 2.4.1-1

  • Nvidia-Container-Toolkit: 1.17.3

  • AWSOFI NCCL: 1.13.0

  • aws-neuronx-tools: 2,18,3

  • aws-neuronx-runtime-lib: 2,23,112,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,18,20,0

  • aws-neuronx-collectives: 2,23,133,0

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 21. Dezember 2024

SageMaker HyperPod Unterstützung für DLAMI für Amazon EKS

AMIs Dazu gehören die folgenden:

K8s v1.28
  • Amazon-EKS-Komponenten

    • Kubernetes-Version: 1.28.15

    • Containerd-Version: 1.7.23

    • Runc-Version: 1.1.14

    • AWSIAM-Authentifikator: 0.6.26

  • Amazon SSM Agent: 3.3.987

  • Linux-Kernel: 5.10.228

  • OSS-NVIDIA-Treiber: 550.127.05

  • NVIDIA CUDA: 12.4

  • EFA-Installationsprogramm: 1.37.0

  • GDRCopy: 2,4

  • NVIDIA-Container-Toolkit: 1.17.3

  • AWSOFI NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2,23,112,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,18,20,0

  • aws-neuronx-collectives: 2,23,135,0

K8s v1.29
  • Amazon-EKS-Komponenten

    • Kubernetes-Version: 1.29.10

    • Containerd-Version: 1.7.23

    • Runc-Version: 1.1.14

    • AWSIAM-Authentifikator: 0.6.26

  • Amazon SSM Agent: 3.3.987

  • Linux-Kernel: 5.15.0

  • OSS-Nvidia-Treiber: 550.127.05

  • NVIDIA CUDA: 12.4

  • EFA-Installationsprogramm: 1.37.0

  • GDRCopy: 2,4

  • Nvidia-Container-Toolkit: 1.17.3

  • AWSOFI NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2,23,112,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,18,20,0

  • aws-neuronx-collectives: 2,23,135,0

K8s v1.30
  • Amazon-EKS-Komponenten

    • Kubernetes-Version: 1.30.6

    • Containerd-Version: 1.7.23

    • Runc-Version: 1.1.14

    • AWSIAM-Authentifikator: 0.6.26

  • Amazon SSM Agent: 3.3.987.0

  • Linux-Kernel: 5.10.228

  • OSS-Nvidia-Treiber: 550.127.05

  • NVIDIA CUDA: 12.4

  • EFA-Installationsprogramm: 1.37.0

  • GDRCopy: 2,4

  • Nvidia-Container-Toolkit: 1.17.3

  • AWSOFI NCCL: 1.13.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2,23,112,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,18,20,0

  • aws-neuronx-collectives: 2,23,135,0

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 13. Dezember 2024

SageMaker HyperPod Aktualisierung von DLAMI für Amazon EKS

  • Der SSM-Agent wurde auf Version 3.3.1311.0 aktualisiert.

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 24. November 2024

Allgemeine AMI-Updates

  • Veröffentlicht in der Region MEL (Melbourne).

  • SageMaker HyperPod Basis-DLAMI wurde auf die folgenden Versionen aktualisiert:

    • Kubernetes: 01.11.2024.

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 15. November 2024

SageMaker HyperPod Unterstützung für DLAMI für Amazon EKS

AMIs Dazu gehören die folgenden:

Deep Learning EKS AMI 1.28
  • Amazon-EKS-Komponenten

    • Kubernetes-Version: 1.28.15

    • Containerd-Version: 1.7.23

    • Runc-Version: 1.1.14

    • AWSIAM-Authentifikator: 0.6.26

  • Amazon SSM Agent: 3.3.987

  • Linux-Kernel: 5.10.228

  • OSS-NVIDIA-Treiber: 550.127.05

  • NVIDIA CUDA: 12.4

  • EFA-Installationsprogramm: 1.34.0

  • GDRCopy: 2,4

  • NVIDIA-Container-Toolkit: 1.17.3

  • AWSOFI NCCL: 1.11.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.22.19,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,18,20,0

  • aws-neuronx-collectives: 2,22,33,0

Deep Learning EKS AMI 1.29
  • Amazon-EKS-Komponenten

    • Kubernetes-Version: 1.29.10

    • Containerd-Version: 1.7.23

    • Runc-Version: 1.1.14

    • AWSIAM-Authentifikator: 0.6.26

  • Amazon SSM Agent: 3.3.987

  • Linux-Kernel: 5.10.228

  • OSS-Nvidia-Treiber: 550.127.05

  • NVIDIA CUDA: 12.4

  • EFA-Installationsprogramm: 1.34.0

  • GDRCopy: 2,4

  • Nvidia-Container-Toolkit: 1.17.3

  • AWSOFI NCCL: 1.11.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.22.19,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,18,20,0

  • aws-neuronx-collectives: 2,22,33,0

Deep Learning EKS AMI 1.30
  • Amazon-EKS-Komponenten

    • Kubernetes-Version: 1.30.6

    • Containerd-Version: 1.7.23

    • Runc-Version: 1.1.14

    • AWSIAM-Authentifikator: 0.6.26

  • Amazon SSM Agent: 3.3.987

  • Linux-Kernel: 5.10.228

  • OSS-Nvidia-Treiber: 550.127.05

  • NVIDIA CUDA: 12.4

  • EFA-Installationsprogramm: 1.34.0

  • GDRCopy: 2,4

  • Nvidia-Container-Toolkit: 1.17.3

  • AWSOFI NCCL: 1.11.0

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2.22.19,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2,18,20,0

  • aws-neuronx-collectives: 2,22,33,0

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 11. November 2024

Allgemeine AMI-Updates

  • SageMaker HyperPod DLAMI mit den Amazon EKS-Versionen 1.28.13, 1.29.8, 1.30.4 aktualisiert.

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 21. Oktober 2024

Allgemeine AMI-Updates

  • SageMaker HyperPod Basis-DLAMI wurde auf die folgenden Versionen aktualisiert:

    • Amazon EKS: 1.28.11, 1.29.6, 1.30.2.

SageMaker HyperPod AMI-Veröffentlichungen für Amazon EKS: 10. September 2024

SageMaker HyperPod Unterstützung für DLAMI für Amazon EKS

AMIs Dazu gehören die folgenden:

Deep Learning EKS AMI 1.28
  • Amazon-EKS-Komponenten

    • Kubernetes-Version: 1.28.11

    • Containerd-Version: 1.7.20

    • Runc-Version: 1.1.11

    • AWSIAM-Authentifikator: 0.6.21

  • Amazon SSM Agent: 3.3.380

  • Linux-Kernel: 5.10.223

  • OSS-NVIDIA-Treiber: 535.183.01

  • NVIDIA CUDA: 12.2

  • EFA-Installationsprogramm: 1.32.0

  • GDRCopy: 2,4

  • NVIDIA-Container-Toolkit: 1.16.1

  • AWSOFI NCCL: 1.9.1

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2,21,41,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2.17.17,0

  • aws-neuronx-collectives: 2,21,46,0

Deep Learning EKS AMI 1.29
  • Amazon-EKS-Komponenten

    • Kubernetes-Version: 1.29.6

    • Containerd-Version: 1.7.20

    • Runc-Version: 1.1.11

    • AWSIAM-Authentifikator: 0.6.21

  • Amazon SSM Agent: 3.3.380

  • Linux-Kernel: 5.10.223

  • OSS-Nvidia-Treiber: 535.183.01

  • NVIDIA CUDA: 12.2

  • EFA-Installationsprogramm: 1.32.0

  • GDRCopy: 2,4

  • Nvidia-Container-Toolkit: 1.16.1

  • AWSOFI NCCL: 1.9.1

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2,21,41,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2.17.17,0

  • aws-neuronx-collectives: 2,21,46,0

Deep Learning EKS AMI 1.30
  • Amazon-EKS-Komponenten

    • Kubernetes-Version: 1.30.2

    • Containerd-Version: 1.7.20

    • Runc-Version: 1.1.11

    • AWSIAM-Authentifikator: 0.6.21

  • Amazon SSM Agent: 3.3.380

  • Linux-Kernel: 5.10.223

  • OSS-Nvidia-Treiber: 535.183.01

  • NVIDIA CUDA: 12.2

  • EFA-Installationsprogramm: 1.32.0

  • GDRCopy: 2,4

  • Nvidia-Container-Toolkit: 1.16.1

  • AWSOFI NCCL: 1.9.1

  • aws-neuronx-tools: 2.18.3.0-1

  • aws-neuronx-runtime-lib: 2,21,41,0

  • aws-neuronx-oci-hook: 2,4,4,0-1

  • aws-neuronx-dkms: 2.17.17,0

  • aws-neuronx-collectives: 2,21,46,0