Implementación de modelos fundacionales y modelos de ajuste fino personalizados - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Implementación de modelos fundacionales y modelos de ajuste fino personalizados

Ya sea que esté implementando modelos básicos preentrenados de contrapesos o cerrados de Amazon SageMaker JumpStart o sus propios modelos personalizados o ajustados almacenados en Amazon S3 o Amazon FSx, SageMaker HyperPod proporciona la infraestructura flexible y escalable que necesita para las cargas de trabajo de inferencia de producción.

Implemente modelos de bases abiertas y cerradas desde JumpStart Implemente modelos personalizados y ajustados de Amazon S3 y Amazon FSx
Descripción

Implemente desde un catálogo completo de modelos fundacionales previamente entrenados con políticas de escalado y optimización automáticas adaptadas a cada familia de modelos.

Utilice sus propios modelos personalizados y ajustados y aproveche la infraestructura empresarial de la empresa para realizar inferencias a SageMaker HyperPod escala de producción. Elija entre un almacenamiento rentable con Amazon S3 o un sistema de archivos de alto rendimiento con Amazon FSx.
Ventajas principales
  • Despliegue con un clic a través de la interfaz de usuario de Amazon SageMaker Studio

  • El escalado automático en función de las solicitudes entrantes se activa automáticamente

  • Contenedores y configuraciones optimizadas previamente para cada familia de modelos

  • Gestión del EULA para los modelos cerrados

  • Support para múltiples backends de almacenamiento: Amazon S3, Amazon FSx

  • Compatibilidad flexible con contenedores y marcos

  • Políticas de escalado personalizadas en función de las características de su modelo

Opciones de implementación
  • Amazon SageMaker Studio para despliegue visual

  • kubectl para operaciones nativas de Kubernetes

  • SDK de Python para la integración programática

  • HyperPod CLI para la automatización de la línea de comandos

  • kubectl para operaciones nativas de Kubernetes

  • SDK de Python para la integración programática

  • HyperPod CLI para la automatización de la línea de comandos

En las siguientes secciones, se explica cómo implementar modelos de Amazon SageMaker JumpStart y Amazon S3 y Amazon FSx.