Ejecución de contenedores de entrenamiento e inferencia en modo con acceso a Internet - Amazon SageMaker AI

Ejecución de contenedores de entrenamiento e inferencia en modo con acceso a Internet

Los contenedores de entrenamiento e inferencia de SageMaker AI tienen Internet habilitado de forma predeterminada. Esto permite a los contenedores acceder a servicios externos y recursos en la red de Internet pública como parte de sus cargas de trabajo de capacitación e inferencia. Sin embargo, esto podría proporcionar una vía de acceso no autorizado a los datos. Por ejemplo, un código o usuario maliciosos que instale accidentalmente en el contenedor (en forma de biblioteca de código fuente a disposición del público en general) podría acceder a sus datos y transferirlos a un host remoto.

Si utiliza una Amazon VPC especificando un valor para el parámetro VpcConfig cuando llama a CreateTrainingJob, CreateHyperParameterTuningJob o CreateModel, puede proteger sus datos y recursos mediante la administración de los grupos de seguridad y la limitación del acceso a Internet desde su VPC. Sin embargo, esto se hace a expensas de una configuración de red adicional y conlleva el riesgo de que la red se configure de forma incorrecta. Si no desea que SageMaker AI proporcione acceso de red externa a sus contenedores de entrenamiento o inferencia, puede activar el aislamiento de redes.

Aislamiento de red

Puede habilitar el aislamiento de redes al crear su trabajo o modelo de entrenamiento si configura el valor del parámetro EnableNetworkIsolation en True cuando llame a CreateTrainingJob, CreateHyperParameterTuningJob o CreateModel.

nota

El aislamiento de redes es necesario para modelos y trabajos de entrenamiento que se ejecutan usando recursos de AWS Marketplace. Para mayor seguridad, las imágenes de AWS Marketplace se ejecutan en una Amazon VPC. Solo tienen acceso a los datos de sus sistemas de archivos locales.

Si habilita el aislamiento de redes, los contenedores no podrán realizar ninguna llamada de red saliente, incluso a otros servicios de AWS como Amazon S3. Además, no hay credenciales de AWS disponibles para el entorno de tiempo de ejecución del contenedor. En el caso de un trabajo de entrenamiento con varias instancias, el tráfico entrante y saliente de la red se limita a los homólogos de cada contenedor de entrenamiento. SageMaker AI sigue realizando operaciones de descarga y carga en Amazon S3 mediante su rol de ejecución de SageMaker AI de forma aislada del contenedor de entrenamiento o inferencia.

El aislamiento de redes no es compatible con los siguientes contenedores de SageMaker AI administrados que necesitan acceso a Amazon S3:

  • Chainer

  • Aprendizaje reforzado con SageMaker AI

Aislamiento de redes con una VPC

El aislamiento de redes se puede utilizar junto con una VPC. En ese caso, la descarga y carga de los datos del cliente y los artefactos del modelo se dirigen a través de la subred de VPC. Sin embargo, los contenedores de capacitación e inferencia en sí siguen estando aislados de la red; no tienen acceso a ningún recurso dentro de su VPC o en Internet.