Restricciones y consideraciones
Revise las siguientes restricciones para asegurarse de que los trabajos de su cuaderno se completen correctamente. Studio usa Papermill para ejecutar cuadernos. Puede que tengas que actualizar los cuadernos de Jupyter para adaptarlos a los requisitos de Papermill. También hay restricciones en cuanto al contenido de los scripts de LCC y detalles importantes que hay que entender en relación con la configuración de la VPC.
Versión de JupyterLab
Es compatible con la versión 4.0 de JupyterLab.
Instalación de paquetes que requieren reiniciar el kernel
Papermill no admite llamadas pip install para instalar paquetes que requieran reiniciar el kernel. En este caso, use pip install en un script de inicialización. Si la instalación de un paquete no requiere reiniciar el kernel, también puede incluir pip install en el cuaderno.
Nombres de kernels y lenguajes registrados en Jupyter
Papermill registra un traductor para kernels y lenguajes específicos. Si utiliza su propia instancia (BYOI), utilice un nombre de kernel estándar, como se muestra en el siguiente fragmento:
papermill_translators.register("python", PythonTranslator) papermill_translators.register("R", RTranslator) papermill_translators.register("scala", ScalaTranslator) papermill_translators.register("julia", JuliaTranslator) papermill_translators.register("matlab", MatlabTranslator) papermill_translators.register(".net-csharp", CSharpTranslator) papermill_translators.register(".net-fsharp", FSharpTranslator) papermill_translators.register(".net-powershell", PowershellTranslator) papermill_translators.register("pysparkkernel", PythonTranslator) papermill_translators.register("sparkkernel", ScalaTranslator) papermill_translators.register("sparkrkernel", RTranslator) papermill_translators.register("bash", BashTranslator)
Límites de parámetros y variables de entorno
Límites de parámetros y variables de entorno. Al crear el trabajo del cuaderno, este recibe los parámetros y las variables de entorno que especifique. Puede agregar hasta 100 parámetros. El nombre de cada parámetro puede tener una longitud máxima de 256 caracteres y el valor asociado puede tener una longitud máxima de 2500 caracteres. Si agrega variables de entorno, puede agregar hasta 28 variables. El nombre de la variable y el valor asociado pueden tener hasta 512 caracteres. Si necesita más de 28 variables de entorno, utilice variables de entorno adicionales en un script de inicialización que no limite el número de variables de entorno que puede utilizar.
Visualización de trabajos y definiciones de trabajos
Visualización de trabajos y definiciones de trabajos Si programa su trabajo de cuaderno en la interfaz de usuario de Studio en el cuaderno de JupyterLab, podrá ver sus trabajos de cuaderno y sus definiciones de trabajos de cuaderno en la interfaz de usuario de Studio. Si ha programado su trabajo de cuaderno con el SageMaker Python SDK, solo podrá ver sus trabajos; el paso de trabajo de cuaderno del SageMaker Python SDK no crea definiciones de trabajo. Para ver sus trabajos, también debe añadir etiquetas adicionales a la instancia del paso de trabajo de cuaderno. Para obtener más información, consulte Consulte los trabajos de cuaderno en el panel de la interfaz de usuario de Studio.
Imagen
Debe administrar las restricciones de imagen en función de si ejecuta los trabajos de cuaderno en Studio o el paso del trabajo de cuaderno del SageMaker Python SDK en una canalización.
Restricciones de imágenes para trabajos de cuaderno de SageMaker AI (Studio)
Compatibilidad de imágenes y kernels. El controlador que inicia el trabajo del cuaderno presupone lo siguiente:
-
Se ha instalado un entorno de tiempo de ejecución básico de Python en las imágenes de Studio o propio (BYO) y es el predeterminado en el intérprete de comandos.
-
El entorno de tiempo de ejecución básico de Python incluye el cliente Jupyter con las especificaciones del kernel correctamente configuradas.
-
El entorno de tiempo de ejecución básico de Python incluye la función
pippara que el trabajo del cuaderno pueda instalar las dependencias del sistema. -
En el caso de imágenes con varios entornos, el script de inicialización debe cambiar al entorno específico del kernel adecuado antes de instalar los paquetes específicos del cuaderno. Debe volver al entorno de tiempo de ejecución de Python predeterminado, si es diferente del entorno de tiempo de ejecución del kernel, después de configurar el entorno de tiempo de ejecución de Python del kernel.
El controlador que inicia el trabajo de su cuaderno es un script bash, y Bash v4 debe estar disponible en /bin/bash.
Privilegios raíz en las imágenes propias (BYOI). Debe tener privilegios raíz en sus propias imágenes de Studio, ya sea como usuario raíz o mediante acceso sudo. Si no es un usuario raíz pero accede a los privilegios raíz a través de sudo, use 1000/100 como UID/GID.
Restricciones de imágenes para los trabajos de cuaderno del SageMaker AI Python SDK
El paso de trabajo del cuaderno admite las siguientes imágenes:
-
Imágenes de Distribución de SageMaker que aparecen en Imágenes de Amazon SageMaker disponibles para usar con cuadernos de Studio Classic.
-
Una imagen personalizada basada en las imágenes de Distribución de SageMaker de la lista anterior. Utilice una imagen de Distribución de SageMaker
como base. -
Una imagen personalizada (BYOI) preinstalada con las dependencias de trabajos de cuaderno (por ejemplo, sagemaker-headless-execution-driver
). La imagen debe cumplir los siguientes requisitos: -
La imagen viene preinstalada con dependencias de trabajos de cuaderno.
-
Se instala un entorno en tiempo de ejecución base de Python, que se encuentra de manera predeterminada en el entorno del intérprete de comandos.
-
El entorno de tiempo de ejecución básico de Python incluye el cliente Jupyter con las especificaciones del kernel correctamente configuradas.
-
Debe tener privilegios raíz, ya sea como usuario raíz o mediante acceso
sudo. Si no es un usuario raíz pero accede a los privilegios raíz a través desudo, use1000/100comoUID/GID.
-
Subredes de VPC utilizadas durante la creación de trabajos
Si usa una VPC, Studio usa sus subredes privadas para crear su trabajo. Especifique de una a cinco subredes privadas (y de 1 a 15 grupos de seguridad).
Si utiliza una VPC con subredes privadas, debe elegir una de las siguientes opciones para garantizar que el trabajo del cuaderno se pueda conectar a los servicios o recursos dependientes:
-
Si su trabajo precisa acceso a un servicio de AWS que admita puntos de conexión de VPC de interfaz, cree un punto de conexión para conectarse a ese servicio. Para obtener una lista de los servicios que admiten puntos de conexión de interfaz, consulte Servicios de AWS que se integran con AWS PrivateLink. Para obtener información sobre la creación de un punto de conexión de VPC de interfaz, consulte Acceda a un Servicio de AWS mediante un punto de conexión de VPC de interfaz. Como mínimo, se debe proporcionar una puerta de enlace de punto de conexión de VPC de Amazon S3.
-
Si el trabajo del cuaderno necesita acceso a un servicio de AWS que no admite puntos de conexión de VPC de interfaz o a un recurso fuera de AWS, cree una puerta de enlace NAT y configure sus grupos de seguridad para que permitan conexiones salientes. Para obtener información sobre la configuración de una puerta de enlace NAT para su VPC, consulte VPC with public and private Subnets (NAT) en la Guía del usuario de Amazon Virtual Private Cloud.
Límites de los servicios
Dado que el programador de trabajos del cuaderno se ha creado a partir de los servicios de Canalizaciones, entrenamiento de SageMaker y Amazon EventBridge, los trabajos de cuaderno están sujetos a sus cuotas específicas de servicio. Si supera estas cuotas, es posible que vea mensajes de error relacionados con estos servicios. Por ejemplo, hay límites en cuanto al número de canalizaciones que se pueden ejecutar a la vez y al número de reglas que se pueden configurar para un único bus de eventos. Para obtener más información sobre las cuotas de SageMaker AI, consulte Puntos de conexión y cuotas de Amazon SageMaker AI. Para obtener más información acerca de las cuotas de EventBridge, consulte Amazon EventBridge quotas.