Implementación de sus modelos en un punto de conexión
En Amazon SageMaker Canvas, puede implementar sus modelos en un punto de conexión para realizar predicciones. SageMaker AI proporciona la infraestructura de machine learning para que pueda alojar su modelo en un punto de conexión con las instancias de computación que elija. A continuación, puede invocar el punto de conexión (enviar una solicitud de predicción) y obtener una predicción en tiempo real a partir de su modelo. Con esta funcionalidad, puede usar su modelo en producción para responder a las solicitudes entrantes y puede integrar su modelo con las aplicaciones y los flujos de trabajo existentes.
Para empezar, debe tener un modelo que quiera implementar. Puede implementar versiones de modelos personalizadas que haya creado, modelos fundacionales de Amazon SageMaker JumpStart y modelos fundacionales de JumpStart afinados. Para obtener más información acerca de la creación de un modelo, consulte Cómo funcionan los modelos personalizados. Para obtener más información acerca de los modelos fundacionales JumpStart en Canvas, consulte Modelos fundacionales de IA generativa en SageMaker Canvas.
Revise la siguiente sección de Administración de permisos y, a continuación, comience a crear nuevas implementaciones en la sección Implementación de un modelo.
Administración de permisos
De forma predeterminada, tiene permisos para implementar modelos en puntos de conexión de alojamiento de SageMaker AI. SageMaker AI concede estos permisos a todos los perfiles de usuario de Canvas nuevos y existentes mediante la política AmazonSageMakerCanvasFullAccess, que está asociada al rol de ejecución de AWS IAM para el dominio de SageMaker AI que aloja la aplicación de Canvas.
Si su administrador de Canvas está configurando un nuevo dominio o perfil de usuario, cuando esté configurando el dominio y siguiendo las instrucciones previas de Requisitos previos para configurar Amazon SageMaker Canvas, SageMaker AI activará los permisos de implementación del modelo mediante la opción Habilitar la implementación directa de los modelos de Canvas, que está habilitada de forma predeterminada.
El administrador de Canvas también puede gestionar los permisos de implementación del modelo en el nivel del perfil de usuario. Por ejemplo, si el administrador no quiere conceder permisos de implementación de modelos a todos los perfiles de usuario al configurar un dominio, puede conceder permisos a usuarios específicos después de crear el dominio.
El siguiente procedimiento muestra cómo activar los permisos de implementación de modelos para un perfil de usuario específico:
-
Abra la consola de SageMaker AI en https://console.aws.amazon.com/sagemaker/
. -
En el panel de navegación izquierdo, seleccione Configuraciones de administración.
-
En Configuraciones de administración, elija Dominios.
-
En la lista de dominios, seleccione el dominio del perfil de usuario.
-
En la página Detalles del dominio, elija la pestaña Perfiles de usuario.
-
Elija un Perfil de usuario.
-
En la página del perfil del usuario, elija la pestaña Configuraciones de aplicaciones.
-
En la sección Canvas, seleccione Editar.
-
En la sección Configuración de ML Ops, active la opción Habilitar la implementación directa de los modelos de Canvas para habilitar los permisos de implementación.
-
Seleccione Enviar para guardar los cambios en la configuración de su dominio.
El perfil de usuario debería tener ahora permisos de implementación de modelos.
Tras conceder permisos al dominio o al perfil de usuario, asegúrese de que el usuario cierre sesión en su aplicación de Canvas y vuelva a iniciarla para aplicar los cambios de permisos.
Implementación de un modelo
Para comenzar a implementar su modelo, cree una nueva implementación en Canvas y especifique la versión del modelo que desea implementar junto con la infraestructura de machine learning, como el tipo y la cantidad de instancias de procesamiento que le gustaría usar para alojar el modelo.
Canvas sugiere un tipo y un número de instancias predeterminados en función del tipo de modelo. Puede consultar más información sobre los distintos tipos de instancias de SageMaker AI en la página de precios de Amazon SageMaker
Al implementar los modelos fundacionales de JumpStart, también tiene la opción de especificar la duración del tiempo de implementación. Puede implementar el modelo en un punto de conexión de forma indefinida (lo que significa que el punto de conexión estará activo hasta que elimine la implementación). O bien, si solo necesita el punto de conexión durante un breve período de tiempo y desea reducir costos, puede implementar el modelo en un punto de conexión durante un período de tiempo específico, transcurrido el cual SageMaker AI cerrará el punto de conexión.
nota
Si implementa un modelo durante un período de tiempo específico, mantenga la sesión iniciada en la aplicación de Canvas durante todo el tiempo que dure el punto de conexión. Si cierra sesión o elimina la aplicación, Canvas no podrá cerrar el punto de conexión a la hora especificada.
Una vez implementado el modelo en un punto de conexión de inferencia en tiempo real de alojamiento de SageMaker AI, puede empezar a hacer predicciones invocando el punto de conexión.
Hay varias formas de implementar una versión del modelo desde la aplicación de Canvas. Puede obtener acceso a la opción de implementación del modelo mediante cualquiera de los métodos siguientes:
-
En la página Mis modelos de la aplicación de Canvas, elija el modelo que quiera implementar. A continuación, en la página de Versiones del modelo, elija el icono Más opciones (
) situado junto a la versión del modelo y seleccione Implementar. -
En la página de detalles de una versión del modelo, en la pestaña Analizar, elija la opción Implementar.
-
En la página de detalles de una versión del modelo, en la pestaña Predecir, seleccione el icono de Más opciones (
) situado en la parte superior de la página y seleccione Implementar. -
En la página Operaciones de machine learning de la aplicación de Canvas, elija la pestaña Implementaciones y, a continuación, Crear implementación.
-
Para modelos fundacionales de JumpStart y modelos fundacionales afinados, vaya a la página Modelos listos para usar de la aplicación de Canvas. Elija Generar, extraer y resumir contenido. A continuación, busque el modelo fundacional de JumpStart o el modelo fundacional afinado que desee implementar. Elija el modelo y, en la página de chat del modelo, seleccione el botón Implementar.
Todos estos métodos abren el panel lateral Implementar modelo, donde puede especificar la configuración de implementación de su modelo. Para implementar el modelo desde este panel, haga lo siguiente:
-
(Opcional) Si va a crear una implementación desde la página Operaciones de machine learning, tendrá la opción de Seleccionar el modelo y la versión. Utilice los menús desplegables para seleccionar el modelo y la versión del modelo que desee implementar.
-
Escriba un nombre en el campo Nombre de implementación .
-
(Solo para los modelos fundacionales de JumpStart y los modelos fundacionales afinados) Elija una Duración de la implementación. Seleccione Indefinido para dejar el punto de conexión activo hasta que lo cierre, o Especificar la longitud y, a continuación, introduzca el período de tiempo durante el que desea que el punto de conexión permanezca activo.
-
Para Tipo de instancia, SageMaker AI detecta un tipo y un número de instancia predeterminados adecuados para su modelo. Sin embargo, puede cambiar el tipo de instancia que quiera utilizar para alojar el modelo.
nota
Si se agota la cuota de instancias para el tipo de instancia elegido en su cuenta de AWS, puede solicitar un aumento de cuota. Para obtener más información sobre las cuotas predeterminadas y cómo solicitar un aumento, consulte Puntos de conexión y cuotas de Amazon SageMaker AI en la Guía de referencia general de AWS.
-
Para el Recuento de instancias, puede establecer el número de instancias activas que se utilizan para su punto de conexión. SageMaker AI detecta un número predeterminado que es adecuado para su modelo, pero puede modificarlo si lo desea.
-
Cuando esté listo para implementar el modelo, elija Implementar.
Su modelo ahora debería implementarse en un punto de conexión.