Disponible CloudFormation plantillas Requisitos previos Inferencia remota para plantillas de resaltado semántico

Utilización CloudFormation para configurar la inferencia remota para la búsqueda semántica

A partir de OpenSearch la versión 2.9, puede utilizar la inferencia remota con la búsqueda semántica para alojar sus propios modelos de aprendizaje automático (ML). La inferencia remota utiliza el complemento ML Commons.

Con la inferencia remota, puede alojar sus inferencias de modelos de forma remota en servicios de aprendizaje automático, como Amazon SageMaker AI y Amazon Bedrock, y conectarlos a Amazon OpenSearch Service con conectores de aprendizaje automático.

Para facilitar la configuración de la inferencia remota, Amazon OpenSearch Service proporciona una AWS CloudFormationplantilla en la consola. CloudFormation es un Servicio de AWS lugar en el que puede aprovisionar AWS y administrar recursos de terceros tratando la infraestructura como código.

La OpenSearch CloudFormation plantilla automatiza el proceso de aprovisionamiento de modelos, de modo que puede crear fácilmente un modelo en su dominio de OpenSearch servicio y, a continuación, utilizar el ID del modelo para ingerir datos y ejecutar consultas de búsqueda neuronal.

Si utiliza codificadores neuronales dispersos con la versión 2.12 y posteriores del OpenSearch Servicio, le recomendamos que utilice el modelo de tokenizador de forma local en lugar de implementarlo de forma remota. Para obtener más información, consulte los modelos de codificación dispersa en la documentación. OpenSearch

Temas

Disponible CloudFormation plantillas

Están disponibles las siguientes plantillas de aprendizaje AWS CloudFormation automático (ML) para su uso:

Plantillas de Amazon Bedrock

Integración de Amazon Titan Text Embeddings: Se conecta a los modelos de ML alojados de Amazon Bedrock, elimina la necesidad de implementar modelos independientes y utiliza puntos de conexión de Amazon Bedrock predeterminados. Para obtener más información, consulte Amazon Titan Text Embeddings en la Guía del usuario de Amazon Bedrock.
Integración Cohere Embed: Proporciona acceso a los modelos Cohere Embed y está optimizado para flujos de trabajo específicos de procesamiento de texto. Para obtener más información, consulte Embed en el sitio web de documentos de Cohere.
Amazon Titan Multimodal Embeddings: Admite la incrustación de texto e imágenes y permite funciones de búsqueda multimodal. Para obtener más información, consulte Amazon Titan Multimodal Embeddings en la Guía del usuario de Amazon Bedrock.

Plantillas de integración de servidores MCP

Integración de servidores MCP: Implementa un Amazon Bedrock AgentCore Runtime, proporciona un punto de enlace de agente, gestiona la autenticación entrante y saliente y admite OAuth para la autenticación empresarial.

SageMaker Plantillas de Amazon

Integración con modelos de incrustación de texto a través de Amazon SageMaker: Implementa modelos de incrustación de texto en Amazon SageMaker Runtime, crea funciones de IAM para el acceso a los artefactos del modelo y establece conectores de aprendizaje automático para la búsqueda semántica.
Integración con codificadores dispersos mediante SageMaker: Configura modelos de codificación dispersos para la búsqueda neuronal, crea funciones AWS Lambda para la administración de conectores y devuelve los ID de los modelos para su uso inmediato.

Requisitos previos

Para usar una CloudFormation plantilla con OpenSearch Service, complete los siguientes requisitos previos.

Configure un dominio de OpenSearch servicio

Antes de poder usar una CloudFormation plantilla, debes configurar un dominio de Amazon OpenSearch Service con la versión 2.9 o posterior y un control de acceso detallado activado. Crea un rol OpenSearch de backend del servicio para dar permiso al plugin ML Commons para que cree tu conector por ti.

La CloudFormation plantilla crea una función de IAM de Lambda para usted con el nombre predeterminadoLambdaInvokeOpenSearchMLCommonsRole, que puede anular si desea elegir un nombre diferente. Una vez que la plantilla cree este rol de IAM, debe conceder permiso a la función Lambda para llamar a OpenSearch su dominio de servicio. Para ello, asigne la función nombrada ml_full_access a su función de backend del OpenSearch servicio siguiendo los siguientes pasos:

Navega hasta el complemento OpenSearch Dashboards de tu dominio de OpenSearch servicio. Puedes encontrar el punto de conexión de Dashboards en el panel de control de tu dominio, en la consola de OpenSearch servicio.
En el menú principal, seleccione Seguridad, Roles y seleccione el rol ml_full_access.
Seleccione Usuarios asignados, Administrar mapeo.
En Roles de backend, agregue el ARN del rol de Lambda que necesita permiso para llamar a su dominio.
```
arn:aws:iam::account-id:role/role-name
```
Seleccione Asignar y confirme que el usuario o el rol aparecen en Usuarios asignados.

Una vez que haya asignado la función, vaya a la configuración de seguridad de su dominio y añada la función Lambda IAM a OpenSearch su política de acceso al servicio.

Habilite los permisos en su Cuenta de AWS

Cuenta de AWS Debe tener permiso para acceder CloudFormation a Lambda, junto con lo que Servicio de AWS elija para su plantilla, ya sea SageMaker Runtime o Amazon Bedrock.

Si utiliza Amazon Bedrock, también debe registrar su modelo. Consulte Acceso al modelo en la Guía del usuario de Amazon Bedrock para registrar su modelo.

Si utiliza su propio bucket de Amazon S3 para proporcionar artefactos modelo, debe añadir la función de CloudFormation IAM a su política de acceso a S3. Para obtener más información, consulta Adición y eliminación de permisos de identidad de IAM en la Guía del usuario de IAM.

Inferencia remota para plantillas de resaltado semántico

El resaltado semántico es una característica de búsqueda avanzada que mejora la relevancia de los resultados al analizar el significado y el contexto de las consultas en lugar de basarse únicamente en las coincidencias exactas de las palabras clave. Esta función utiliza modelos de machine learning para evaluar la similitud semántica entre las consultas de búsqueda y el contenido del documento, identificando y resaltando las frases o pasajes más relevantes desde el punto de vista contextual de los documentos. A diferencia de los métodos de resaltado tradicionales, que se centran en las coincidencias exactas de los términos, el resaltado semántico aprovecha los modelos de IA para evaluar cada oración utilizando información contextual tanto de la consulta como del texto circundante, lo que le permite mostrar información pertinente incluso cuando los términos de búsqueda exactos no estén presentes en los pasajes resaltados. Este enfoque resulta especialmente útil para las implementaciones de AI-driven búsqueda en las que los usuarios dan prioridad al significado semántico por encima de la coincidencia literal de palabras, lo que permite a los administradores de búsquedas ofrecer experiencias de búsqueda más inteligentes y contextualizadas que destacan los tramos de contenido significativos y no solo las apariciones de palabras clave. Para obtener más información, consulte Uso del resaltado semántico.

Utilice el siguiente procedimiento para abrir y ejecutar una CloudFormation plantilla que configure automáticamente los SageMaker modelos de Amazon para el resaltado semántico.

Para usar la plantilla de resaltado semántico CloudFormation

Abre la consola OpenSearch de Amazon Service en https://console.aws.amazon.com/aos/home.
En el panel de navegación izquierdo, seleccione Integraciones.
En Habilitar el resaltado semántico mediante SageMaker la integración de Amazon, selecciona Configurar dominio y Configurar dominio público.
Siga la petición para configurar el modelo.

nota

OpenSearch El servicio también proporciona una plantilla independiente para configurar el dominio de VPC. Si usa esta plantilla, debe proporcionar el ID de VPC para la función de Lambda.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Conectores para plataformas externas

Plantillas de Amazon Bedrock