Acerca del enriquecimiento semántico automático - Amazon OpenSearch Service

Acerca del enriquecimiento semántico automático

Al crear o editar una colección, puede configurar el enriquecimiento semántico automático, lo que simplifica la implementación y las capacidades de la búsqueda semántica en Amazon OpenSearch Service. La búsqueda semántica arroja resultados de consulta que incorporan no solo la coincidencia de palabras clave, sino también la intención y el significado contextual de la búsqueda del usuario. Por ejemplo, si un usuario busca “cómo tratar un dolor de cabeza”, un sistema de búsqueda semántica puede arrojar los siguientes resultados:

  • Remedios para la migraña

  • Técnicas de manejo del dolor

  • Analgésicos de venta libre

  • Métodos naturales para aliviar el dolor de cabeza

El sistema entiende la intención subyacente incluso cuando estas frases exactas no estén en la consulta original.

El enriquecimiento semántico automático ofrece los siguientes beneficios:

Implementación simplificada

No necesita conocimiento experto en machine learning (ML) ni integraciones complejas.

Proceso automatizado

El enriquecimiento semántico se produce automáticamente durante la ingesta de datos.

Relevancia de búsqueda mejorada

El enriquecimiento semántico mejora la calidad y la precisión contextual de los resultados de búsqueda.

Escalabilidad

El enriquecimiento semántico aplica la búsqueda semántica a grandes conjuntos de datos sin intervención manual.

Funcionamiento

Para comenzar a utilizar el enriquecimiento semántico automático, cree o edite una colección y especifique qué campos de sus datos requieren capacidades de búsqueda semántica. Una vez que identifica los campos para la búsqueda semántica, a medida que los datos entran en OpenSearch Service, el proceso de enriquecimiento semántico automático enriquece automáticamente estos campos. Los datos enriquecidos permiten realizar búsquedas más inteligentes y sensibles al contexto.

nota

Tenga en cuenta los siguientes factores al implementar el enriquecimiento semántico automático:

  • Sobrecarga de procesamiento: el proceso de enriquecimiento puede prolongar el tiempo de procesamiento durante la ingesta.

  • Implicaciones de almacenamiento: los datos enriquecidos requieren espacio de almacenamiento adicional.

  • Limitaciones de idioma: compruebe si la opción multilingüe es compatible con los idiomas requeridos.

El enriquecimiento semántico automático para sistemas sin servidor ofrece las siguientes opciones de idioma.

Opción solo en inglés
  • Optimizado para contenido en inglés

  • Ideal para aplicaciones que se ocupan principalmente de texto en inglés

Opción multilingüe
  • Admite los siguientes idiomas: árabe, bengalí, chino, inglés, finés, francés, hindi, indonesio, japonés, coreano, persa, ruso, español, swahili y telugu

  • Perfecto para diversos contenidos internacionales o aplicaciones multilingües

Configuración de permisos para el enriquecimiento semántico automático

Antes de crear un índice de enriquecimiento semántico automatizado, debe configurar los permisos necesarios. En esta sección, se explican los permisos necesarios y cómo configurarlos.

Permisos de política de IAM

Utilice la siguiente política de AWS Identity and Access Management (IAM) para conceder los permisos necesarios a fin de trabajar con el enriquecimiento semántico automático:

JSON
{ "Version":"2012-10-17", "Statement": [ { "Sid": "AutomaticSemanticEnrichmentPermissions", "Effect": "Allow", "Action": [ "aoss:CreateIndex", "aoss:GetIndex", "aoss:UpdateIndex", "aoss:DeleteIndex", "aoss:APIAccessAll" ], "Resource": "*" } ] }
Permisos de claves
  • Los permisos aoss:*Index permiten la administración de índices.

  • El permiso aoss:APIAccessAll permite las operaciones de la API de OpenSearch.

  • Para restringir los permisos a una colección específica, reemplace "Resource": "*" con el ARN de la colección.

Configurar los permisos de acceso a datos

A fin de configurar un índice para el enriquecimiento semántico automático, debe contar con las políticas de acceso a datos adecuadas que concedan permiso de acceso a los recursos de índices, canalizaciones y colecciones de modelos. Para obtener más información acerca de las políticas de acceso a datos, consulte Control de acceso a los datos para Amazon OpenSearch sin servidor. Para obtener información acerca del procedimiento de configuración de una política de acceso a datos, consulte Creación de políticas de acceso a los datos (consola).

Permisos de acceso a datos

[ { "Description": "Create index permission", "Rules": [ { "ResourceType": "index", "Resource": ["index/collection_name/*"], "Permission": [ "aoss:CreateIndex", "aoss:DescribeIndex", "aoss:UpdateIndex", "aoss:DeleteIndex" ] } ], "Principal": [ "arn:aws:iam::account_id:role/role_name" ] }, { "Description": "Create pipeline permission", "Rules": [ { "ResourceType": "collection", "Resource": ["collection/collection_name"], "Permission": [ "aoss:CreateCollectionItems", "aoss:DescribeCollectionItems" ] } ], "Principal": [ "arn:aws:iam::account_id:role/role_name" ] }, { "Description": "Create model permission", "Rules": [ { "ResourceType": "model", "Resource": ["model/collection_name/*"], "Permission": ["aoss:CreateMLResource"] } ], "Principal": [ "arn:aws:iam::account_id:role/role_name" ] }, ]

Permisos de acceso a la red

Para permitir que las API del servicio accedan a las colecciones privadas, debe configurar políticas de red que permitan el acceso necesario entre la API del servicio y la colección. Para obtener más información acerca de las políticas de red, consulte Acceso a la red para Amazon OpenSearch sin servidor.

[ { "Description":"Enable automatic semantic enrichment in a private collection", "Rules":[ { "ResourceType":"collection", "Resource":[ "collection/collection_name" ] } ], "AllowFromPublic":false, "SourceServices":[ "aoss.amazonaws.com" ], } ]
Configuración de los permisos de acceso a la red para una colección privada
  1. Inicie sesión en la consola de OpenSearch Service en https://console.aws.amazon.com/aos/home.

  2. En el panel de navegación de la izquierda, seleccione Políticas de red. A continuación, realice alguna de las operaciones siguientes:

    • Elija un nombre de política existente y seleccione Editar.

    • Elija Crear política de red y configure los detalles de la política.

  3. En el área Tipo de acceso, seleccione Privado (recomendado) y, a continuación, seleccione Acceso privado al servicio de AWS.

  4. En el campo de búsqueda, seleccione Servicio y, a continuación, aoss.amazonaws.com.

  5. En el área Tipo de recurso, seleccione la casilla Habilitar el acceso al punto de conexión de OpenSearch.

  6. Para Buscar en colecciones o introducir términos prefijos específicos, en el campo de búsqueda, seleccione Nombre de la colección. A continuación, escriba o seleccione el nombre de las colecciones que desee asociar a la política de red.

  7. Seleccione Crear para una nueva política de red o Actualizar para una política de red existente.