Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Enrichissement sémantique automatique pour Amazon Service OpenSearch
Amazon OpenSearch Service utilise le word-to-word matching (recherche lexicale) pour trouver des résultats, comme les autres moteurs de recherche traditionnels. Cette approche fonctionne bien pour des requêtes spécifiques telles que les codes de produits ou les numéros de modèle, mais elle est difficile pour les recherches abstraites où la compréhension de l'intention de l'utilisateur devient cruciale. Par exemple, lorsque vous recherchez « chaussures pour la plage », la recherche lexicale fait correspondre les mots « chaussures », « plage », « pour » et « le » dans les articles du catalogue, ce qui peut faire disparaître des produits pertinents tels que « sandales imperméables » ou « chaussures de surf » qui ne contiennent pas les termes de recherche exacts.
L'enrichissement sémantique automatique résout cette limite en tenant compte à la fois des correspondances de mots clés et de la signification contextuelle des recherches. Cette fonctionnalité comprend l'intention de recherche et améliore la pertinence de la recherche jusqu'à 20 %. Activez cette fonctionnalité pour les champs de texte de votre index afin d'améliorer les résultats de recherche.
Note
AAutomatic l'enrichissement sémantique est disponible pour les domaines OpenSearch de service exécutant la version 2.19 ou ultérieure. En outre, les domaines dotés de OpenSearch la version 2.19 doivent également disposer de la dernière mise à jour de la version du logiciel de service.
Comment ça marche
Le processus d'enrichissement analyse les champs de texte désignés et génère des intégrations sémantiques qui capturent le sens et le contexte. Ces intégrations aident le moteur de recherche à comprendre les relations entre les concepts, les synonymes et les termes connexes, même s'ils n'apparaissent pas dans votre requête de recherche. Par exemple, si un utilisateur recherche « comment traiter un mal de tête », un système de recherche sémantique peut renvoyer les résultats suivants :
-
Remèdes contre la migraine
-
Techniques de gestion de la douleur
-
Over-the-counter analgésiques
-
Méthodes naturelles de soulagement des maux de tête
Le système comprend l'intention sous-jacente même lorsque ces phrases exactes ne figurent pas dans la requête d'origine.
L'enrichissement sémantique automatique offre les avantages suivants :
- Implémentation simplifiée
-
Vous n'avez pas besoin d'expertise en apprentissage automatique ou d'intégrations complexes pour implémenter des fonctionnalités de recherche sémantique.
- Configuration au niveau de l'indice
-
L'enrichissement sémantique est configuré au niveau de l'index lors de la création, ce qui vous permet de contrôler de manière granulaire les données faisant l'objet d'un traitement sémantique.
- Impact minimal sur la latence de recherche
-
L'enrichissement sémantique automatique stocke les encodages fragmentés directement dans votre index lors de l'indexation. Vous n'avez pas besoin d'index KNN séparés. Vos recherches conservent leur vitesse initiale tout en fournissant des résultats améliorés.
- Processus automatisé
-
L'enrichissement sémantique s'effectue automatiquement lors de l'ingestion des données sans intervention manuelle.
- Pertinence de recherche améliorée
-
L'enrichissement sémantique améliore la qualité et la précision contextuelle des résultats de recherche en comprenant les intentions des utilisateurs.
- Capacité de mise à l’échelle
-
L'enrichissement sémantique applique des fonctionnalités de recherche sémantique à de grands ensembles de données sans intervention manuelle.
Exigences et considérations
Avant de mettre en œuvre l'enrichissement sémantique automatique, tenez compte des exigences et limites suivantes :
- Exigences relatives à la version
-
L'enrichissement sémantique automatique est disponible pour Amazon OpenSearch Service version 2.19 et versions ultérieures. Pour les domaines existants exécutant Amazon OpenSearch Service version 2.19 ou 3.1, vous devez passer à la dernière version du correctif pour utiliser cette fonctionnalité.
- Domaines publics uniquement
-
L'enrichissement sémantique automatique n'est disponible que pour les domaines publics. Vous ne pouvez pas l'utiliser avec des domaines VPC.
- Frais de traitement
-
Le processus d'enrichissement ajoute un temps de traitement minimal lors de l'ingestion des données, car le système génère des intégrations sémantiques pour les champs désignés.
- Implications en matière
-
Les données enrichies nécessitent un espace de stockage supplémentaire pour les intégrations sémantiques générées parallèlement à vos données d'origine.
- Prise en charge des langages
-
L'enrichissement sémantique automatique pour les domaines gérés propose les options linguistiques suivantes :
- Option en anglais uniquement
-
-
Idéal pour les applications traitant principalement du texte en anglais
-
- Option multilingue
-
-
Supporte les langues suivantes : anglais, arabe, bengali, chinois, finnois, français, hindi, indonésien, japonais, coréen, persan, russe, espagnol, swahili et télougou
-
Parfait pour les contenus internationaux variés ou les applications multilingues
-
Tarification
Avec l'enrichissement sémantique automatique, vous ne payez que pour les ressources consommées par votre charge de travail. La capacité de calcul est mesurée en unités de OpenSearch calcul (OCUs). Consultez les détails des tarifs pour votre région spécifique et l'illustration des prix sur la page https://aws.amazon.com/opensearch-service/pricing/
Exemple de configuration d'index
Pour un exemple pratique, reportez-vous au billet de blog https://aws.amazon.com/blogs/big-data/boosting-search-relevance-automatic-semantic-enrichment-in-amazon-opensearch-serverless/
Configuration des autorisations pour l'enrichissement sémantique automatique
Avant de créer un index avec enrichissement sémantique automatique, vous devez configurer les autorisations requises. Cette section explique les autorisations nécessaires pour les différentes opérations d'indexation et explique comment les configurer pour les scénarios de contrôle d'accès Gestion des identités et des accès AWS (IAM) et les scénarios de contrôle d'accès détaillés.
Autorisations IAM
Les autorisations IAM suivantes sont requises pour les opérations d'enrichissement sémantique automatique. Ces autorisations varient en fonction de l'opération d'indexation spécifique que vous souhaitez effectuer.
CreateIndex Autorisations d'API
Pour créer un index avec enrichissement sémantique automatique, vous devez disposer des autorisations IAM suivantes :
-
es:CreateIndex— Créez un index doté de fonctionnalités d'enrichissement sémantique. -
es:ESHttpHead— Exécute des requêtes HEAD pour vérifier l'existence de l'index. -
es:ESHttpPut— Exécute des requêtes PUT pour la création d'index. -
es:ESHttpPost— Exécute des requêtes POST pour les opérations d'indexation.
UpdateIndex Autorisations d'API
Pour mettre à jour un index existant avec un enrichissement sémantique automatique, vous devez disposer des autorisations IAM suivantes :
-
es:UpdateIndex— Mettez à jour les paramètres d'index et les mappages. -
es:ESHttpPut— Exécute des requêtes PUT pour les mises à jour de l'index. -
es:ESHttpGet— Exécute des requêtes GET pour récupérer les informations d'index. -
es:ESHttpPost— Exécute des requêtes POST pour les opérations d'indexation.
GetIndexAutorisations d'API
Pour récupérer des informations sur un index avec enrichissement sémantique automatique, vous devez disposer des autorisations IAM suivantes :
-
es:GetIndex— Récupérez les informations et les paramètres de l'index. -
es:ESHttpGet— Exécute des requêtes GET pour récupérer les données d'index.
DeleteIndex Autorisations d'API
Pour supprimer un index avec enrichissement sémantique automatique, vous devez disposer des autorisations IAM suivantes :
-
es:DeleteIndex— Supprime un index et ses composants d'enrichissement sémantique. -
es:ESHttpDelete— Exécute des requêtes DELETE pour la suppression d'index.
Exemple de politique IAM
L'exemple de politique d'accès basée sur l'identité suivant fournit les autorisations nécessaires à un utilisateur pour gérer des index avec enrichissement sémantique automatique :
{ "Version": "2012-10-17", "Statement": [ { "Sid": "AllowSemanticEnrichmentIndexOperations", "Effect": "Allow", "Action": [ "es:CreateIndex", "es:UpdateIndex", "es:GetIndex", "es:DeleteIndex", "es:ESHttpHead", "es:ESHttpGet", "es:ESHttpPut", "es:ESHttpPost", "es:ESHttpDelete" ], "Resource": "arn:aws:es:aws-region:111122223333:domain/domain-name/*" } ] }
Remplacez aws-region111122223333, et domain-name par vos valeurs spécifiques. Vous pouvez restreindre davantage l'accès en spécifiant des modèles d'index particuliers dans l'ARN de la ressource.
Autorisations de contrôle d'accès détaillées
Si le contrôle d'accès détaillé de votre domaine Amazon OpenSearch Service est activé, vous avez besoin d'autorisations supplémentaires en plus des autorisations IAM. Les autorisations suivantes sont requises pour chaque opération d'indexation.
CreateIndex Autorisations d'API
Lorsque le contrôle d'accès détaillé est activé, les autorisations supplémentaires suivantes sont requises pour créer un index avec enrichissement sémantique automatique :
-
indices:admin/create— Crée des opérations d'indexation. -
indices:admin/mapping/put— Créez et mettez à jour des mappages d'index. -
cluster:admin/opensearch/ml/create_connector— Créez des connecteurs d'apprentissage automatique pour le traitement sémantique. -
cluster:admin/opensearch/ml/register_model— Enregistrez des modèles d'apprentissage automatique à des fins d'enrichissement sémantique. -
cluster:admin/ingest/pipeline/put— Créez des pipelines d'ingestion pour le traitement des données. -
cluster:admin/search/pipeline/put— Créez des pipelines de recherche pour le traitement des requêtes.
UpdateIndex Autorisations d'API
Lorsque le contrôle d'accès détaillé est activé, les autorisations supplémentaires suivantes sont requises pour mettre à jour un index avec enrichissement sémantique automatique :
-
indices:admin/get— Récupère les informations d'index. -
indices:admin/settings/update— Mettez à jour les paramètres de l'index. -
indices:admin/mapping/put— Met à jour les mappages d'index. -
cluster:admin/opensearch/ml/create_connector— Créez des connecteurs d'apprentissage automatique. -
cluster:admin/opensearch/ml/register_model— Enregistrez des modèles d'apprentissage automatique. -
cluster:admin/ingest/pipeline/put— Créez des pipelines d'ingestion. -
cluster:admin/search/pipeline/put— Créez des pipelines de recherche. -
cluster:admin/ingest/pipeline/get— Récupère les informations du pipeline d'ingestion. -
cluster:admin/search/pipeline/get— Récupère les informations du pipeline de recherche.
GetIndexAutorisations d'API
Lorsque le contrôle d'accès détaillé est activé, les autorisations supplémentaires suivantes sont requises pour récupérer les informations relatives à un index avec enrichissement sémantique automatique :
-
indices:admin/get— Récupère les informations d'index. -
cluster:admin/ingest/pipeline/get— Récupère les informations du pipeline d'ingestion. -
cluster:admin/search/pipeline/get— Récupère les informations du pipeline de recherche.
DeleteIndex Autorisations d'API
Lorsque le contrôle d'accès détaillé est activé, les autorisations supplémentaires suivantes sont requises pour supprimer un index avec enrichissement sémantique automatique :
-
indices:admin/delete— Supprime les opérations d'indexation.