View a markdown version of this page

Créer des collections - Amazon OpenSearch Service

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Créer des collections

Vous pouvez utiliser la console ou le AWS CLI pour créer une collection sans serveur. Ces étapes expliquent comment créer une recherche ou une collection de séries chronologiques. Pour créer une collection de recherche vectorielle, voirUtilisation de collections de recherche vectorielle.

Avant de créer une collection, assurez-vous de disposer des autorisations requises. Pour de plus amples informations, veuillez consulter Configuration des autorisations pour les collections.

Amazon OpenSearch Serverless prend en charge deux générations de collections :

  • NextGen— La dernière génération de OpenSearch Serverless avec mise à l'échelle automatique instantanée et mise à l'échelle jusqu'à zéro pour optimiser les coûts. Utilise des groupes de collecte pour la gestion de la capacité partagée entre plusieurs collections. Offre un flux de création simplifié sur une seule page avec les options Express Create et Standard Create.

  • Classique — Utilise un assistant en plusieurs étapes avec une configuration de sécurité, de réseau et de chiffrement par collection. Chaque collection est configurée indépendamment.

Lorsque vous choisissez Créer une collection sur la page Collections, la console ouvre le formulaire de NextGencréation par défaut. Vous pouvez passer d'une génération à l'autre à tout moment à l'aide du NextGen lien Switch to Classic ou Switch to dans le champ Génération sans serveur du formulaire de création.

Configuration des paramètres NextGen de collecte

Les étapes suivantes sont communes aux méthodes Express Create et Standard Create.

Pour configurer les paramètres NextGen de collecte
  1. Accédez à la console Amazon OpenSearch Service à l'adresse https://console.aws.amazon.com/aos/home/.

  2. Développez Serverless (Sans serveur) dans le panneau de navigation de gauche et choisissez Collections.

  3. Choisissez Create collection (Créer une collection). Le formulaire NextGen de création de collection apparaît par défaut.

    Astuce

    Pour créer une collection classique à la place, choisissez Basculer vers la collection classique dans le champ Génération sans serveur.

  4. Saisissez un nom et une description pour la collection. Le nom doit répondre aux critères suivants :

    • est propre à votre compte et Région AWS

    • Contient uniquement les lettres minuscules a-z, les chiffres 0-9 et le trait d'union (-)

    • Contient entre 3 et 32 caractères

  5. Choisissez un type de collection :

    • Recherche : Full-text recherche qui alimente les applications de vos réseaux internes et les applications connectées à Internet. Toutes les données de recherche sont stockées dans le stockage à chaud afin de garantir des temps de réponse rapides aux requêtes.

    • Recherche vectorielle : recherche sémantique sur les intégrations vectorielles qui simplifie la gestion des données vectorielles. Promeut les expériences de recherche augmentées par le machine learning (ML) et les applications d'IA génératives.

    Pour de plus amples informations, veuillez consulter Choix d'un type de collection.

  6. Choisissez une méthode de création de collection : Express Create ou Standard Create.

Création d'une NextGen collection (Express Create)

Express Create vous permet de configurer rapidement une NextGen collection avec des valeurs par défaut judicieuses. OpenSearch Serverless crée automatiquement le groupe de collecte, le chiffrement, le réseau et les politiques d'accès aux données requis pour vous en fonction du nom et du type de collecte que vous fournissez.

Note

Vous pouvez également accéder à Express Create depuis :

  • Le bouton de création express dans le bandeau d'information bleu sur la page d'accueil d'Amazon OpenSearch Service

  • Le bouton de création express sur la carte Get Started Quick Create

Les deux ouvrent directement un modal Express Create sans accéder à la page de création complète.

Lorsque vous utilisez Express Create depuis le modal, vous pouvez créer une collection en quelques secondes sans accéder au formulaire de création de collection complet. Entrez un nom de collection, choisissez un type de collection (recherche ou recherche vectorielle), puis choisissez Créer une collection. OpenSearch Serverless configure automatiquement les paramètres restants avec des valeurs par défaut raisonnables.

Vous pouvez développer la section Détails de configuration pour revoir ou modifier les paramètres tels que le groupe de collecte, les paramètres de l' OpenSearch interface utilisateur, le chiffrement, l'accès au réseau et l'accès aux données avant de créer la collection. Certains paramètres peuvent également être modifiés après leur création.

Pour créer une NextGen collection à l'aide d'Express Create
  1. Après avoir configuré le nom, la description et le type de collection (voirConfiguration des paramètres NextGen de collecte), choisissez Express Create comme méthode de création de collection.

  2. Consultez le tableau des paramètres par défaut que OpenSearch Serverless configure en votre nom :

    • Groupe de collection : pour un nouvel utilisateur, un nom de groupe de collection par défaut est généré automatiquement en fonction du nom de la collection. Vous pouvez modifier le nom en cliquant sur l'icône d'édition. Pour un utilisateur récurrent, les groupes de NextGen collections existants du type sélectionné sont affichés. L'un d'eux est sélectionné par défaut. Vous pouvez sélectionner n'importe quel autre groupe de collection existant dans le menu déroulant.

    • OpenSearch Paramètres de l'interface utilisateur — Utilise une OpenSearch application existante par défaut. Le nom de l'application et le nom de l'espace de travail sont modifiables après leur création.

    • Chiffrement — La collection est cryptée avec un Clé détenue par AWS.

    • Accès au réseau — La collection est accessible depuis les réseaux publics.

    • Accès aux données — Une politique d'accès aux données est automatiquement créée pour accorder au principal IAM actuel un accès complet à la collection et à ses index.

  3. Choisissez Create collection (Créer une collection).

L'état de la collection s'afficheCreating. Attendez que le statut de la collecte passe à la valeur Active avant de commencer à indexer les données. Cela prend généralement plusieurs minutes.

Création d'une NextGen collection (création standard)

Standard Create vous donne un contrôle total sur le groupe de collecte, le chiffrement, le réseau et la configuration de l'accès aux données.

Pour créer une NextGen collection à l'aide de Standard Create
  1. Suivez les étapes 1 à 5 de. Configuration des paramètres NextGen de collecte

  2. Sous Méthode de création de collection, sélectionnez Création standard.

    Le formulaire s'agrandit pour afficher les sections de configuration complètes décrites dans les sections suivantes.

Configurer le groupe de collecte

Choisissez le mode d'attribution d'un groupe de collecte. Vous pouvez sélectionner un groupe compatible existant ou en créer un nouveau, même s'il existe déjà des groupes compatibles.

  • Sélectionnez un groupe de collection existant : choisissez un groupe de collection compatible dans la liste déroulante. Le groupe doit prendre en charge le type de collection que vous avez sélectionné. La console affiche les limites de capacité actuelles du groupe (min/max OCU pour l'indexation et la recherche).

  • Créer un nouveau — Créez un nouveau groupe de collecte avec des limites de capacité personnalisées :

    • Nom du groupe de collection — Auto-generated asnextgen-{collection-name}. Vous pouvez modifier ce nom. Le nom est normalisé en minuscules, les traits d'union remplacent les traits de soulignement et il est tronqué à 32 caractères.

    • Capacité d'indexation minimale (en OCU) — Facultative. Laissez ce champ vide sans minimum.

    • Capacité d'indexation maximale (en OCU) — La valeur par défaut est 96.

    • Capacité de recherche minimale (en OCU) — Facultative. Laissez ce champ vide sans minimum.

    • Capacité de recherche maximale (en OCU) — La valeur par défaut est 96.

Configuration du chiffrement

Choisissez une option de chiffrement :

  • Utiliser une clé AWS détenue (par défaut) : Amazon OpenSearch Service gère la clé de chiffrement sans frais supplémentaires.

  • Utiliser une clé gérée par le client : sélectionnez une AWS KMS clé dans votre compte.

(Facultatif) Cochez la case Personnaliser les paramètres de chiffrement pour choisir ou créer une AWS KMS clé différente.

Pour plus d'informations sur les politiques de chiffrement, consultezChiffrement dans Amazon OpenSearch Serverless.

Configuration de l’accès réseau

Configurez l'accès réseau pour votre collection :

  • Activez ou désactivez l'accès public au OpenSearch point de terminaison.

  • (Facultatif) Ajoutez des règles de point de terminaison VPC pour restreindre l'accès.

Configuration de la politique d'accès aux données

Choisissez le mode de configuration de l'accès aux données :

  • Créer une nouvelle politique — Définissez une nouvelle politique d'accès aux données :

    • Entrez un nom de politique et une description facultative.

    • Utilisez l'éditeur visuel pour ajouter des instructions avec des principes et des autorisations de ressources, ou passez à l'éditeur JSON pour modifier directement les politiques.

    • Ajoutez des principes : utilisateurs et rôles IAM, utilisateurs et groupes SAML, ou utilisateurs et groupes.

    • Spécifiez les autorisations de ressources pour les collections et les index.

  • Ajouter à une politique existante : sélectionnez une politique d'accès aux données existante dans la liste déroulante.

Configurer des paramètres supplémentaires

  • (Facultatif) Ajoutez des balises à votre collection sous forme de paires clé-valeur.

Configurer les paramètres de OpenSearch l'interface utilisateur

Configurez l' OpenSearch application et l'espace de travail pour votre collection :

  • Pour sélectionner une OpenSearch application, choisissez l'une des options suivantes :

    • Sélectionnez une OpenSearch application existante : choisissez une application existante dans le menu déroulant du nom de OpenSearch l'application. Ensuite, pour la sélection de l'espace de travail, choisissez Sélectionner l'espace de travail existant ou Créer un nouvel espace de travail et entrez un nom.

    • Créer une nouvelle OpenSearch application — Entrez le nom de la nouvelle application. Vous devez également créer un nouvel espace de travail : entrez un nom pour l'espace de travail.

Pour créer la collection, passez en revue votre configuration et choisissez Soumettre.

Une fois que vous l'avez soumise, la collection passe au statut Création. La console crée également le groupe de collecte (s'il est nouveau), la politique de chiffrement, la politique réseau et la politique d'accès aux données selon les besoins. Lorsque le statut de la collection passe à Active, elle est prête à être utilisée. Cela prend généralement plusieurs minutes.

Création d'une collection classique

Les collections classiques utilisent un assistant en plusieurs étapes avec une configuration de sécurité, de réseau et de chiffrement par collection. Chaque collection est configurée indépendamment.

Configuration des paramètres de collecte (classique)

Pour configurer les paramètres de collecte de base (Classic)
  1. Accédez à la console Amazon OpenSearch Service à l'adresse https://console.aws.amazon.com/aos/home/. Dans le volet de navigation de gauche, développez Serverless et choisissez Collections.

  2. Choisissez Create collection (Créer une collection).

    La console ouvre le formulaire de création NextGen de collection par défaut.

  3. Dans le champ Génération sans serveur, choisissez Passer à la version classique.

    La console accède à l'assistant de création de collection classique. Le champ de génération sans serveur affiche désormais Classic avec une description : Il s'agit du flux de création de collections classiques.

    Astuce

    Pour revenir à NextGen, choisissez Basculer vers NextGen dans le champ Génération sans serveur.

  4. Donnez un nom et une description à la collection. Le nom doit répondre aux critères suivants :

    • est propre à votre compte et Région AWS

    • Ne contient que des lettres minuscules de a à z, les chiffres de 0 à 9 et le trait d'union (-)

    • Contient entre 3 et 32 caractères

  5. Choisissez un type de collection :

    • Séries temporelles : segment d'analyse des journaux qui se concentre sur des gros volumes de données semi-structurées et générées par des machines. Au moins 24 heures de données sont stockées sur des index chauds, le reste étant stocké à chaud.

    • Recherche : Full-text recherche qui alimente les applications de vos réseaux internes et les applications connectées à Internet. Toutes les données de recherche sont stockées dans le stockage à chaud afin de garantir des temps de réponse rapides aux requêtes. Choisissez cette option si vous activez la recherche sémantique automatique.

    • Recherche vectorielle — Recherche sémantique sur les intégrations vectorielles qui simplifie la gestion des données vectorielles. Favorise les expériences de recherche augmentées par le machine learning (ML) et les applications d'IA génératives telles que les chatbots, les assistants personnels et la détection des fraudes.

  6. (Facultatif) Configurez les options de déploiement :

    • Répliques de secours : choisissez d'activer ou non les répliques de secours pour une haute disponibilité.

    • Accélération GPU — Pour les collections de recherche vectorielle, choisissez d'activer ou non l'accélération GPU.

  7. Choisissez Suivant.

Pour configurer les politiques de sécurité et d'accès (Classic)
  1. Politique de chiffrement — Choisissez le mode de chiffrement des données de votre collection :

    • Utiliser une clé AWS détenue (par défaut) : Amazon OpenSearch Service gère la clé de chiffrement sans frais supplémentaires.

    • Utiliser une clé gérée par le client : sélectionnez une AWS KMS clé dans votre compte pour le chiffrement.

    (Facultatif) Sélectionnez Utiliser une politique existante si une stratégie de chiffrement correspondante existe déjà pour le nom de votre collection.

  2. Accès au réseau : configurez la manière dont les utilisateurs et les applications accèdent à votre collection :

    • Activez ou désactivez l'accès au OpenSearch point de terminaison.

    • Activez ou désactivez l'accès aux OpenSearch tableaux de bord.

    • Choisissez Accès public ou limitez l'accès via les points de terminaison VPC.

  3. Politique d'accès aux données — Définissez les principaux autorisés à accéder aux données de votre collection :

    • Créer une nouvelle politique : définissez une nouvelle politique d'accès aux données à l'aide de l'éditeur visuel ou de l'éditeur JSON. Ajoutez des principaux (utilisateurs IAM, rôles IAM ou utilisateurs et groupes SAML) et spécifiez les autorisations relatives aux ressources.

    • Ajouter à une politique existante : sélectionnez une politique d'accès aux données existante dans la liste déroulante.

  4. Choisissez Suivant.

Configurer l' OpenSearch interface utilisateur (classique)

Configurez l' OpenSearch application et l'espace de travail pour votre collection :

  • Pour sélectionner une OpenSearch application, choisissez l'une des options suivantes :

    • Sélectionnez une OpenSearch application existante : choisissez une application existante dans le menu déroulant du nom de OpenSearch l'application. Ensuite, pour la sélection de l'espace de travail, choisissez Sélectionner l'espace de travail existant ou Créer un nouvel espace de travail et entrez un nom.

    • Créer une nouvelle OpenSearch application — Entrez le nom de la nouvelle application. Vous devez également créer un nouvel espace de travail : entrez un nom pour l'espace de travail.

Choisissez Suivant.

Configuration de champs de recherche supplémentaires (classique)

Les options affichées sur cette page dépendent du type de collection que vous créez.

  • Collections de recherche : configurez l'enrichissement sémantique automatique et les champs de recherche lexicale.

  • Collections de séries chronologiques : configurez les champs de recherche de séries chronologiques.

  • Collections de recherche vectorielle : configurez les champs vectoriels, y compris le nom du champ, les dimensions et la métrique de distance.

(Facultatif) Configurez les champs de recherche correspondant à votre type de collection. Choisissez Suivant. Vérifiez tous les paramètres sur la page de résumé et choisissez Soumettre pour créer la collection.

Une fois que vous l'avez soumise, la collection passe au statut Création. Lorsque le statut passe à Active, la collection est prête à être utilisée.

Configuration de l'enrichissement sémantique automatique

Lorsque vous créez ou modifiez une collection, vous pouvez configurer l'enrichissement sémantique automatique, ce qui simplifie la mise en œuvre et les fonctionnalités de recherche sémantique dans Amazon OpenSearch Service. La recherche sémantique renvoie des résultats de requête qui intègrent non seulement la correspondance des mots clés, mais aussi l'intention et le sens contextuel de la recherche de l'utilisateur. Pour de plus amples informations, veuillez consulter Enrichissement sémantique automatique pour Serverless.

Pour configurer l'enrichissement sémantique automatique
  1. Dans la section Détails de l'index, pour Nom de l'index, spécifiez un nom.

  2. Dans la section Champs d'enrichissement sémantique automatique, choisissez Ajouter un champ de recherche sémantique.

  3. Dans le champ Nom du champ d'entrée pour l'enrichissement sémantique, entrez le nom du champ que vous souhaitez enrichir.

  4. Le type de données est Texte. Vous ne pouvez pas modifier cette valeur.

  5. Pour Langue, choisissez Anglais ou Multilingue.

  6. Choisissez Ajouter un champ.

  7. Une fois que vous avez fini de configurer les champs facultatifs pour votre collection, choisissez Next.

  8. Passez en revue vos modifications et choisissez Soumettre pour créer la collection.

Configuration des champs de recherche de séries chronologiques

Les options de la section Champs de recherche des séries chronologiques concernent les données des séries chronologiques et les flux de données. Pour plus d'informations sur ces sujets, consultezGestion des séries chronologiques dans Amazon OpenSearch Service à l'aide de flux de données.

Pour configurer les champs de recherche de séries chronologiques
  1. Dans la section Champs de recherche de séries chronologiques, choisissez Ajouter un champ de série chronologique.

  2. Pour Nom du champ, entrez un nom.

  3. Pour Type de données, choisissez un type dans la liste.

  4. Choisissez Ajouter un champ.

  5. Une fois que vous avez fini de configurer les champs facultatifs pour votre collection, choisissez Next.

  6. Passez en revue vos modifications et choisissez Soumettre pour créer la collection.

Configuration des champs de recherche lexicaux

La recherche lexicale cherche à obtenir une correspondance exacte entre une requête de recherche et des termes ou mots clés indexés.

Pour configurer les champs de recherche lexicaux
  1. Dans la section Champs de recherche lexicaux, choisissez Ajouter un champ de recherche.

  2. Pour Nom du champ, entrez un nom.

  3. Pour Type de données, choisissez un type dans la liste.

  4. Choisissez Ajouter un champ.

  5. Une fois que vous avez fini de configurer les champs facultatifs pour votre collection, choisissez Next.

  6. Passez en revue vos modifications et choisissez Soumettre pour créer la collection.

Configuration des champs de recherche vectorielle

Note

La Engine propriété n'est configurable qu'avec les collections classiques et n'est pas prise en charge pour les NextGen collections.

Pour configurer les champs de recherche vectorielle
  1. Dans la section Champs vectoriels, choisissez Ajouter un champ vectoriel.

  2. Pour Nom du champ, entrez un nom.

  3. Pour Engine, choisissez un type dans la liste.

  4. Entrez le nombre de dimensions.

  5. Pour Distance Metric, choisissez un type dans la liste.

  6. Une fois que vous avez fini de configurer les champs facultatifs pour votre collection, choisissez Next.

  7. Passez en revue vos modifications et choisissez Soumettre pour créer la collection.