Avantages Comment ça marche Conditions préalables Cas d'utilisation de l'optimisation automatique Limitations Facturation et coûts Formats de données pris en charge Fonctionnalités associées

Optimisation automatique

Auto-Optimize est un service qui automatise les optimisations des index vectoriels, permettant aux utilisateurs d'équilibrer la qualité, la vitesse et le coût de la recherche sans nécessiter des semaines de réglage manuel par des experts. Il évalue les configurations d'index en fonction des exigences de latence et de rappel définies par l'utilisateur et génère des recommandations d'optimisation, de sorte qu'une expertise minimale est requise. Les recommandations sont généralement fournies dans un délai de 30 à 60 minutes.

La configuration d'index vectoriels traditionnelle nécessite une expertise et des expérimentations importantes pour obtenir des performances optimales. Des paramètres tels que ef_construction (qui contrôle la qualité de la création de l'index), m (qui détermine le nombre de connexions graphiques), ef_search (qui contrôle la recherche HNSW) et les méthodes de quantification (quantification binaire (32x, 16x, 8x), quantification scalaire (4x)) ont un impact significatif à la fois sur la précision de la recherche et sur l'utilisation des ressources. L'optimisation automatique utilise des algorithmes d'optimisation des hyperparamètres pour découvrir des configurations d'index particulièrement optimales pour votre ensemble de données, dans le respect des exigences de latence et de rappel définies.

Avantages

L'optimisation automatique pour OpenSearch offre les avantages suivants :

Réglage automatique des paramètres : élimine l'expérimentation manuelle avec les algorithmes (HNSW), la quantification, le rescore et les paramètres du moteur, ce qui permet de gagner du temps et de réduire la courbe d'apprentissage pour l'optimisation de la recherche vectorielle.
Optimisation de la vitesse de recherche : OpenSearch configuré par défaut pour les performances en mémoire. L'optimisation automatique découvre des compromis favorables qui améliorent la qualité de la recherche et réduisent les coûts tout en maintenant une vitesse de recherche acceptable.
Optimisation des coûts - Réduit les coûts en trouvant des options permettant de réduire les besoins en mémoire d'index tout en minimisant la qualité de la recherche et les compromis en matière de rapidité.
Optimisez la qualité des recherches : augmentez potentiellement le taux de rappel par rapport aux paramètres par défaut, ou découvrez des compromis avantageux permettant de réaliser des économies importantes avec une perte de rappel minimale.

L'optimisation automatique fonctionne parallèlement à d'autres OpenSearch fonctionnalités, telles que Accélération par GPU pour l'indexation vectorielle l'optimisation complète des performances pour les charges de travail de recherche vectorielle.

Comment ça marche

L'optimisation automatique fonctionne grâce à une architecture basée sur les tâches qui analyse vos données vectorielles et fournit des recommandations d'optimisation. Points clés :

Les utilisateurs partagent leurs ensembles de données au format Parquet ou JSONL dans un compartiment Amazon S3.
Ils configurent des tâches d'optimisation automatique sans serveur en configurant leurs seuils de rappel et de latence acceptables. Des seuils plus souples permettent au service de découvrir des optimisations de coûts plus importantes.
Optimisez automatiquement les tâches exécutées sur une infrastructure entièrement gérée par Amazon OpenSearch Service. Les offres d'emploi ne consomment pas les ressources de votre domaine ou de vos collections. Les travailleurs exécutent des tâches en parallèle pour évaluer les configurations d'index et utilisent l'échantillonnage sur de grands ensembles de données pour obtenir des résultats généralement en 30 à 60 minutes.
Chaque travail est facturé sur la base d'un forfait prévisible. Pour plus d'informations sur les tarifs, consultez Amazon OpenSearch Service Pricing.

Conditions préalables

Format et autorisations du jeu de données : votre ensemble de données doit être disponible sous la forme d'un ou de plusieurs fichiers Parquet ou JSONL dans un dossier de compartiment Amazon S3. Par exemple :
- Parquet : s3://dataset-bucket-us-east-1/dataset_folder/first_half.parquet et s3://dataset-bucket-us-east-1/dataset_folder/second_half.parquet
- JSON : s3://dataset-bucket-us-east-1/dataset_folder/data.jsonl
Indiquez l'URI du dossier annexe (par exemple,s3://dataset-bucket-us-east-1/dataset_folder/). Le dossier doit contenir des fichiers d'un format unique. Ne mélangez pas les fichiers Parquet et JSONL dans le même dossier. Ce jeu de données sera utilisé pour générer les recommandations. Assurez-vous que votre rôle fédéré dispose des autorisations Amazon S3 suivantes sur cette ressource :"s3:Get*", "s3:List*", "s3:Describe*".
Spécifiez les métadonnées de jeu de données correctes : le jeu de données fourni doit contenir des lignes de valeurs flottantes. Le nom de chaque colonne et la dimensionnalité de chaque vecteur doivent correspondre aux options fournies dans la console. Par exemple, si le jeu de données contient des vecteurs nommés train_data correspondant à chaque 768 dimension, ces valeurs doivent correspondre à celles de la console d'optimisation automatique.
(Si vous utilisez la fonction d'ingestion vectorielle) - Si vous prévoyez d'utiliser la fonctionnalité d'ingestion (en suivant les recommandations d'optimisation automatique pour créer automatiquement un index et ingérer des données), vous devez configurer votre OpenSearch cluster pour autoriser l'optimisation automatique à ingérer votre ensemble de données dans le cluster. OpenSearch Pour les OpenSearch domaines dotés d'une politique d'accès au domaine, accordez l'accès au rôle nouvellement créé par le biais de cette politique. Pour les OpenSearch domaines dotés d'un contrôle d'accès précis, ajoutez le rôle de pipeline en tant que rôle principal. Pour les collections OpenSearch sans serveur, ajoutez le rôle de pipeline à la politique d'accès aux données.
Autorisations IAM : vous devez disposer des autorisations IAM suivantes pour utiliser l'optimisation automatique :
- opensearch:SubmitAutoOptimizeJob
- opensearch:GetAutoOptimizeJob
- opensearch:DeleteAutoOptimizeJob
- opensearch:CancelAutoOptimizeJob
- opensearch:ListAutoOptimizeJobs
Note
Il s'agit de politiques basées sur l'identité. L'optimisation automatique ne prend pas en charge les politiques basées sur les ressources.
Expiration des informations d'identification : configurez votre session utilisateur fédérée pour que l'expiration des informations d'identification soit d'au moins 1 heure. Pour les ensembles de données très volumineux ou de grandes dimensions, envisagez d'augmenter la durée d'expiration jusqu'à 3 heures.

Cas d'utilisation de l'optimisation automatique

L'optimisation automatique est particulièrement utile dans les scénarios suivants :

Optimisation de la configuration initiale

Lors du premier déploiement d'applications de recherche vectorielle, la détermination des paramètres HNSW optimaux nécessite souvent des tests approfondis et une expertise du domaine. L'optimisation automatique élimine ce trial-and-error processus en analysant les caractéristiques de vos données et de votre charge de travail afin de recommander des configurations prêtes pour la production.

Ce cas d'utilisation est idéal pour les équipes qui découvrent la recherche vectorielle ou celles qui migrent depuis d'autres plateformes de base de données vectorielles et qui ont besoin d'établir rapidement des configurations de base de données vectorielles.

Optimisation de l'échelle

Au fur et à mesure que votre jeu de données vectorielles passe de milliers à des millions de vecteurs, les paramètres qui fonctionnaient bien au départ peuvent devenir sous-optimaux. L'optimisation automatique recommande des ajustements pour maintenir les performances à grande échelle.

Réduction des coûts

Les index vectoriels peuvent consommer d'importantes ressources de calcul et de stockage, en particulier dans le cas d'intégrations de grande dimension. L'optimisation automatique identifie les opportunités de réduction des coûts en trouvant des configurations de paramètres plus efficaces qui maintiennent les niveaux de performance requis tout en utilisant moins de ressources.

Par exemple, l'optimisation automatique peut détecter que votre m valeur actuelle (connectivité graphique) est supérieure à ce qui est nécessaire pour répondre à vos exigences de précision, ce qui vous permet de réduire le temps d'indexation et le stockage sans affecter la qualité de la recherche.

Dépannage des performances

Lorsque les performances des requêtes sont lentes ou que la latence est élevée dans les opérations de recherche vectorielle, l'optimisation automatique peut analyser votre ensemble de données et identifier une configuration plus optimale. Le service fournit des recommandations spécifiques pour remédier aux problèmes de performances, tels que le réglage de la connectivité graphique ou des paramètres de recherche.

Limitations

Disponibilité régionale - L'optimisation automatique n'est disponible que dans les AWS régions suivantes :
- ap-south-1
- eu-west-1
- us-west-2
- us-east-2
- us-east-1
- eu-central-1
- ap-southeast-2
- ap-northeast-1
- ap-southeast-1
Types de collections - L'optimisation automatique n'est prise en charge que pour les collections et OpenSearch les domaines de recherche vectorielle (2.19, 3.1 et 3.3).

Support moteur

Support du moteur par type de déploiement
Engine	sans serveur	OpenSearch Géré
Lucène	Non	Oui
Faiss	Oui	Oui
Nmslib	Non	Non

Prise en charge des algorithmes - L'optimisation automatique ne prend en charge que les index vectoriels basés sur HNSW.
Tâches simultanées : vous pouvez exécuter jusqu'à 10 tâches d'optimisation simultanées par compte et par région. Aucune nouvelle offre d'emploi ne peut être acceptée si la limite est atteinte.
Durée de la tâche : les tâches d'optimisation peuvent prendre de 15 minutes à plusieurs heures selon la taille du jeu de données, sa dimension et les indicateurs de performance requis.
Recommandations - L'optimisation automatique ne suggère que 3 recommandations au maximum.
Jeux de données
- Formats pris en charge : Parquet, JSONL
- Stockage de données : Amazon S3

Facturation et coûts

L'optimisation automatique utilise un modèle de tarification par tâche dans lequel vous payez pour chaque tâche d'optimisation réussie, indépendamment de la taille du jeu de données et des configurations d'optimisation. Aucun frais ne vous sera facturé en cas d'échec ou d'annulation de tâches. En outre, l'optimisation automatique s'exécute sur une infrastructure distincte de celle des OpenSearch clusters gérés ou sans serveur, de sorte qu'elle n'affecte pas l'utilisation des ressources des clusters préexistants.

Modèle de tarification

Les coûts d'optimisation automatique sont facturés séparément des coûts de calcul et de OpenSearch stockage standard pour les domaines OpenSearch gérés ou sans serveur.

Pour plus d'informations sur les tarifs, consultez Amazon OpenSearch Service Pricing.

Formats de données pris en charge

L'optimisation automatique prend en charge les formats de données suivants pour les ensembles de données vectoriels stockés dans Amazon S3 :

Format du parquet

Le parquet est un format de stockage en colonnes optimisé pour les charges de travail analytiques. Chaque fichier Parquet doit contenir une colonne de tableaux flottants représentant vos données vectorielles.

Exemple de structure de fichier Parquet (vue sous forme de tableau) :



| id  | train_data                     |
|-----|--------------------------------|
| 1   | [0.12, 0.45, 0.78, ..., 0.33] |
| 2   | [0.56, 0.89, 0.12, ..., 0.67] |
| 3   | [0.34, 0.67, 0.90, ..., 0.11] |

Format JSONL

JSONL (JSON Lines) est un format de texte dans lequel chaque ligne est un objet JSON valide. Chaque ligne doit contenir un champ avec un tableau flottant représentant vos données vectorielles.

Exemple de fichier JSONL :


{"id": 1, "train_data": [0.12, 0.45, 0.78, 0.33]}
{"id": 2, "train_data": [0.56, 0.89, 0.12, 0.67]}
{"id": 3, "train_data": [0.34, 0.67, 0.90, 0.11]}

Conversion entre formats

Si le format de vos données est différent, vous pouvez utiliser les scripts Python suivants pour les convertir.

Convertir JSON ou JSONL en Parquet


#!/usr/bin/env python3
import json
import pyarrow as pa
import pyarrow.parquet as pq
from pathlib import Path
from typing import Any, Dict, List


def load_json_any(path: Path) -> List[Dict[str, Any]]:
    """
    Load JSON that can be:
      - a list of objects
      - a single object
      - JSON Lines (one object per line)
    Returns list[dict].
    """
    text = path.read_text().strip()

    # Try full JSON file
    try:
        obj = json.loads(text)
        if isinstance(obj, list):
            return obj
        if isinstance(obj, dict):
            return [obj]
    except json.JSONDecodeError:
        pass

    # Fallback → JSON Lines
    records = []
    for i, line in enumerate(text.splitlines(), start=1):
        line = line.strip()
        if not line:
            continue
        try:
            rec = json.loads(line)
        except json.JSONDecodeError as e:
            raise ValueError(f"Invalid JSON on line {i}: {e}")
        if not isinstance(rec, dict):
            raise ValueError(f"Line {i} must contain a JSON object")
        records.append(rec)

    return records


def json_to_parquet(json_path: str, parquet_path: str, compression: str = "snappy"):
    """Convert ANY JSON to Parquet (schema inferred)."""
    records = load_json_any(Path(json_path))
    table = pa.Table.from_pylist(records)
    pq.write_table(table, parquet_path, compression=compression)
    print(f"Wrote {len(records)} rows to {parquet_path}")


if __name__ == "__main__":
    INPUT_JSON = "vectors.jsonl"
    OUTPUT_PARQUET = "vectors.parquet"
    json_to_parquet(INPUT_JSON, OUTPUT_PARQUET)

Convertir Parquet en JSONL


#!/usr/bin/env python3
import json
import pyarrow.parquet as pq


def parquet_to_jsonl(parquet_path: str, jsonl_path: str):
    """Convert a Parquet file to JSONL format."""
    table = pq.read_table(parquet_path)
    rows = table.to_pylist()
    with open(jsonl_path, "w") as f:
        for row in rows:
            f.write(json.dumps(row) + "\n")
    print(f"Wrote {len(rows)} rows to {jsonl_path}")


if __name__ == "__main__":
    INPUT_PARQUET = "vectors.parquet"
    OUTPUT_JSONL = "vectors.jsonl"
    parquet_to_jsonl(INPUT_PARQUET, OUTPUT_JSONL)

Auto-optimize fonctionne avec d'autres fonctionnalités d'Amazon OpenSearch Service pour vous aider à créer et à optimiser des applications de recherche vectorielle :

Accélération par GPU pour l'indexation vectorielle- Accélérez la création d'index vectoriels à l'aide de l'accélération par GPU pour réduire le temps et les coûts d'indexation.
Ingestion de vecteurs- Ingérez et indexez rapidement les données vectorielles d'Amazon S3 dans votre domaine ou votre collection.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Afficher les tâches d'ingestion de vecteurs et l'historique des importations

Utilisation de l'optimisation automatique dans la console