k-NN-Hyperparameter - Amazon SageMaker AI

k-NN-Hyperparameter

In der folgenden Tabelle sind die Hyperparameter aufgeführt, die Sie für den Algorithmus k-Nearest Neighbors (k-NN) in Amazon SageMaker AI festlegen können.

Name des Parameters Beschreibung
feature_dim

Die Anzahl der Merkmale der Eingabedaten.

Erforderlich

Gültige Werte: positive Ganzzahl.

k

Die Anzahl der nächsten Nachbarn.

Erforderlich

Gültige Werte: positive Ganzzahl

predictor_type

Der Inferenztyp, der für die Datenbezeichnungen verwendet werden soll.

Erforderlich

Gültige Werte: Classifier für die Klassifizierung oder regressor für die Regression.

sample_size

Die Anzahl der Datenpunkte, die aus dem Trainingsdatensatz gesampelt werden soll.

Erforderlich

Gültige Werte: positive Ganzzahl

dimension_reduction_target

Die Zieldimension, auf die reduziert werden soll.

Erforderlich, wenn Sie den dimension_reduction_type-Parameter angeben.

Gültige Werte: positive Ganzzahl größer als 0 und kleiner als feature_dim.

dimension_reduction_type

Der Typ der Dimensionsreduzierungsmethode.

Optional

Gültige Werte: sign für zufällige Projektion oder fjlt für die schnelle Johnson-Lindenstrauss-Transformation.

Standardwert: Keine Dimensionsreduzierung

faiss_index_ivf_nlists

Die Anzahl der Schwerpunkte, die im Index erstellt werden sollen, wenn index_type faiss.IVFFlat oder faiss.IVFPQ lautet.

Optional

Gültige Werte: positive Ganzzahl

Standardwert: auto, der in sqrt(sample_size) aufgelöst wird.

faiss_index_pq_m

Die Anzahl der Vektorsubkomponenten zur Erstellung im Index, wenn index_type auf faiss.IVFPQ eingestellt ist.

Die FaceBook AI Similarity Search (FAISS)-Bibliothek erfordert, dass der Wert von faiss_index_pq_m ein Divisor der Datendimension ist. Wenn faiss_index_pq_m kein Divisor der Datendimension ist, erhöhen wir die Datendimension auf die kleinste Ganzzahl, die durch faiss_index_pq_m teilbar ist. Wenn keine Dimensionsreduzierung angewendet wird, fügt der Algorithmus eine Auffüllung mit Nullen hinzu. Wenn die Dimensionsreduzierung angewendet wird, erhöht der Algorithmus den Wert des dimension_reduction_target-Hyperparameters.

Optional

Gültige Werte: Eine der folgenden positiven Ganzzahlen: 1, 2, 3, 4, 8, 12, 16, 20, 24, 28, 32, 40, 48, 56, 64, 96

index_metric

Die Metrik, um den Abstand zwischen den Punkten bei der Suche nach den nächsten Nachbarn zu messen. Wenn Trainings mit dem Wert index_type auf faiss.IVFPQ ausgeführt werden, werden INNER_PRODUCT-Entfernung und COSINE-Ähnlichkeit nicht unterstützt.

Optional

Gültige Werte: L2 für die euklidische Entfernung, INNER_PRODUCT für die innere Produktentfernung, COSINE für Kosinusähnlichkeit.

Standardwert: L2

index_type

Der Typ des Index.

Optional

Zulässige Werte:faiss.Flat, faiss.IVFFlat, faiss.IVFPQ.

Standardwerte: faiss.Flat

mini_batch_size

Die Anzahl der Beobachtungen pro Mini-Stapel für den Dateniterator.

Optional

Gültige Werte: positive Ganzzahl

Standardwert: 5000