Benennungsregeln und Datentypen - Amazon SageMaker AI

Benennungsregeln und Datentypen

Kontingent-Terminologien

  • Leseanfragen (RRU): Maß für den Lesedurchsatz, wobei die Anzahl der RRUs pro Leseanforderung der Obergrenze der Größe eines Lesedatensatzes entspricht, aufgeteilt in Blöcke von 4 KB. Die minimale RRU pro Anfrage ist 0.

  • Schreibanforderungseinheit (WRU): Maß für den Schreibdurchsatz, wobei die Anzahl der WRUs pro Schreibanforderung der Obergrenze der Größe des geschriebenen Datensatzes entspricht, aufgeteilt in Blöcke von 1 KB. Die Mindest-WRU pro Anfrage ist 1 (einschließlich Löschoperationen).

Limits und Kontingente

Anmerkung

Weiche Grenzwerte können je nach Bedarf erhöht werden.

  • Maximale Anzahl von Funktionsgruppen pro AWS Konto: Soft-Limit von 100.

  • Maximale Anzahl von Funktionsdefinitionen pro Funktionsgruppe: 2500.

  • Maximale Anzahl von RRU pro Datensatz-ID: 2400 RRU pro Sekunde.

  • Maximale Anzahl von WRU pro Datensatz-ID: 500 WRU pro Sekunde.

  • Max. Read Capacity Units (RCU), die für eine einzelne Funktionsgruppe bereitgestellt werden können: 40000 RCU.

  • Max. Schreibkapazitätseinheiten (WCU), die für eine einzelne Featuregruppe bereitgestellt werden können: 40000 WCU.

  • Max. Lesekapazitätseinheiten, die für alle Funktionsgruppen in einer Region bereitgestellt werden können: 80000 RCU.

  • Max. Schreibkapazitätseinheiten, die für alle Funktionsgruppen in einer Region bereitgestellt werden können: 80000 WCU.

  • Maximale Transaktionen pro Sekunde (TPS) pro API pro AWS-Konto: Soft-Limit von 10000 TPS pro API ohne BatchGetRecord API-Aufruf, für den ein Soft-Limit von 500 TPS gilt.

  • Maximale Größe eines Datensatzes: 350 KB.

  • Maximale Größe einer Datensatz-ID: 2 KB.

  • Maximale Größe eines Feature-Werts: 350 KB.

  • Maximale Anzahl gleichzeitiger Workflows zur Erstellung von Feature-Gruppen: 4.

  • BatchGetRecord-API: Kann bis zu 100 Datensätze enthalten und bis zu 10 Feature-Gruppen abfragen.

Weitere Informationen zu Service-Kontingenten und zum Anfordern einer Kontingenterhöhung finden Sie unter AWSService-Quotas.

Benennungsregeln

  • Reservierte Wörter: Die folgenden Wörter sind reserviert und können nicht als Feature-Namen in Feature-Definitionen verwendet werden:is_deleted, write_time und api_invocation_time.

Datentypen

  • Zeichenfolge: Die Zeichenfolgen sind Unicode mit binärer UTF-8-Kodierung. Die Mindestlänge einer Zeichenfolge kann Null sein, die maximale Länge wird durch die maximale Größe eines Datensatzes eingeschränkt.

  • Feature-Typ für Bruchteile: Feature-Werte müssen einer Gleitkommazahl mit doppelter Genauigkeit entsprechen, wie sie im IEEE-754-Standard definiert ist.

  • Integraler Feature-Typ: Feature Store unterstützt Ganzzahlwerte im Bereich einer 64-Bit-Ganzzahl mit Vorzeichen. Minimalwert von -2 63 und Höchstwert: 2 63 – 1.

  • Funktionen zur Ereigniszeit: Alle Feature-Gruppen verfügen über ein Feature zur Ereigniszeit mit einer Genauigkeit im Nanosekundenbereich. Jede Ereigniszeit mit einer Genauigkeit von weniger als Nanosekunden führt zu einer Abwärtsinkompatibilität. Das Feature kann den Feature-Typ String oder Fractional haben.

    • Eine Ereigniszeit als Zeichenfolge wird im Format ISO-8601 in UTC-Zeit akzeptiert und entspricht den folgenden Mustern: [yyyyy-mm-dd't'hh:mm:ssz, yyyy-mm-dd't'hh:mm:ssz, yyyy-mm-dd't'hh:mm:ss.sssssssssz].

    • Ein Bruchteil der Ereigniszeit wird als Sekunden ab der Unix-Epoche akzeptiert. Die Eventzeiten müssen im Bereich von [0000-01-01T 00:00:00.000 000000Z, 9999-12-31T 23:59:59.999 999999Z] liegen. Für Iceberg Feature-Gruppen im Tabellenformat können Sie nur den Typ Zeichenfolge für die Ereigniszeit verwenden.