Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
RDS-für-PostgreSQL-Kollatierungen für EBCDIC- und andere Mainframe-Migrationen
RDS-für-PostgreSQL-Versionen 10 und höher enthalten die ICU-Version 60.2, die auf Unicode 10.0 basiert und Kollationen aus dem Unicode Common Locale Data Repository, CLDR 32, enthält. Diese Software-Internationalisierungsbibliotheken stellen sicher, dass Zeichenkodierungen unabhängig vom Betriebssystem oder der Plattform einheitlich dargestellt werden. Weitere Informationen zu Unicode CLDR-32 finden Sie unterCLDR 32 Versionshinweis
Ab Version 14.3 umfasst RDS für PostgreSQL auch Kollatierungen, die bei der Datenintegration und Konvertierung von EBCDC-basierten Systemen helfen. Der erweiterte binär codierte Dezimalaustauschcode oderEBCDICEncoding wird häufig von Mainframe-Betriebssystemen verwendet. Diese von Amazon RDS bereitgestellten Sortierungen sind eng definiert, um nur die Unicode-Zeichen zu sortieren, die direkt EBCDIC-Codepages zugeordnet sind. Die Zeichen werden in EBCDIC-Codepunktreihenfolge sortiert, um eine Datenvalidierung nach der Konvertierung zu ermöglichen. Diese Sortierungen enthalten weder denormalisierte Formen noch Unicode-Zeichen, die nicht direkt einem Zeichen auf der EBCDIC-Quellcodepage zugeordnet sind.
Die Zeichenzuordnungen zwischen EBCDIC-Codepages und Unicode-Codepunkten basieren auf von IBM veröffentlichten Tabellen. Das komplette Set ist bei IBM erhältlich alskomprimierte Datei
-
Unicode to EBCDIC collations table— Einige Mainframe-Datenmigrationstools verwenden LATIN1 oder intern, um Daten LATIN9 zu kodieren und zu verarbeiten. Solche Tools verwenden Roundtrip-Schemata, um die Datenintegrität zu wahren und die umgekehrte Konvertierung zu unterstützen. Die Sortierungen in dieser Tabelle können von Tools verwendet werden, die Daten mithilfe von LATIN1 Kodierung verarbeiten, was keine besondere Behandlung erfordert.
-
Unicode to LATIN9 collations table – Sie können diese Kollatierungen in jeder RDS für PostgreSQL-Datenbank verwenden.
In der folgenden Tabelle finden Sie in RDS für PostgreSQL verfügbare Kollatierungen, die EBCDIC-Codepages Unicode-Codepunkten zuordnen. Es wird empfohlen, die Sortierungen in dieser Tabelle für die Anwendungsentwicklung zu verwenden, die eine Sortierung basierend auf der Reihenfolge der IBM Codepages erfordert.
| Name der PostgreSQL-Sortierung | Beschreibung der Code-Page-Zuordnung und Sortierreihenfolge |
|---|---|
DA-DK-CP277-x-Intensivstation |
Unicode-Zeichen, die direkt IBM EBCDIC Code Page 277 zugeordnet sind (pro Konvertierungstabellen), werden in IBM CP 277-Codepunkt-Reihenfolge sortiert |
DE-DE-CP273-X-ICU |
Unicode-Zeichen, die direkt IBM EBCDIC Code Page 273 zugeordnet sind (pro Konvertierungstabellen), werden in IBM CP 273-Codepunkt-Reihenfolge sortiert |
DE-GB-CP285-X-ICU |
Unicode-Zeichen, die direkt IBM EBCDIC Code Page 285 zugeordnet sind (pro Konvertierungstabellen), werden in IBM CP 285-Codepunkt-Reihenfolge sortiert |
de-US-CP037-X-ICU |
Unicode-Zeichen, die direkt IBM EBCDIC Code Page 037 zugeordnet sind (pro Konvertierungstabellen), werden in IBM CP 37-Codepunktreihenfolge sortiert |
es-ES-CP284-x-ICU |
Unicode-Zeichen, die direkt IBM EBCDIC Code Page 284 zugeordnet sind (pro Konvertierungstabellen), werden in IBM CP 284-Codepunkt-Reihenfolge sortiert |
fi-FI-CP278-X-ICU |
Unicode-Zeichen, die direkt IBM EBCDIC Code Page 278 zugeordnet sind (pro Konvertierungstabellen), werden in IBM CP 278-Codepunkt-Reihenfolge sortiert |
fr-FR-CP297-X-ICU |
Unicode-Zeichen, die direkt IBM EBCDIC Code Page 297 zugeordnet sind (pro Konvertierungstabellen), werden in IBM CP 297-Codepunkt-Reihenfolge sortiert |
es-es-CP280-X-ICU |
Unicode-Zeichen, die direkt IBM EBCDIC Code Page 280 zugeordnet sind (pro Konvertierungstabellen), werden in IBM CP 280 Codepunkt-Reihenfolge sortiert. |
NL-BE-CP500-x-ICU |
Unicode-Zeichen, die direkt IBM EBCDIC Code Page 500 zugeordnet sind (pro Konvertierungstabellen), werden in IBM CP 500-Codepunktreihenfolge sortiert |
Amazon RDS bietet eine Reihe zusätzlicher Sortierungen, die Unicode-Codepunkte, die LATIN9 Zeichen anhand der von IBM veröffentlichten Tabellen zugeordnet sind, in der Reihenfolge der ursprünglichen Codepunkte gemäß der EBCDIC-Codepage der Quelldaten sortieren.
| Name der PostgreSQL-Sortierung | Beschreibung der Code-Page-Zuordnung und Sortierreihenfolge |
|---|---|
DA-DK-CP1142 m-x-icu |
Unicode-Zeichen, die den ursprünglich aus der IBM EBCDIC-Codepage 1142 (gemäß den Konvertierungstabellen) konvertierten LATIN9 Zeichen zugeordnet sind, werden in der Reihenfolge der IBM CP 1142-Codepunkte sortiert |
de-DE-CP1141 m-x-icu |
Unicode-Zeichen, die den ursprünglich aus der IBM EBCDIC-Codepage 1141 (gemäß den Konvertierungstabellen) konvertierten LATIN9 Zeichen zugeordnet sind, werden in der Reihenfolge der IBM CP 1141-Codepunkte sortiert |
de-GB-CP1146 m-x-icu |
Unicode-Zeichen, die den ursprünglich aus der IBM EBCDIC-Codepage 1146 (gemäß den Konvertierungstabellen) konvertierten LATIN9 Zeichen zugeordnet sind, werden in der Reihenfolge der IBM CP 1146-Codepunkte sortiert |
en-US-CP1140 m-x-icu |
Unicode-Zeichen, die den ursprünglich aus der IBM EBCDIC-Codepage 1140 (gemäß den Konvertierungstabellen) konvertierten LATIN9 Zeichen zugeordnet sind, werden in der Reihenfolge der IBM CP 1140-Codepunkte sortiert |
es-ES-CP1145 m-x-icu |
Unicode-Zeichen, die den ursprünglich aus der IBM EBCDIC-Codepage 1145 (gemäß den Konvertierungstabellen) konvertierten LATIN9 Zeichen zugeordnet sind, werden in der Reihenfolge der IBM CP 1145-Codepunkte sortiert |
fi-FI-CP1143 m-x-icu |
Unicode-Zeichen, die den ursprünglich aus der IBM EBCDIC-Codepage 1143 (gemäß den Konvertierungstabellen) konvertierten LATIN9 Zeichen zugeordnet sind, werden in der Reihenfolge der IBM CP 1143-Codepunkte sortiert |
fr-FR-CP1147 m-x-icu |
Unicode-Zeichen, die den ursprünglich aus der IBM EBCDIC-Codepage 1147 (gemäß den Konvertierungstabellen) konvertierten LATIN9 Zeichen zugeordnet sind, werden in der Reihenfolge der IBM CP 1147-Codepunkte sortiert |
it-IT-CP1144 m-x-icu |
Unicode-Zeichen, die den ursprünglich aus der IBM EBCDIC-Codepage 1144 (gemäß den Konvertierungstabellen) konvertierten LATIN9 Zeichen zugeordnet sind, werden in der Reihenfolge der IBM CP 1144-Codepunkte sortiert |
nl-BE-CP1148 m-x-icu |
Unicode-Zeichen, die den ursprünglich aus der IBM EBCDIC-Codepage 1148 (gemäß den Konvertierungstabellen) konvertierten LATIN9 Zeichen zugeordnet sind, werden in der Reihenfolge der IBM CP 1148-Codepunkte sortiert |
Im Folgenden finden Sie ein Beispiel für die Verwendung eines RDS-Werts für PostgreSQL-Sortierungen.
db1=>SELECT pg_import_system_collations('pg_catalog');pg_import_system_collations ----------------------------- 36db1=>SELECT '¤' < 'a' col1;col1 ------ tdb1=>SELECT '¤' < 'a' COLLATE "da-DK-cp277-x-icu" col1;col1 ------ f
Wir empfehlen Ihnen, die Sortierungen in derUnicode to EBCDIC collations tableund in derUnicode to LATIN9 collations tablefür die Anwendungsentwicklung, die eine Sortierung basierend auf der Reihenfolge der IBM Codepages erfordert. Die folgenden Sortierungen (mit dem Suffix „b“) sind auch in sichtbar, sind aber für die Verwendung durch Mainframe-Datenintegrations- und Migrationstools vorgesehenpg_collation, da sie Codepages mit bestimmten Codepunktverschiebungen AWS zuordnen und erfordern eine besondere Behandlung bei der Sortierung. Mit anderen Worten: Die folgenden Sortierungen werden nicht empfohlen.
-
DA-DK-277 b-x-icu
-
DA-DK-1142 b-x-icu
-
DE-DE-CP273 b-x-icu
-
DE-DE-CP1141 b-x-icu
-
de-GB-CP1146 b-x-icu
-
de-GB-CP285 b-x-icu
-
de-US-CP037 b-x-icu
-
de-US-CP1140 b-x-icu
-
es-ES-CP1145 b-x-icu
-
Es-ES-CP284 b-x-icu
-
fi-FI-CP1143 b-x-icu
-
fr-FR-CP1147 b-x-icu
-
fr-FR-CP297 b-x-icu
-
it-IT-CP1144 b-x-icu
-
it-IT-CP280 b-x-icu
-
NL-BE-CP1148 b-x-icu
-
NL-BE-CP500 b-x-icu
Weitere Informationen zu PostgreSQL und Kollationen finden Sie unter Support für Kollationen