Trabajar con secuencias y columnas de identidad - Amazon Aurora DSQL

Trabajar con secuencias y columnas de identidad

Esta sección le ayudará a comprender cómo utilizar mejor las secuencias y las columnas de identidad en función de los patrones de carga de trabajo.

importante

Consulte el aviso Importante de la página CREATE SEQUENCE para obtener más información sobre el comportamiento de asignación y almacenamiento en caché.

Elección de los tipos de identificadores

Amazon Aurora DSQL admite tanto identificadores basados en UUID como valores enteros generados mediante secuencias o columnas de identidad. Estas opciones difieren en la forma en que se asignan los valores y en la forma en que se escalan bajo carga.

Los valores UUID se pueden generar sin coordinación y son adecuados para cargas de trabajo en las que se crean identificadores con frecuencia o en muchas sesiones. Dado que Amazon Aurora DSQL está diseñado para funcionar de forma distribuida, a menudo resulta beneficioso evitar la coordinación. Por este motivo, se recomienda utilizar UUID como tipo de identificador predeterminado, especialmente para claves principales en cargas de trabajo en las que la escalabilidad es importante y no se requiere un orden estricto de los identificadores.

Las secuencias y las columnas de identidad generan valores enteros compactos que resultan muy prácticos para los identificadores legibles por el ser humano, la generación de informes y las interfaces externas. Cuando se prefieran los identificadores numéricos por motivos de usabilidad o integración, considere la posibilidad de utilizar una columna de secuencia o identidad en combinación con identificadores basados en UUID. Cuando se requieren secuencias de números enteros o valores de identidad, elegir un tamaño de caché adecuado se convierte en una parte importante del diseño de la carga de trabajo. Consulte la siguiente sección para obtener instrucciones sobre cómo elegir un tamaño de caché.

Elección de un tamaño de caché

Seleccionar un valor de caché adecuado es una parte importante del uso eficaz de secuencias y columnas de identidad. La configuración de la caché determina cómo se comporta la asignación de identificadores bajo carga, lo que influye tanto en el rendimiento del sistema como en la precisión con la que los valores reflejan el orden de asignación.

Un tamaño de caché mayor de CACHE >= 65536 es adecuado cuando:

  • Los identificadores se generan a alta frecuencia.

  • Muchas sesiones se insertan de forma simultánea.

  • La carga de trabajo puede tolerar las brechas y los efectos de ordenamiento visibles.

Por ejemplo, las cargas de trabajo de ingestión de eventos de gran volumen (como IoT o telemetría), así como los identificadores operativos como los ID de ejecución de trabajos, las referencias de casos de soporte o los números de pedido internos, suelen beneficiarse de tamaños de caché más grandes, donde los identificadores se generan con frecuencia y no se requiere un orden estricto.

Un tamaño de caché de 1 se alinea mejor cuando:

  • Las tasas de asignación son relativamente bajas.

  • Se espera que los identificadores sigan el orden de asignación más de cerca con el tiempo.

  • Minimizar las brechas es más importante que el máximo rendimiento.

Las cargas de trabajo como la asignación de números de cuenta o de referencia, en las que los identificadores se generan con menos frecuencia y es deseable un orden más cercano, se ajustan mejor a un tamaño de caché de 1.