Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Componentes de AWS DMS Serverless
Para administrar los recursos necesarios para realizar una replicación, AWS DMS Serverless tiene estados detallados que revelan las diferentes acciones internas que lleva a cabo el servicio. Al iniciar la replicación, AWS DMS Serverless calcula la carga de capacidad, aprovisiona la capacidad calculada e inicia la replicación de datos según los siguientes estados de replicación.
En el siguiente diagrama se muestran las transiciones de estado para una replicación de AWS DMS Serverless.
El primer estado después de iniciar la replicación es Inicialización. En este estado, se inicializan todos los parámetros necesarios.
Los estados inmediatamente siguientes incluyen Preparación de recursos de metadatos, Prueba de conexión y Obtención de metadatos. En estos estados, AWS DMS Serverless se conecta a la base de datos de origen para obtener la información necesaria para predecir la capacidad necesaria.
Cuando el estado de replicación es Prueba de conexión, AWS DMS Serverless verifica que la conexión a las bases de datos de origen y destino esté configurada correctamente.
El estado de replicación que sigue a Prueba de conexión es Obtención de metadatos. Aquí, AWS DMS recupera la información necesaria para calcular la capacidad.
Una vez que AWS DMS recupera la información necesaria, el siguiente estado es Calcular la capacidad. Aquí, el sistema calcula el tamaño de los recursos subyacentes necesarios para realizar la replicación.
La transición de estado que sigue a Calcular la capacidad es Aprovisionar capacidad. Mientras la replicación se encuentra en este estado, AWS DMS Serverless inicializa los recursos informáticos subyacentes.
El estado de la replicación después de que todos los recursos se hayan aprovisionado correctamente es Inicio de la replicación. En este estado, AWS DMS Serverless comienza la replicación de los datos. Entre las fases de una replicación se incluyen las siguientes:
Carga completa: en esta fase, DMS replica el almacén de datos de origen tal y como estaba cuando se inició la replicación.
CDC (inicial): en esta fase, DMS replica los cambios en el almacén de datos de origen que se produjeron durante la fase de carga completa. DMS solo ejecuta esta fase si la configuración de la tarea
StopTaskCachedChangesNotAppliedesfalse.CDC (en curso): tras la fase inicial de CDC, DMS replica los cambios en la base de datos de origen a medida que se producen. DMS solo sigue ejecutando la replicación después de la fase inicial de CDC si la configuración de la tarea
StopTaskCachedChangesAppliedesfalse.
El estado final es En ejecución. En el estado En ejecución, la replicación de los datos está en curso.
Una replicación que se detiene pasa al estado Detenida. Una replicación puede pasar a un estado detenido solo para tareas de replicación a plena carga que se hayan completado correctamente. Se deben tener en cuenta estas circunstancias para reanudar o reiniciar las replicaciones en estado detenido o fallido:
No se puede reiniciar una replicación que no se haya iniciado en 48 horas, ya que AWS DMS anula el aprovisionamiento de recursos.
Este tema contiene las siguientes secciones.
Para AWS DMS Serverless, el panel de navegación izquierdo de la consola de AWS DMS tiene una nueva opción, las replicaciones sin servidor. En el caso de las replicaciones sin servidor, debe especificar las replicaciones en lugar de los tipos de instancias de replicación o las tareas para definir una replicación. Además, debe especificar las unidades de capacidad de DMS (DCU) máxima y mínima que desea que DMS aprovisione para la replicación. Una DCU tiene 2 GB de RAM. AWS DMS factura a la cuenta por cada DCU que la replicación esté utilizando actualmente. Para obtener información sobre precios de AWS DMS, consulte Precios de AWS Database Migration Service
A continuación, AWS DMS aprovisiona automáticamente los recursos de replicación en función de las asignaciones de las tablas y del tamaño previsto de la carga de trabajo. Esta unidad de capacidad es un valor en el rango de los valores de unidad de capacidad mínima y máxima que especifique.
Puntos de conexión compatibles
Con AWS DMS Serverless, no es necesario elegir ni administrar las versiones del motor, ya que el servicio gestiona de esa configuración. AWS DMS Sin servidor admite los siguientes orígenes:
-
MongoDB
-
Amazon DocumentDB (con compatibilidad con MongoDB)
-
Microsoft SQL Server
-
Bases de datos compatibles con PostgreSQL
-
MySQL: bases datos compatibles
-
MariaDB
-
Oracle
-
Amazon S3
-
IBM Db2
AWS DMS Serverless admite los siguientes destinos:
-
Microsoft SQL Server
-
PostgreSQL
-
MySQL: bases datos compatibles
-
Oracle
-
Amazon S3
-
Amazon Redshift
-
Amazon DynamoDB
-
Amazon Kinesis Data Streams
-
Transmisión administrada de Amazon para Apache Kafka
-
Amazon OpenSearch Service
-
Amazon DocumentDB (con compatibilidad con MongoDB)
-
Amazon Neptune
Como parte de AWS DMS Serverless, tiene acceso a los comandos de la consola que le permiten crear, configurar, iniciar y administrar replicaciones AWS DMS Serverless. Para ejecutar estos comandos mediante la sección de replicaciones sin servidor de la consola, debe realizar una de las siguientes acciones:
Configure una nueva política de AWS Identity and Access Management (IAM) y un rol de IAM para asociar a esa política.
Utilice una plantilla de AWS CloudFormation para proporcionar el acceso que necesita.
AWS DMS Serverless requiere que exista un rol vinculado a servicios (SLR) en la cuenta. AWS DMS administra la creación y el uso de este rol. Para obtener más información sobre cómo asegurarse de que el usuario cuente con el SLR necesario, consulte Función vinculada al servicio para AWS DMS.
Creación de una replicación sin servidor
Para crear una replicación sin servidor entre dos puntos de conexión de AWS DMS existentes, haga lo siguiente. Para obtener información acerca de la creación de puntos de conexión de AWS DMS, consulte Creación de puntos de enlace de origen y destino.
Creación de una replicación sin servidor
Inicie sesión en la Consola de administración de AWS y abra la consola de AWS DMS en https://console.aws.amazon.com/dms/v2/
. -
En el panel de navegación, elija Replicaciones sin servidor y luego elija Crear replicación.
-
En la página Crear replicación, especifique la configuración de la replicación sin servidor:
Opción Acción Nombre
Ingrese un nombre para identificar la replicación, por ejemplo DMS-replication.Nombre de recurso de Amazon (ARN) descriptivo: opcional Puede usar este parámetro opcional para proporcionar una descripción de la replicación. Punto de conexión de la base de datos de origen Elija los puntos de conexión existentes en la cuenta. Tenga en cuenta que AWS DMS Serverless solo admite un subconjunto de los tipos de puntos de conexión compatibles con AWS DMS Standard. Punto de conexión de la base de datos de destino Elija los puntos de conexión existentes en la cuenta. Tenga en cuenta que AWS DMS Serverless solo admite un subconjunto de los tipos de puntos de conexión compatibles con AWS DMS Standard. Tipo de replicación Elija un tipo de replicación en función de los requisitos: Carga completa: AWS DMS migra solo los datos existentes.
Carga completa y captura de datos de cambios (CDC): AWS DMS migra los datos existentes y los cambios que se producen durante la replicación.
Captura de datos de cambios (CDC): AWS DMS solo migra los cambios que se producen después de iniciar la replicación.
En la sección Configuración, establezca la configuración que requiere la replicación.
En la sección Asignaciones de tablas, configure la asignación de tablas para definir reglas que permitan seleccionar y filtrar los datos que está replicando. Antes de especificar las asignaciones, asegúrese de revisar la sección de la documentación sobre las asignaciones de tipos de datos para las bases de datos de origen y de destino. Para obtener información sobre la asignación de tipos de datos a las bases de datos de origen y de destino, consulte la sección sobre tipos de datos correspondiente a sus tipos de puntos de conexión de origen y destino en el tema Trabajando con puntos finales de DMS AWS.
En la sección Configuración de computación, establezca las siguientes configuraciones. Para obtener información acerca de los ajustes de configuración de computación, consulte Configuración de computación.
Opción Acción de VPC
Elija una VPC existente. Grupo de subredes
Elija un grupo de subredes existente. Grupos de seguridad de VPC)
Elija predeterminado si aún no está elegido. AWS Clave de KMS de
Seleccione una clave de KMS adecuada. Para obtener más información sobre las claves de KMS, consulte Creación de claves en la Referencia de la API de AWS Key Management Service. Implementación
Déjelo como está. Zona de disponibilidad
Déjelo como está. Unidades de capacidad mínima del DMS (DCU): (opcional)
Déjelo en blanco para usar el valor predeterminado de 1 DCU. Unidades de capacidad máxima del DMS (DCU)
Elija 16DCU. Deje los ajustes de Mantenimiento tal como están.
Elija Crear replicación.
AWS DMS crea una replicación sin servidor para realizar la migración.
Modificación de las replicaciones de AWS DMS Serverless
Para modificar la configuración de replicación, utilice la acción modify-replication-config. Solo puede modificar una configuración de replicación de AWS DMS que esté en los estados CREATED, STOPPED o FAILED. Para obtener información sobre la acción modify-replication-config, consulte ModifyReplicationConfig en la Referencia de la API de AWS Database Migration Service.
Modificación de una configuración de replicación sin servidor mediante la Consola de administración de AWS
Inicie sesión en la Consola de administración de AWS y abra la consola de AWS DMS en https://console.aws.amazon.com/dms/v2/
. En el panel de navegación, elija Replicaciones sin servidor.
-
Elija la replicación que desee modificar. En la siguiente tabla se describen las modificaciones que puede realizar en función del estado actual de la replicación.
Ajuste Descripción Estados permitidos Nombre
Puede cambiar el nombre de la replicación. Escriba un nombre para la replicación que contenga entre 8 y 16 caracteres ASCII imprimibles (excluidos /, “” y @). El nombre de la cuenta debe ser único en la región de AWS que haya seleccionado. Tiene la opción de elegir agregar algunos detalles al nombre, como incluir la región de AWS y la tarea que esté realizando, por ejemplo:
west2-mysql2mysql-config1.ReplicationStateesCREATED,STOPPEDoFAILED.Punto de conexión de la base de datos de origen
Elija un nuevo punto de conexión de origen existente como origen de la replicación.
ReplicationStateesCREATEDoFAILEDcuandoProvisionStateesnull.Punto de conexión de la base de datos de destino
Elija un nuevo punto de conexión de destino existente como destino de la replicación.
ReplicationStateesCREATEDoFAILEDcuandoProvisionStateesnull.Tipo de replicación
Puede modificar el tipo de una replicación sin servidor.
ReplicationStateesCREATEDoFAILEDcuandoProvisionStateesnull.Configuración de replicación
Puede modificar la configuración de replicación, incluido el modo de preparación de la tabla de destino, si desea incluir columnas de LOB en la replicación, el tamaño máximo de LOB, la validación y el registro. Para obtener más información, consulte Task settings (Configuración de tarea).
ReplicationStateesCREATED,STOPPEDoFAILED.Asignaciones de tablas
Puede modificar la configuración de asignación de tablas para una replicación sin servidor, incluidas las reglas de selección y las reglas de transformación. Para obtener más información, consulte Mapeo de tablas.
ReplicationStateesCREATED,STOPPEDoFAILED.Configuración de computación
Puede modificar los ajustes de configuración de computación para una replicación sin servidor, incluidos los ajustes de red, los ajustes de escalado y los ajustes de mantenimiento. Para obtener información acerca de los ajustes de configuración de computación, consulte Configuración de computación.
Puede modificar los siguientes ajustes de escalado, mantenimiento y red cuando
ReplicationStateseaCREATED,STOPPEDoFAILED:MinCapacityUnitsMaxCapacityUnitsMultiAZPreferredMaintenanceWindowVpcSecurityGroupIds
Puede modificar la siguiente configuración de red y seguridad cuando
ReplicationStateseaCREATEDoFAILEDcuandoProvisionStateseanull:AvailabilityZoneDnsNameServersKmsKeyIdReplicationSubnetGroupId
nota
No se pueden modificar los puntos de conexión asociados a una tarea de DMS cuando el estado de la tarea es iniciándose o ejecutándose.
Configuración de computación
Se configura el aprovisionamiento de la replicación con el parámetro de Compute Config o la sección de consola. Los campos del objeto de Compute Config incluyen lo siguiente:
| Opción | Descripción |
|---|---|
|
MinCapacityUnits |
Este es el número mínimo de unidades de capacidad de DMS (DCU) que AWS DMS aprovisonará. Esta es también la DCU mínima a la que puede reducir verticalmente el escalado automático. |
|
MaxCapacityUnits |
Estas son las unidades de capacidad (DCU) de DMS máximas que AWS DMS puede aprovisionar, en función de la predicción de capacidad de la replicación. Esta es también la DCU máxima a la que puede reducir verticalmente el escalado automático. |
|
KmsKeyId |
La clave de cifrado que se utiliza para cifrar el almacenamiento de la replicación y la información de la conexión. Si elige (Predeterminado) aws/dms, AWS DMS utiliza la clave de KMS predeterminada asociada a la cuenta y Región de AWS. Se muestran una descripción y su número de cuenta junto con el ARN de la clave. Para obtener más información sobre cómo utilizar la clave de cifrado, consulte Establecer una clave de cifrado y especificar AWS KMS los permisos. Para este tutorial, deje (predeterminado) aws/dms elegido. |
|
ReplicationSubnetGroupId |
El grupo de subred de replicación en la VPC seleccionada donde quiere que se cree la replicación. Si la base de datos de origen está en una VPC, elija el grupo de subred que contiene la base de datos de origen como la ubicación para la replicación. Para obtener más información sobre los grupos de subred para la replicación, consulte Creación de un grupo de subredes de replicación. |
|
VpcSecurityGroupIds |
La instancia de replicación se crea en una VPC. Si la base de datos de origen está en una VPC, elija el grupo de seguridad de la VPC que proporciona acceso a la instancia de base de datos donde se encuentra la base de datos. |
|
PreferredMaintenanceWindow |
Este parámetro define un intervalo de tiempo semanal durante el cual puede llevarse a cabo el mantenimiento del sistema, en tiempo universal coordinado (UTC). El valor predeterminado es un periodo de 30 minutos seleccionado al azar de un bloque de 8 horas de tiempo por Región de AWS, que tiene lugar un día de la semana al azar. |
|
MultiAZ |
El establecimiento de este parámetro opcional crea una réplica en espera de la replicación en otra zona de disponibilidad para el soporte de conmutación por error. Si va a utilizar la captura de datos de cambios (CDC) o la replicación continua, le recomendamos que active esta opción. |
Comprensión del escalado automático en AWS DMS Serverless
Una vez que se aprovisiona una replicación y se encuentra en el estado RUNNING, el servicio de AWS DMS administra la capacidad de los recursos subyacentes para adaptarse a las cargas de trabajo cambiantes. Esta administración escala los recursos de replicación en función de las siguientes configuraciones de replicación:
MinCapacityUnitsMaxCapacityUnits
Las replicaciones escalan verticalmente después de un periodo en el que se supera un umbral de utilización superior y horizontalmente cuando la utilización de la capacidad está por debajo del umbral mínimo de utilización de la capacidad durante un periodo más prolongado.
nota
Las replicaciones sin servidor no pueden reducir la escala de forma automática mientras hay una carga completa en curso.
Ajuste de autoescalado en AWS DMS Serverless
Para ajustar los parámetros de escalado automático de la replicación, le recomendamos que establezca MaxCapacityUnits al valor máximo y deje que AWS DMS administre el aprovisionamiento de los recursos. Se recomienda elegir la configuración de capacidad máxima de la DCU más grande para aprovechar al máximo el escalado automático y adaptarse a los picos en el volumen de transacciones. La calculadora de precios muestra el costo mensual máximo si la replicación utiliza continuamente la DCU máxima. La DCU máxima no representa el costo real, ya que solo paga por la capacidad utilizada.
Si la replicación no utiliza sus recursos a plena capacidad, AWS DMS gradualmente anulará el aprovisionamiento para ahorrarle costos. Sin embargo, dado que el aprovisionamiento y la anulación del aprovisionamiento de recursos llevan tiempo, le recomendamos que establezca la configuración de MinCapacityUnits en un valor que pueda gestionar los picos repentinos que espere en la carga de trabajo de replicación. Esto evitará que la replicación se aprovisione de manera insuficiente y, al mismo tiempo, AWS DMS aprovisiona los recursos para el nivel de carga de trabajo más alto.
Si aprovisiona la replicación de manera insuficiente con una configuración de capacidad máxima demasiado baja para los requisitos de datos, o con una capacidad mínima demasiado baja para hacer frente a los picos repentinos de su carga de trabajo de replicación, es posible que vea la métrica CapacityUtilization de forma continua a su valor máximo. Esto puede provocar un error en la replicación. Si la replicación produce un error debido a una falta de aprovisionamiento de recursos, AWS DMS crea un evento de falta de memoria en los registros de replicación. Cuando se produce un evento de falta de memoria debido a un aumento repentino de la carga de trabajo de replicación o a la afinación de la configuración, el sistema incorpora capacidades de escalado automático para gestionar la situación y reanudar el procesamiento. Sin embargo, este mecanismo de recuperación automática no es inmediato y puede tardar algún tiempo en hacerse efectivo. Para una recuperación más rápida, puede realizar una acción manual modificando la configuración de la tarea, en concreto, puede aumentar el valor de MinCapacityUnits y, a continuación, reanudar la tarea. Esta intervención manual proporciona una resolución más rápida al error de falta de memoria en comparación con esperar al proceso de autoescalado automático.
Monitoreo de las replicaciones de AWS DMS Serverless
AWS proporciona varias herramientas para monitorear las replicaciones de AWS DMS sin servidor y responder a posibles incidentes:
Métricas de replicación de AWS DMS Serverless
El monitoreo de replicación sin servidor incluye métricas de Amazon CloudWatch para las siguientes estadísticas. Estas estadísticas se agrupan por cada replicación sin servidor.
|
Métrica |
Unidades |
Descripción |
|---|---|---|
| CapacityUtilization | Porcentaje |
El porcentaje de memoria que utiliza la replicación sin servidor |
| CDCIncomingChanges | Porcentaje |
Número total de eventos de cambio en un punto en el tiempo que están a la espera de aplicarse en el destino. Tenga en cuenta que esto no es lo mismo que una medida de la velocidad de cambio de las transacciones del punto de enlace de origen. Cuando el valor de esta métrica es alto, normalmente significa que AWS DMS no puede aplicar los cambios capturados con puntualidad, lo que provoca una latencia de destino más elevada. |
| CDCLatencySource | Segundos |
La diferencia, en segundos, entre el último evento capturado en el punto de conexión de origen y la marca temporal del sistema actual de la instancia de AWS DMS. CDCLatencySource representa la latencia entre el origen y la instancia de replicación. Un CDCLatencySource alto significa que el proceso de captura de los cambios del origen se retrasa. Para identificar la latencia en una replicación en curso, puede consultar esta métrica junto con CDCLatencyTarget. Si CDCLatencySource y CDCLatencyTarget son altos, investigue CDCLatencySource primero. CDCLatencySource puede ser 0 cuando no hay ningún retraso de replicación entre el origen y la replicación. CDCLatencySource también puede pasar a cero cuando la replicación intenta leer el siguiente evento del registro de transacciones del origen y no hay eventos nuevos en comparación con la última vez que leyó desde el origen. Cuando esto sucede, la replicación restablece CDCLatencySource a 0. |
| CDCLatencyTarget | Segundos |
La diferencia, en segundos, entre la primera marca temporal de evento que espera confirmación en el destino y la marca temporal actual de la instancia de AWS DMS. La latencia objetivo es la diferencia entre la hora del servidor de la instancia de replicación y el ID de evento no confirmado más antiguo reenviado a un componente de destino. En otras palabras, la latencia de destino es la diferencia temporal entre la instancia de replicación y el evento más antiguo aplicado pero no confirmado por el punto de conexión de TRG (99 %). Cuando CDCLatencyTarget es alto, indica que el proceso de aplicación de los eventos de cambio al destino se ha retrasado. Para identificar la latencia en una replicación en curso, puede consultar esta métrica junto con CDCLatencySource. Si CDCLatencyTarget es alto pero CDCLatencySource no, investigue si:
|
| CDCThroughputBandwidthTarget | KB/segundo |
Los datos salientes se transmiten para el destino en KB por segundo. CDCThroughputBandwidth registra los datos salientes transmitidos en los puntos de ejemplo. Si no se encuentra tráfico de red, el valor es cero. Como CDC no emite transacciones de larga duración, puede que el tráfico de red no se registre. |
| CDCThroughputRowsSource | Filas/segundo |
Cambios entrantes del origen en filas por segundo. |
| CDCThroughputRowsTarget | Filas/segundo |
Cambios salientes para el destino en filas por segundo. |
| FullLoadThroughputBandwidthTarget | KB/segundo |
Los datos salientes se transmiten desde una carga nula para el destino en KB por segundo. |
| FullLoadThroughputRowsTarget | Filas/segundo |
Cambios salientes de una carga completa para el destino en filas por segundo. |
Registros de replicación de AWS DMS Serverless
Puede usar Amazon CloudWatch para registrar la información de replicación durante un proceso de migración de AWS DMS. Se debe habilitar el registro cuando se selecciona la configuración de replicación.
Las replicaciones sin servidor cargan registros de estado en la cuenta de CloudWatch para ofrecer una mayor visibilidad del progreso de la replicación y ayudar a solucionar problemas.
AWS DMS carga los registros enlazados sin servidor a un grupo de registros dedicado con el prefijo dms-serverless-replication-. Dentro de este grupo de registros, hay un flujo de registro llamado <your replication config resource ID>dms-serverless-replication-orchestrator-. Este flujo de registro informa del estado de la replicación y un mensaje asociado con más detalles sobre el trabajo que se está realizando en esta etapa. Para ejemplos de entradas de registro, consulte Ejemplos de registros de replicación sin servidor siguiente.<your replication config resource ID>
nota
AWS DMS no crea el grupo de registro ni el flujo hasta que ejecute la replicación. AWS DMS no crea el grupo de registro ni el flujo si solo se crea la replicación.
Para consultar los registros de una replicación que se ha ejecutado, siga estos pasos:
-
Abra la consola de AWS DMS y elija Replicaciones sin servidor del panel de navegación. Aparece el cuadro de diálogo de replicaciones sin servidor.
-
Vaya a la sección Configuración y elija Ver registros sin servidor en la columna General. Se abre el grupo de registros de CloudWatch.
Si la replicación produce un error, AWS DMS crea una entrada de registro con un estado de replicación igual a failed y un mensaje en el que se describe el motivo del error. Debe comprobar los registros de CloudWatch como primer paso para solucionar un error de replicación.
nota
De igual modo que con el sistema AWS DMS clásico, tiene la opción de permitir un registro más detallado del progreso de la propia migración de datos, es decir, de los registros emitidos por la tarea de replicación subyacente. Puede habilitar estos registros en la configuración de replicación configurando EnableLogging en el campo Logging como true, por ejemplo, en el siguiente ejemplo de JSON:
{ "Logging": { "EnableLogging": true } }
Si habilita estos registros, solo comenzarán a aparecer durante la fase running de la replicación sin servidor. Aparecerán en el mismo grupo de registros que el flujo de registro anterior, pero estarán en el nuevo flujo de registros dms-serverless-serv-res-id-. Consulte la siguiente sección para obtener información sobre cómo interpretar los registros de replicación sin servidor.{unique identifier}
Ejemplos de registros de replicación sin servidor
En esta sección se incluyen ejemplos de entrada de registro para replicaciones sin servidor.
Ejemplo: inicio de la replicación
Cuando ejecuta una replicación sin servidor, AWS DMS crea un entrada de registro similar a la siguiente:
{'replication_state':'initializing', 'message': 'Initializing the replication workflow.'}
Ejemplo: error de replicación
Si uno de los puntos de conexión de la replicación no está configurado correctamente, AWS DMS crea una entrada de registro similar a la siguiente:
{'replication_state':'failed', 'message': 'Test connection failed for endpoint X.', 'failure_message': 'X'}
Si ve este mensaje en el registro después de un error, asegúrese de que el punto de conexión especificado esté en buen estado y esté configurado correctamente.
Rendimiento mejorado para migraciones de Oracle a Amazon Redshift y Amazon S3 de carga completa
AWS DMS proporciona un rendimiento significativamente mejorado para las migraciones de carga completa de Oracle a Amazon Redshift y Amazon S3. DMS habilita esta característica de forma automática para las tablas sin la opción parallel-load personalizada en sus asignaciones de tabla. Para las tablas con opciones de carga paralela personalizada, DMS sin servidor distribuye la carga de la tabla en función de las configuraciones de asignación de tablas dadas. Para utilizar un rendimiento mejorado, haga lo siguiente:
-
Proporcione reglas de selección que no hagan referencia a particiones ni límites. Por ejemplo, si la configuración de la tabla en las asignaciones de tablas contiene
parallel-load, DMS sin servidor no utilizará la característica de rendimiento mejorado. Para obtener más información, consulte Reglas y acciones de selección. -
Establezca
MaxFileSizeyWriteBufferSizeen 64 MB. Para obtener más información, consulte Configuración de punto final cuando se utiliza Amazon Redshift como destino para AWS DMS. -
Se recomienda establecer
CompressCsvFilesentruepara un almacén de datos con datos dispersos yfalsepara un almacén de datos con datos densos. -
Establezca la siguiente configuración de tareas en
0:-
ParallelLoadThreads -
ParallelLoadQueuesPerThread -
ParallelApplyThreads -
ParallelApplyQueuesPerThread -
ParallelLoadBufferSize
-
-
Establezca
MaxFullLoadSubTasksen49para admitir la migración de datos paralelos. -
Establece
LOB modeeninline. Para obtener más información, consulte Configurar la compatibilidad con LOB para las bases de datos de origen de una tarea AWS DMS.
AWS DMS no proporciona rendimiento mejorado para las siguientes replicaciones:
-
Replicaciones con tablas que utilizan carga paralela. Para obtener más información, consulte Uso de carga paralela para tablas, vistas y recopilaciones seleccionadas.
-
Replicaciones con reglas de transformación de datos
-
Replicaciones con reglas de filtrado
-
Replicaciones con la regla de transformación
Comprensión del escalado automático de almacenamiento en AWS DMS sin servidor
Al iniciar un proceso de replicación, AWS DMS sin servidor asigna 100 GB de almacenamiento inicial para la replicación. La capacidad de almacenamiento la consumen básicamente los archivos de registro y las transacciones que se almacenan en la memoria caché. En el caso de las transacciones en la memoria caché, el almacenamiento se utiliza únicamente cuando las transacciones en memoria caché se deben escribir en el disco. Por lo tanto, AWS DMS sin servidor no utiliza una cantidad significativa de almacenamiento. Entre las excepciones se incluyen las siguientes:
-
Tablas muy grandes que conllevan una carga de transacciones importante. Cargar una tabla muy grande puede llevar su tiempo, por tanto hay más probabilidades de que las transacciones almacenadas en la memoria caché se escriban en el disco cuando se carga una tabla de gran tamaño.
-
Las tareas se configuran para detenerse antes de cargar las transacciones en caché. En este caso, todas las transacciones se almacenan en la memoria caché hasta que finaliza la carga completa de todas las tablas. Con esta configuración, es posible que las transacciones en la memoria caché consuman una cantidad considerable de espacio de almacenamiento.
-
Tareas configuradas con tablas que se cargan en Amazon Redshift. Esta configuración no comporta problema alguno si Amazon Aurora es el destino.
Por lo tanto, AWS DMS sin servidor supervisa la utilización del almacenamiento cada 15 minutos. Cuando se haya utilizado el 90 % del almacenamiento asignado, AWS DMS sin servidor escala verticalmente la replicación con almacenamiento adicional. En caso de que se utilice el 100 % del almacenamiento de la replicación y las tareas de replicación fallen antes o durante el proceso de escalado, DMS sin servidor reanudará las tareas cuando el escalado se haya completado correctamente.
nota
-
Las operaciones de carga completa se reinician desde el principio en el caso de las tablas incompletas al reanudar una tarea detenida previamente.
-
Esto no afecta al rendimiento de las tareas de DMS durante el evento de escalado de almacenamiento.
-
No hay ningún período de enfriamiento entre dos eventos de escalado automático de almacenamiento.