

# Uso de conectores y conexiones personalizados con AWS Glue Studio
<a name="connectors-chapter"></a>

AWS Glue proporciona soporte integrado con los almacenes de datos más utilizados (como Amazon Redshift, Amazon Aurora, Microsoft SQL Server, MySQL, MongoDB y PostgreSQL) mediante conexiones JDBC. AWS Glue también permite usar controladores JDBC personalizados en sus trabajos de extracción, transformación y carga (ETL). Para los almacenes de datos no soportados de forma nativa, como las aplicaciones de software como servicio (SaaS), puede utilizar conectores. 

Un *conector* es un paquete de códigos opcionales que ayuda a acceder a almacenes de datos en AWS Glue Studio. Puede suscribirse a varios conectores ofrecidos en AWS Marketplace.

Al crear trabajos de ETL, puede usar un almacén de datos soportado de forma nativa, un conector de AWS Marketplace, o sus propios conectores personalizados. Si utiliza un conector, primero debe crear una conexión para el conector. Una *conexión* contiene las propiedades necesarias para conectarse a un almacén de datos determinado. Utilice la conexión con los orígenes de datos y los destinos de datos en el trabajo de ETL. Los conectores y las conexiones funcionan en conjunto para facilitar el acceso a los almacenes de datos.

 Las siguientes conexiones están disponibles al crear conexiones para conectores: 
+  **Amazon Aurora**: un motor de base de datos relacional escalable y de alto rendimiento con seguridad, copia de seguridad y restauración integradas y aceleración en memoria. 
+  **Amazon DocumentDB**: un servicio de base de datos de documentos escalable, de alta disponibilidad y totalmente gestionado que admite las API de MongoDB y SQL. 
+  **Amazon Redshift**: un servicio de base de datos de documentos escalable, de alta disponibilidad y totalmente administrado que admite las API de MongoDB y SQL. 
+  **Azure SQL**: un servicio de base de datos relacional basado en la nube de Microsoft Azure que proporciona capacidades de administración y almacenamiento de datos escalables, fiables y seguras. 
+  **Cosmos DB**: un servicio de base de datos en la nube distribuido a nivel mundial de Microsoft Azure que proporciona capacidades de consulta y almacenamiento de datos escalables y de alto rendimiento. 
+  **Google BigQuery**: almacenamiento de datos en la nube sin servidor para ejecutar consultas SQL rápidas en conjuntos de datos de gran tamaño. 
+  **JDBC**: un sistema de administración de base de datos relacional (RDBMS) que utiliza una API de Java para conectarse e interactuar con las conexiones de datos. 
+  **Kafka**: una plataforma de procesamiento de flujos de código abierto que se utiliza para el flujo de datos y la mensajería en tiempo real. 
+  **MariaDB**: una bifurcación de MySQL desarrollada por la comunidad que ofrece rendimiento, escalabilidad y características mejorados. 
+  **MongoDB**: una base de datos multiplataforma orientada a documentos que proporciona alta escalabilidad, flexibilidad y rendimiento. 
+  **MongoDB Atlas**: una oferta de base de datos como servicio (DBaaS) basada en la nube de MongoDB que simplifica la administración y el escalado de las implementaciones de MongoDB. 
+  **Microsoft SQL Server**: un sistema de administración de base de datos relacional (RDBMS) de Microsoft que proporciona sólidas capacidades de almacenamiento, análisis e informes de datos. 
+  **Mixpanel**: una plataforma de análisis que ayuda a las empresas a analizar cómo los usuarios interactúan con los sitios web, aplicaciones móviles y otros productos digitales. 
+  **MySQL**: un sistema de administración de bases de datos relacionales (RDBMS) de código abierto que se usa ampliamente en aplicaciones web y es conocido por su fiabilidad y escalabilidad. 
+  **Red**: un origen de datos de red representa un recurso o servicio accesible desde la red al que se puede acceder mediante una plataforma de integración de datos. 
+  **OpenSearch**: un origen de datos de OpenSearch es una aplicación a la que OpenSearch puede conectarse y desde la que puede ingerir datos. 
+  **Oracle**: un sistema de administración de base de datos relacional (RDBMS) de Oracle Corporation que proporciona sólidas capacidades de almacenamiento, análisis e informes de datos. 
+  **PostgreSQL**: un sistema de administración de base de datos relacional (RDBMS) de código abierto que proporciona sólidas capacidades de almacenamiento, análisis e informes de datos. 
+  **Salesforce**: Salesforce proporciona un software de gestión de relaciones con los clientes (CRM) que lo ayuda con las ventas, el servicio al cliente, el comercio electrónico y más. Si es usuario de Salesforce, puede conectar AWS Glue a su cuenta de Salesforce. A continuación, puede utilizar Salesforce como origen o destino de datos en sus trabajos de ETL. Ejecute estos trabajos para transferir datos entre Salesforce y los servicios de AWS u otras aplicaciones compatibles. 
+  **SAP HANA**: una plataforma de análisis y base de datos en memoria que proporciona un procesamiento rápido de datos, análisis avanzados e integración de datos en tiempo real. 
+  **Snowflake**: un almacén de datos basado en la nube que proporciona servicios de análisis y almacenamiento de datos escalables y de alto rendimiento. 
+  **Teradata**: un sistema de administración de base de datos relacional (RDBMS) que proporciona capacidades de almacenamiento, análisis e informes de datos de alto rendimiento. 
+  **Vertica**: almacenamiento de datos analíticos orientado a columnas diseñado para el análisis de macrodatos que ofrece un rendimiento de consultas rápido, análisis avanzados y escalabilidad. 