Amazon Redshift dejará de admitir la creación de nuevas UDF de Python a partir del parche 198. Las UDF de Python existentes seguirán funcionando hasta el 30 de junio de 2026. Para obtener más información, consulte la [publicación del blog](https://aws.amazon.com/blogs/big-data/amazon-redshift-python-user-defined-functions-will-reach-end-of-support-after-june-30-2026/). 

# Introducción a los almacenamientos de datos aprovisionados de Amazon Redshift
<a name="new-user"></a>

Si es la primera vez que utiliza Amazon Redshift, le recomendamos que lea las secciones siguientes como ayuda para comenzar a utilizar los clústeres aprovisionados. El flujo básico de Amazon Redshift consiste en crear recursos aprovisionados, conectarse a Amazon Redshift, cargar datos de muestra y, a continuación, ejecutar consultas en los datos. En esta guía, puede elegir cargar los datos de muestra desde Amazon Redshift o desde un bucket de Amazon S3. Los datos de muestra se utilizan en toda la documentación de Amazon Redshift para demostrar características.

 En este tutorial se muestra cómo utilizar los clústeres aprovisionados de Amazon Redshift, que son objetos de almacenamiento de datos de AWS para los que se administran los recursos del sistema. También puede usar Amazon Redshift con grupos de trabajo sin servidor, que son objetos de almacenamiento de datos que se escalan automáticamente en respuesta al uso. Para empezar a utilizar Redshift sin servidor, consulte [Introducción a los almacenamientos de datos de Amazon Redshift sin servidorIntroducción a los almacenamientos de datos sin servidor](new-user-serverless.md).

Después de crear la consola de Amazon Redshift y de iniciar sesión en ella, puede crear y administrar objetos de Amazon Redshift, incluidos clústeres, nodos y bases de datos. También puede ejecutar consultas, ver consultas y realizar otras operaciones del lenguaje de definición de datos (DDL) y del lenguaje de manipulación de datos (DML) con un cliente de SQL.

**importante**  
El clúster que aprovisionó para este ejercicio se ejecuta en un entorno real. Mientras esté en ejecución, acumula cargos en su Cuenta de AWS. Para obtener información acerca de los precios, consulte la [página de precios de Amazon Redshift](https://aws.amazon.com//redshift/pricing/).  
Para evitar cargos innecesarios, elimine su clúster cuando termine de usarlo. En la última sección de este capítulo se explica cómo hacerlo.

Inicie sesión en la Consola de administración de AWS y abra la consola de Amazon Redshift en [https://console.aws.amazon.com/redshiftv2/](https://console.aws.amazon.com/redshiftv2/).

Le recomendamos que, para empezar, vaya al **Panel de clústeres aprovisionados** para empezar a utilizar la consola de Amazon Redshift. 

Según la configuración, los siguientes elementos aparecen en el panel de navegación de la consola aprovisionada de Amazon Redshift:
+ ‎**Redshift sin servidor**: acceda a los datos y analícelos sin necesidad de configurar, ajustar ni administrar clústeres aprovisionados de Amazon Redshift.
+ **Panel de clústeres aprovisionados**: compruebe los clústeres en su Región de AWS, compruebe **Métricas del clúster** e **Información general sobre consultas** para obtener información de los datos de las métricas (como uso de la CPU) e información de consultas. El uso de estas opciones puede ayudarlo a determinar si los datos de rendimiento son anormales en un intervalo temporal especificado.
+ **Clústeres**: vea su lista de clústeres en esta Región de AWS, elija un clúster para comenzar a realizar consultas o realizar acciones relacionadas con el clúster. También puede crear un clúster nuevo desde esta página.
+ **Editor de consultas**: ejecute consultas en las bases de datos alojadas en el clúster de Amazon Redshift. Recomendamos utilizar el **editor de consultas v2**.
+ **Editor de consultas v2**: el editor de consultas de Amazon Redshift v2 es una aplicación de cliente de SQL independiente basada en web para crear y ejecutar consultas en el almacenamiento de datos de Amazon Redshift. Puede visualizar los resultados en gráficos y colaborar si comparte sus consultas con otros miembros del equipo.
+ **Queries and loads** (Consultas y cargas): obtenga información para referenciar o solucionar problemas, como una lista de consultas recientes y el texto SQL de cada consulta.
+ **Datashares** (Recursos para compartir datos): los administradores de una cuenta productora pueden autorizar a las cuentas consumidoras para acceder a los recursos para compartir datos o elegir no autorizar ningún acceso. Para utilizar un recurso compartido de datos autorizado, el administrador de la cuenta consumidora puede asociar el recurso compartido de datos a la Cuenta de AWS completa o al espacio de nombres del clúster específico en una cuenta. Un administrador también puede rechazar un recurso para compartir datos.
+ **Integraciones sin ETL**: administre las integraciones que hacen que los datos transaccionales estén disponibles en Amazon Redshift después de haberlos escrito en orígenes compatibles.
+ **Conexiones de IAM Identity Center**: configure la conexión entre Amazon Redshift e IAM Identity Center.
+ **Configurations** (Configuraciones): se puede conectar a clústeres de Amazon Redshift desde herramientas de cliente SQL mediante conexiones Java Database Connectivity (JDBC) y Open Database Connectivity (ODBC). También puede configurar un punto de conexión de Virtual Private Cloud (VPC) administrado por Amazon RedShift. De esta forma, se proporciona una conexión privada entre una VPC basada en el servicio Amazon VPC que contiene un clúster y otra VPC que ejecuta una herramienta cliente. 
+ **Integración de socios de AWS**: cree una integración con un socio de AWS compatible.
+ **Advisor** (Asesor): obtenga recomendaciones específicas sobre los cambios que puede realizar en su clúster de Amazon Redshift para priorizar sus optimizaciones.
+ **AWS Marketplace**: obtenga información sobre otras herramientas o servicios de AWS que funcionan con Amazon Redshift.
+ **Alarms** (Alarmas): cree alarmas en métricas de clúster para ver datos de rendimiento y realizar un seguimiento de las métricas durante el lapso de tiempo que especifique.
+ **Events** (Eventos): realice un seguimiento de los eventos y obtenga informes sobre información, como la fecha en que se produjo el evento, una descripción o el origen del evento.
+ **What’s new** (Novedades): vea nuevas características de Amazon Redshift y actualizaciones de productos.

En este tutorial, debe realizar los siguientes pasos. 

![\[Los pasos de este tutorial se describen a continuación.\]](http://docs.aws.amazon.com/es_es/redshift/latest/gsg/images/getting-started-bring-own-data.png)


**Topics**
+ [Inscripción en AWS](#provisioned-prereq-signup)
+ [Determinación de reglas de firewall](#rs-gsg-prereq-firewall-rules)
+ [Paso 1: Crear un clúster de Amazon Redshift de muestra](#rs-gsg-launch-sample-cluster)
+ [Paso 2: Configurar las reglas de entrada para los clientes SQL](#rs-gsg-authorize-cluster-access)
+ [Paso 3: otorgar acceso a un cliente de SQL y ejecutar consultas](#rs-gsg-connect-to-cluster)
+ [Paso 4: Cargar datos desde Amazon S3 en Amazon Redshift](#rs-gsg-create-sample-db)
+ [Paso 5: Probar consultas de ejemplo mediante el editor de consultas](#rs-gsg-try-query)
+ [Paso 6: Restablecer su entorno](#rs-gsg-clean-up-tasks)

## Inscripción en AWS
<a name="provisioned-prereq-signup"></a>

Si aún no tiene una Cuenta de AWS, regístrese para obtener una. Si ya tiene una cuenta, puede saltearse este requisito previo y utilizar la cuenta existente.

1. Abra [https://portal.aws.amazon.com/billing/signup](https://portal.aws.amazon.com/billing/signup).

1. Siga las instrucciones que se le indiquen.

   Parte del procedimiento de registro consiste en recibir una llamada telefónica o mensaje de texto e indicar un código de verificación en el teclado del teléfono.

   Al registrarse en una Cuenta de AWS, se crea un *Usuario raíz de la cuenta de AWS*. El usuario raíz tendrá acceso a todos los Servicios de AWS y recursos de esa cuenta. Como práctica recomendada de seguridad, asigne acceso administrativo a un usuario y utilice únicamente el usuario raíz para realizar [Tareas que requieren acceso de usuario raíz](https://docs.aws.amazon.com/IAM/latest/UserGuide/id_root-user.html#root-user-tasks).

## Determinación de reglas de firewall
<a name="rs-gsg-prereq-firewall-rules"></a>

**nota**  
En este tutorial, se da por sentado que el clúster utiliza el puerto predeterminado 5439 y que el editor de consultas de Amazon Redshift v2 se puede utilizar para ejecutar comandos de SQL. No se detallan las configuraciones de red ni la configuración de un cliente de SQL que se podrían necesitar en su entorno.

En algunos entornos, deberá especificar un puerto cuando lance el clúster de Amazon Redshift. Se utiliza este puerto junto con la URL del punto de conexión del clúster para acceder al clúster. También deberá crear una regla de entrada en un grupo de seguridad para permitir el acceso al clúster a través del puerto.

Si el equipo cliente está protegido por un firewall, asegúrese de conocer un puerto abierto que pueda utilizar. Con este puerto abierto, puede conectarse al clúster desde una herramienta cliente SQL y ejecutar consultas. Si no conoce un puerto abierto, deberá trabajar con alguna persona que entienda las reglas del firewall de red para encontrar un puerto abierto en su firewall. 

Si bien Amazon Redshift utiliza el puerto 5439 de forma predeterminada, la conexión no funciona si dicho puerto no está abierto en el firewall. No se puede cambiar el número de puerto que corresponde al clúster de Amazon Redshift después de crearlo. Por lo tanto, asegúrese de especificar un puerto abierto que funcione en su entorno durante el proceso de lanzamiento.

## Paso 1: Crear un clúster de Amazon Redshift de muestra
<a name="rs-gsg-launch-sample-cluster"></a>

En este tutorial, seguirá el proceso de creación de un clúster de Amazon Redshift con una base de datos. Luego, deberá cargar un conjunto de datos desde Amazon S3 en las tablas de la base de datos. Puede utilizar este clúster de ejemplo para evaluar el servicio de Amazon Redshift.

Antes de comenzar a configurar el clúster de Amazon Redshift, asegúrese de completar los requisitos previos, como [Inscripción en AWS](#provisioned-prereq-signup) y [Determinación de reglas de firewall](#rs-gsg-prereq-firewall-rules).

Para cualquier operación que acceda a datos que estén en otro recurso de AWS, el clúster necesita permiso para acceder en su nombre al recurso y a los datos del recurso. Un ejemplo es el uso de un comando de SQL COPY para cargar datos desde Amazon Simple Storage Service (Amazon S3). Estos permisos los concede utilizando AWS Identity and Access Management (IAM). Puede hacerlo a través de un rol de IAM que haya creado y asociado al clúster. Para obtener más información sobre las credenciales y los permisos de acceso, consulte [Credenciales y permisos de acceso](https://docs.aws.amazon.com/redshift/latest/dg/loading-data-access-permissions.html) en la *Guía para desarrolladores de bases de datos de Amazon Redshift*.

**Para crear un clúster de Amazon Redshift**

1. Inicie sesión en la Consola de administración de AWS y abra la consola de Amazon Redshift en [https://console.aws.amazon.com/redshiftv2/](https://console.aws.amazon.com/redshiftv2/).
**importante**  
Si utiliza las credenciales de usuario de IAM, asegúrese de que el usuario cuente con los permisos necesarios para realizar las operaciones del clúster. Para obtener más información, consulte [Seguridad en Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/mgmt/iam-redshift-user-mgmt.html) en la *Guía de administración de Amazon Redshift*.

1. En la consola de AWS, elija la Región de AWS en la que desee crear el clúster. 

1. En el menú de navegación, elija **Clusters** (Clústeres) y, a continuación, elija **Create cluster** (Crear clúster). Se abrirá la página **Create cluster (Crear clúster)**.

1. En la sección **Cluster configuration** (Configuración del clúster), especifique valores para **Cluster identifier** (Identificador del clúster), **Node type** (Tipo de nodo) y **Nodes** (Nodos): 
   + En **Cluster identifier** (Identificador del clúster), ingrese **examplecluster** para este tutorial. Este identificador debe ser único. El identificador debe tener entre 1 y 63 caracteres y utilizar como caracteres válidos letras de la a a la z (solo minúsculas) y el - (guion). 
   + Elija uno de los siguientes métodos para ajustar el tamaño del clúster:
**nota**  
En el siguiente paso, se da por sentado que la Región de AWS es compatible con tipos de nodo RA3. Para obtener una lista de las Regiones de AWS que admiten los tipos de nodo RA3, consulte [Información general sobre los tipos de nodo RA3](https://docs.aws.amazon.com/redshift/latest/mgmt/working-with-clusters.html#rs-ra3-node-types) en la *Guía de administración de Amazon Redshift*. Para obtener más información sobre las especificaciones de cada tipo y tamaño de nodo, consulte [Detalles acerca de los tipos de nodos](https://docs.aws.amazon.com/redshift/latest/mgmt/working-with-clusters.html#rs-node-type-info).
     + Si no sabe cuál sería el tamaño adecuado para el clúster, elija **Help me choose** (Ayúdeme a elegir). De esta forma, se abre una calculadora de tamaño que le hace preguntas sobre el tamaño y las características de consulta de los datos que planea almacenar en el almacenamiento de datos. 

       Si conoce el tamaño requerido para su clúster (es decir, el tipo de nodo y la cantidad de nodos), elija **I’ll choose** (Yo elegiré). A continuación, elija el **Node type** (Tipo de nodo) y la cantidad de **Nodes** (nodos) para dimensionar el clúster.

       Para este tutorial, seleccione **ra3.4xlarge** para **Tipo de nodo** y **2** para **Número de nodos**.

       Si la opción **Configuración de AZ** está disponible, elija **Single-AZ**.
     + Para usar el conjunto de datos de muestra que proporciona Amazon Redshift, en **Sample data** (Datos de muestra), elija **Load sample data** (Cargar datos de muestra). Amazon Redshift cargará el conjunto de datos de muestra Tickit en la base de datos `dev` y el esquema `public` predeterminados.

1. En la sección **Configuración de la base de datos**, especifique un valor para **Nombre de usuario del administrador**. En **Contraseña de administrador**, elija entre las siguientes opciones:
   +  **Generar contraseña**: use una contraseña generada por Amazon Redshift. 
   +  **Añadir manualmente una contraseña de administrador**: use su propia contraseña. 
   +  **Administrar las credenciales de administrador en AWS Secrets Manager**: Amazon Redshift usa AWS Secrets Manager para generar y administrar su contraseña de administrador. El uso de AWS Secrets Manager para generar y administrar el secreto de la contraseña conlleva un gasto. Para obtener información sobre precios de AWS Secrets Manager, consulte [Precios de AWS Secrets Manager](https://aws.amazon.com/secrets-manager/pricing/). 

   Para este tutorial, utilice los valores siguientes:
   + **Admin user name** (Nombre del usuario administrador): ingrese **awsuser**.
   + **Contraseña del usuario administrador**: ingrese **Changeit1** para la contraseña.

1. Para este tutorial, cree un rol de IAM y configúrelo como predeterminado para su clúster, como se describe a continuación. Solo se puede configurar un rol de IAM como predeterminado para un clúster. 

   1. En **Cluster permissions** (Permisos de clúster), para **Manage IAM roles** (Administrar roles de IAM), elija **Create IAM role** (Crear rol de IAM).

   1. Especifique un bucket de Amazon S3 para que el rol de IAM tenga acceso mediante uno de los siguientes métodos:
      + Elija **No additional Amazon S3 bucket** (Sin bucket adicional de Amazon S3), para permitir que el rol de IAM creado acceda solo a los depósitos de Amazon S3 denominados `redshift`.
      + Elija **Any Amazon S3 bucket** (Cualquier bucket de Amazon S3), para permitir que el rol de IAM creado acceda a todos los buckets de Amazon S3. 
      + Elija **Specific Amazon S3 buckets** (Buckets específicos de Amazon S3), para especificar uno o más buckets de Amazon S3 para el rol de IAM creado al que puede acceder. A continuación, elija uno o más buckets de Amazon S3 de la tabla.

   1. Elija **Create IAM role as default** (Crear un rol de IAM como predeterminado). Amazon Redshift crea y configura automáticamente el rol de IAM como predeterminado para su clúster.

      Debido a que ha creado su rol de IAM desde la consola, este tiene la política `AmazonRedshiftAllCommandsFullAccess` adjunta. Esto permite a Amazon Redshift copiar, cargar, consultar y analizar datos de los recursos de Amazon en su cuenta de IAM. 

   Para obtener más información acerca de cómo administrar el rol de IAM predeterminado para un clúster, consulte [Creación de un rol de IAM como predeterminado para Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/mgmt/default-iam-role.html) en la *Guía de administración de Amazon Redshift*.

1. (Opcional) En la sección **Configuraciones adicionales**, desactive **Utilizar valores predeterminados** para modificar las opciones de configuración **Red y seguridad**, **Configuración de base de datos**, **Mantenimiento**, **Supervisión** y **Copia de seguridad**.

   En algunos casos, puede crear su clúster con la opción **Load sample data** (Cargar datos de muestra) y quizá desee activar el enrutamiento mejorado de Amazon VPC. De ser así, el clúster de su nube virtual privada requiere acceso al punto de conexión de Amazon S3 para que se carguen los datos. 

   Para que el clúster sea accesible públicamente, puede optar por una de estas dos opciones. Puede configurar una dirección de traducción de direcciones de red (NAT) en su VPC para que el clúster acceda a Internet. O bien, puede configurar un punto de conexión de la VPC de Amazon S3 en la VPC. Para obtener más información acerca del enrutamiento mejorado de Amazon VPC, consulte [Enrutamiento mejorado de Amazon VPC](https://docs.aws.amazon.com/redshift/latest/mgmt/enhanced-vpc-enabling-cluster.html) en la *Guía de administración de Amazon Redshift*. 

1. Elija **Create cluster**. Espere a que se cree el clúster con el estado `Available` que aparece en la página **Clústeres**.

## Paso 2: Configurar las reglas de entrada para los clientes SQL
<a name="rs-gsg-authorize-cluster-access"></a>

**nota**  
Le recomendamos que se salte este paso y acceda al clúster mediante el editor de consultas de Amazon Redshift v2.

Luego, en este tutorial, puede acceder a su clúster desde una nube virtual privada (VPC) basada en el servicio Amazon VPC. No obstante, si utiliza un cliente SQL desde fuera de su firewall para acceder al clúster, asegúrese de otorgar acceso de entrada. 

**Para comprobar el firewall y otorgar acceso entrante a su clúster**

1. Compruebe las reglas de su firewall si necesita acceder al clúster desde fuera de un firewall. Por ejemplo, su cliente podría ser una instancia de Amazon Elastic Compute Cloud (Amazon EC2) o un equipo externo. 

   Para obtener más información sobre las reglas de firewall, consulte [Reglas del grupo de seguridad](https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/security-group-rules.html) en la *Guía del usuario de Amazon EC2*.

1. Para acceder desde un cliente externo de Amazon EC2, agregue una regla de entrada al grupo de seguridad adjunto a su clúster que permita el tráfico entrante. Las reglas del grupo de seguridad de Amazon EC2 se agregan en la consola de Amazon EC2. Por ejemplo, un CIDR/IP de 192.0.2.0/24 permite a los clientes de ese intervalo de direcciones IP conectarse a su clúster. Descubra cuál es el CIDR/IP correcto para su entorno.

## Paso 3: otorgar acceso a un cliente de SQL y ejecutar consultas
<a name="rs-gsg-connect-to-cluster"></a>

Para consultar las bases de datos alojadas en el clúster de Amazon Redshift, tiene varias opciones para los clientes de SQL: Entre ellos se incluyen:
+ Conectarse a su clúster y ejecutar consultas mediante el editor de consultas de Amazon Redshift v2.

  Si utiliza el editor de consultas v2, no tiene que descargar y configurar una aplicación cliente de SQL. Inicie el editor de consultas de Amazon Redshift v2 desde la consola de Amazon Redshift.
+ Conectarse al clúster con RSQL. Para obtener más información, consulte [Conexión con Amazon Redshift RSQL](https://docs.aws.amazon.com/redshift/latest/mgmt/rsql-query-tool.html) en la *Guía de administración de Amazon Redshift*.
+ Conéctese al clúster a través de una herramienta de cliente de SQL, como SQL Workbench/J. Para obtener más información, consulte [Conexión al clúster mediante SQL Workbench/J](https://docs.aws.amazon.com/redshift/latest/mgmt/connecting-using-workbench.html) en la *Guía de administración de Amazon Redshift*.

En este tutorial, se usa el editor de consultas de Amazon Redshift v2 como la forma más sencilla de ejecutar consultas en bases de datos alojadas por el clúster de Amazon Redshift. Después de crear su clúster, podrá ejecutar consultas de forma inmediata. Para obtener más información acerca de los aspectos que se deben tener en cuenta al usar el editor de consultas de Amazon Redshift v2, visite [Consideraciones al trabajar con el editor de consultas v2](https://docs.aws.amazon.com/redshift/latest/mgmt/query-editor-v2-using.html#query-editor-v2-considerations) en la *Guía de administración de Amazon Redshift*.

### Otorgamiento de acceso al editor de consultas v2
<a name="gsg-query-cluster-configure-v2"></a>

La primera vez que un administrador configura el editor de consultas v2 para su Cuenta de AWS, este elige la AWS KMS key que se utiliza para cifrar los recursos del editor de consultas v2. Entre los recursos del editor de consultas de Amazon Redshift v2, se incluyen consultas guardadas, libretas y gráficos. De manera predeterminada, se utiliza una clave propia de AWS para cifrar los recursos. Como alternativa, un administrador puede utilizar una clave administrada por el cliente seleccionando el nombre de recurso de Amazon (ARN) para la clave en la página de configuración. Luego de configurar una cuenta, la configuración de cifrado AWS KMS no se puede modificar. Para obtener más información, consulte [Configuración de su Cuenta de AWS](https://docs.aws.amazon.com/redshift/latest/mgmt/query-editor-v2-getting-started.html) en la *Guía de administración de Amazon Redshift*.

Para obtener acceso al editor de consultas v2, necesita permiso. Un administrador puede asociar una de las siguientes políticas administradas de AWS para el editor de consultas de Amazon Redshift v2 al rol o usuario de IAM para conceder permisos. Estas políticas administradas de AWS se escriben con diferentes opciones que controlan cómo los recursos de etiquetado permiten compartir consultas. Puede utilizar la consola de IAM ([https://console.aws.amazon.com/iam/](https://console.aws.amazon.com/iam/)) para adjuntar políticas de IAM. Para obtener más información sobre estas políticas, consulte [Acceso al editor de consultas v2](https://docs.aws.amazon.com/redshift/latest/mgmt/query-editor-v2-getting-started.html#query-editor-v2-configure) en la *Guía de administración de Amazon Redshift*.

También puede crear su propia política en función de los permisos permitidos y denegados en las políticas administradas proporcionadas. Si utiliza el editor de políticas de la consola de IAM para crear su propia política, elija **SQL Workbench** como servicio para el que crea la política en el editor visual. El editor de consultas v2 utiliza el nombre del servicio AWS SQL Workbench en el editor visual y el Simulador de políticas de IAM.

Para obtener más información, consulte [Trabajo con Query Editor v2](https://docs.aws.amazon.com/redshift/latest/mgmt/query-editor-v2-using.html#query-editor-v2-configure) en la *Guía de administración de Amazon Redshift*.

## Paso 4: Cargar datos desde Amazon S3 en Amazon Redshift
<a name="rs-gsg-create-sample-db"></a>

Después de crear el clúster, puede cargar datos desde Amazon S3 en las tablas de la base de datos. Hay varias maneras de cargar datos desde Amazon S3. 
+ Puede usar un cliente de SQL para ejecutar el comando de SQL CREATE TABLE para crear una tabla en la base de datos y, a continuación, usar el comando de SQL COPY para cargar datos desde Amazon S3. El editor de consultas de Amazon Redshift v2 es un cliente de SQL.
+ Puede utilizar el asistente de carga del editor de consultas de Amazon Redshift v2.

En este tutorial se muestra cómo utilizar el editor de consultas V2 de Amazon Redshift para ejecutar comandos de SQL para tablas CREATE y datos COPY. Inicie el **Editor de consultas v2** desde el panel de navegación de la consola de Amazon Redshift. En el editor de consultas v2, cree una conexión con el clúster de `examplecluster` y la base de datos denominada `dev` con el nombre de su usuario administrador `awsuser`. Para este tutorial, elija **Credenciales temporales con un nombre de usuario de base de datos** al crear la conexión. Para obtener información sobre cómo utilizar el editor de consultas de Amazon Redshift v2, consulte [Conexión a una base de datos de Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/mgmt/query-editor-v2-using.html#query-editor-v2-connecting) en la *Guía de administración de Amazon Redshift*.

### Carga de datos desde Amazon S3 mediante comandos de SQL
<a name="gsg-load-sample-data-v1"></a>

En el panel del editor de consultas v2, confirme que está conectado al clúster de `examplecluster` y a la base de datos de `dev`. A continuación, cree tablas en la base de datos y cargue datos en las tablas. Para este tutorial, los datos que se cargan están disponibles en un bucket de Amazon S3 al que se puede acceder desde muchas Regiones de AWS.

En el siguiente procedimiento, se crean tablas y se cargan datos desde un bucket de Amazon S3 público.

Si utiliza el editor de consultas de Amazon Redshift v2, copie y ejecute la siguiente instrucción de creación de tablas para crear una tabla en el esquema `public` de la base de datos `dev`. Para obtener más información acerca de la sintaxis, consulte [CREATE TABLE](https://docs.aws.amazon.com/redshift/latest/dg/r_CREATE_TABLE_NEW.html) en la *Guía para desarrolladores de bases de datos de Amazon Redshift*.

**Creación y carga de datos mediante un cliente de SQL como el editor de consultas v2**

1. Ejecute el siguiente comando de SQL CREATE para crear la tabla `sales`.

   ```
      drop table if exists sales;
      create table sales(
   	salesid integer not null,
   	listid integer not null distkey,
   	sellerid integer not null,
   	buyerid integer not null,
   	eventid integer not null,
   	dateid smallint not null sortkey,
   	qtysold smallint not null,
   	pricepaid decimal(8,2),
   	commission decimal(8,2),
   	saletime timestamp);
   ```

1. Ejecute el siguiente comando de SQL CREATE para crear la tabla `date`.

   ```
   drop table if exists date;              
   create table date(
   	dateid smallint not null distkey sortkey,
   	caldate date not null,
   	day character(3) not null,
   	week smallint not null,
   	month character(5) not null,
   	qtr character(5) not null,
   	year smallint not null,
   	holiday boolean default('N'));
   ```

1. Cargue la tabla `sales` desde Amazon S3 con el comando COPY.
**nota**  
Le recomendamos utilizar el comando COPY para cargar grandes conjuntos de datos en Amazon Redshift desde Amazon S3. Para obtener más información acerca de la sintaxis de COPY, consulte [COPY](https://docs.aws.amazon.com/redshift/latest/dg/r_COPY.html) en la *Guía para desarrolladores de bases de datos de Amazon Redshift*.

   Proporcione autenticación para que el clúster acceda a Amazon S3 en su nombre para cargar los datos de muestra. Para este paso, deberá proporcionar autenticación mediante la referencia al rol de IAM que creó y configuró como `default` en su clúster cuando seleccionó **Crear un rol de IAM como predeterminado** al crear el clúster.

   Cargue la tabla `sales` con el siguiente comando de SQL. Si lo desea, puede descargar y ver desde Amazon S3 los [datos de origen para la tabla `sales`](https://s3.amazonaws.com/redshift-downloads/tickit/sales_tab.txt). .

   ```
   COPY sales
       FROM 's3://redshift-downloads/tickit/sales_tab.txt' 
       DELIMITER '\t' 
       TIMEFORMAT 'MM/DD/YYYY HH:MI:SS' 
       REGION 'us-east-1'
       IAM_ROLE default;
   ```

1. Cargue la tabla `date` con el siguiente comando de SQL. Si lo desea, puede descargar y ver desde Amazon S3 los [datos de origen para la tabla `date`](https://s3.amazonaws.com/redshift-downloads/tickit/date2008_pipe.txt). .

   ```
   COPY date
       FROM 's3://redshift-downloads/tickit/date2008_pipe.txt' 
       DELIMITER '|' 
       REGION 'us-east-1'
       IAM_ROLE default;
   ```

### Carga de datos desde Amazon S3 mediante el editor de consultas v2
<a name="gsg-load-sample-data-v2"></a>

En esta sección, se describe cómo cargar los datos propios en un clúster de Amazon Redshift. El uso del editor de consultas v2 simplifica la carga de datos cuando se utiliza el asistente **Cargar datos**. El comando COPY generado y utilizado en el asistente **Cargar datos** del editor de consultas v2 admite todos los parámetros disponibles para la sintaxis del comando COPY para cargar datos de Amazon S3. Para obtener información acerca del comando COPY y las opciones que se utilizan para copiar la carga de Amazon S3, consulte [Comando COPY de Amazon Simple Storage Service](https://docs.aws.amazon.com/redshift/latest/dg/copy-parameters-data-source-s3.html) en la *Guía para el desarrollador de base de datos de Amazon Redshift*.

Para cargar sus propios datos de Amazon S3 en Amazon Redshift, Amazon Redshift, requiere un rol de IAM que tenga los privilegios necesarios para cargar datos del bucket de Amazon S3 especificado.

Para cargar los datos propios desde Amazon S3 en Amazon Redshift, puede usar el asistente de carga de datos del editor de consultas v2. Para obtener más información sobre cómo usar el asistente de carga de datos, consulte [Carga de datos desde Amazon S3](https://docs.aws.amazon.com/redshift/latest/mgmt/query-editor-v2-loading-data.html) en la *Guía de administración de Amazon Redshift*. 

### Creación de datos de TICKIT en su clúster
<a name="gsg-load-tickit-data-v2"></a>

TICKIT es una base de datos de ejemplo que, si lo desea, puede cargar en el clúster de Amazon Redshift para aprender a consultar datos en Amazon Redshift. Puede crear el conjunto completo de tablas de TICKIT y cargar datos en su clúster de las siguientes maneras:
+ Cuando se crea un clúster en la consola de Amazon Redshift, en ese momento tiene la opción cargar datos de TICKIT de muestra al mismo tiempo. En la consola de Amazon Redshift, elija **Clústeres** y **Crear clúster**. En la sección **Datos de muestra**, seleccione **Cargar datos de muestra**. Amazon Redshift cargará automáticamente el conjunto de datos de muestra en la base de datos `dev` del clúster de Amazon Redshift durante la creación del clúster.
+ Para conectarse a un clúster existente, haga lo siguiente:
  + En la consola de Amazon Redshift, elija **Clústeres** en la barra de navegación.
  + Elija el clúster en el panel **Clústeres**.
  + Elija **Consultar datos** y **Consultar en el editor de consultas v2**.
  + Expanda **examplecluster** en la lista de recursos. Si es la primera vez que se conecta al clúster, aparece **Conectarse a examplecluster**. Elija **Nombre de usuario y contraseña de la base de datos**. Deje la base de datos como **dev**. Especifique **awsuser** para el nombre de usuario y **Changeit1** para la contraseña.
  + Elija **Crear conexión**.
+ Con el editor de consultas de Amazon Redshift v2, puede cargar datos de TICKIT en una base de datos de muestra denominada **sample\$1data\$1dev**. Elija la base de datos **sample\$1data\$1dev** en la lista de recursos. Junto al nodo **tickit**, elija el icono **Abrir blocs de notas de ejemplo**. Confirme que desea crear la base de datos de ejemplo.
+ El editor de consultas de Amazon Redshift v2 crea la base de datos de muestra junto con un cuaderno de ejemplo denominado **tickit-sample-notebook**. Puede elegir **Ejecutar todo** para ejecutar este bloc de notas para consultar los datos de la base de datos de ejemplo.

Para ver más información sobre los datos de TICKIT, consulte [Bases de datos de muestra](https://docs.aws.amazon.com/redshift/latest/dg/c_sampledb.html) en la *Guía para desarrolladores de bases de datos de Amazon Redshift*.

## Paso 5: Probar consultas de ejemplo mediante el editor de consultas
<a name="rs-gsg-try-query"></a>

Para configurar y usar el editor de consultas de Amazon Redshift v2 para consultar una base de datos, visite [Trabajo con el editor de consultas v2](https://docs.aws.amazon.com/redshift/latest/mgmt/query-editor-v2-using.html) en la *Guía de administración de Amazon Redshift*.

Ahora, pruebe algunas consultas de ejemplo, como se muestra a continuación. Para crear consultas nuevas en el editor de consultas v2, elija el icono **\$1** en la esquina superior derecha del panel de consultas y elija **SQL**. Aparece una nueva página de consultas en la que puede copiar y pegar las siguientes consultas SQL.

**nota**  
Asegúrese de ejecutar primero la primera consulta en el bloc de notas, que establece el valor de configuración del servidor `search_path` en el esquema `tickit` mediante el siguiente comando SQL:  

```
set search_path to tickit;
```

Para obtener más información acerca de cómo trabajar con el comando SELECT, consulte [SELECT](https://docs.aws.amazon.com/redshift/latest/dg/r_SELECT_synopsis.html) en la *Guía para desarrolladores de bases de datos de Amazon Redshift*.

```
-- Get definition for the sales table.
SELECT *    
FROM pg_table_def    
WHERE tablename = 'sales';
```

```
-- Find total sales on a given calendar date.
SELECT sum(qtysold) 
FROM   sales, date 
WHERE  sales.dateid = date.dateid 
AND    caldate = '2008-01-05';
```

```
-- Find top 10 buyers by quantity.
SELECT firstname, lastname, total_quantity 
FROM   (SELECT buyerid, sum(qtysold) total_quantity
        FROM  sales
        GROUP BY buyerid
        ORDER BY total_quantity desc limit 10) Q, users
WHERE Q.buyerid = userid
ORDER BY Q.total_quantity desc;
```

```
-- Find events in the 99.9 percentile in terms of all time gross sales.
SELECT eventname, total_price 
FROM  (SELECT eventid, total_price, ntile(1000) over(order by total_price desc) as percentile 
       FROM (SELECT eventid, sum(pricepaid) total_price
             FROM   sales
             GROUP BY eventid)) Q, event E
       WHERE Q.eventid = E.eventid
       AND percentile = 1
ORDER BY total_price desc;
```

## Paso 6: Restablecer su entorno
<a name="rs-gsg-clean-up-tasks"></a>

En los pasos anteriores, creó correctamente un clúster de Amazon Redshift, cargó los datos en tablas y consultó los datos mediante un cliente de SQL como el editor de consultas de Amazon Redshift v2.

Cuando haya completado este tutorial, le sugerimos restablecer el entorno a su estado anterior eliminando el clúster de muestra. Se le seguirá cobrando por el servicio Amazon Redshift hasta que elimine el clúster.

No obstante, es posible que desee continuar ejecutando el clúster de muestra si planea probar tareas de otras guías de Amazon Redshift o las tareas descritas en [Ejecución de comandos para definir y utilizar una base de datos en el almacenamiento de datos](database-tasks.md). 

**Para eliminar un clúster**

1. Inicie sesión en la Consola de administración de AWS y abra la consola de Amazon Redshift en [https://console.aws.amazon.com/redshiftv2/](https://console.aws.amazon.com/redshiftv2/).

1. En el menú de navegación, elija **Clusters** (Clústeres) para mostrar la lista de clústeres. 

1. Seleccione el clúster de `examplecluster`. En **Actions (Acciones)**, seleccione **Delete (Eliminar)**. Aparece la página **Delete examplecluster?**. 

1. Confirme el clúster que desea eliminar, desactive la opción **Crear instantánea final** y, a continuación, ingrese **delete** para confirmar la eliminación. Seleccione **Delete cluster (Eliminar clúster)**. 

En la página de lista de clúster, se actualiza el estado del clúster a medida que se elimina el clúster. 

Luego de completar este tutorial, podrá encontrar más información acerca de Amazon Redshift y los pasos siguientes en [Recursos adicionales para obtener información acerca de Amazon Redshift](additional-resources.md).