Introducción a la consulta de tablas de S3 con Estudio unificado de Amazon SageMaker - Amazon Simple Storage Service

Introducción a la consulta de tablas de S3 con Estudio unificado de Amazon SageMaker

Estudio unificado de Amazon SageMaker es un servicio de análisis integral que permite consultar y obtener información a partir de los datos mediante SQL, lenguaje natural y blocs de notas interactivos. Admite la colaboración en equipo y los flujos de trabajo de análisis en repositorios de datos de AWS y orígenes de terceros dentro de una interfaz unificada. Estudio unificado de Sagemaker se integra directamente con tablas de S3, lo que proporciona una transición perfecta del almacenamiento de datos al análisis en la consola de Amazon S3.

Puede integrar tablas de S3 con Estudio unificado de SageMaker a través de la consola de Amazon S3 o la consola del Estudio unificado de SageMaker.

Para realizar la configuración a través de la consola del Estudio unificado de SageMaker, consulte la Documentación del Estudio unificado de SageMaker.

Requisitos para consulta de tablas de S3 con Estudio unificado de Sagemaker

El uso del Estudio unificado de Sagemaker con tablas de S3 requiere lo siguiente:

Si aún no ha realizado estas acciones o creado estos recursos, las tablas de S3 pueden completar automáticamente esta configuración para que pueda empezar a realizar consultas con Estudio unificado de Sagemaker.

Introducción a la consulta de tablas de S3 con Estudio unificado de SageMaker

  1. Abra la consola de Amazon S3 en https://console.aws.amazon.com/s3/.

  2. En el panel de navegación izquierdo, elija Buckets de tablas.

  3. En la página Buckets de tablas, seleccione el bucket que contiene la tabla que desea consultar.

  4. En la página de detalles del bucket, elija la tabla que desea consultar.

  5. Elija Consulta.

  6. A continuación, elija Tabla de consultas en Estudio unificado de Sagemaker.

    1. Si ya ha configurado Estudio unificado de Sagemaker para las tablas, la consola de Estudio unificado de Sagemaker se abre en el editor de consultas con una consulta SELECT de ejemplo cargada para usted. Modifique la consulta según proceda para su caso de uso.

    2. Si aún no ha configurado Estudio unificado de Sagemaker para tablas de S3, aparecerá una página de configuración con un solo paso para habilitar la integración con los servicios de análisis de AWS, que integra las tablas con servicios como Estudio unificado de Sagemaker. Este paso se ejecutará automáticamente y, a continuación, se redirigirá a la persona a una página de la consola de Estudio unificado de Sagemaker con las siguientes opciones para configurar la cuenta para consultar tablas de S3:

      1. Al Configurarlo como administrador, se selecciona el rol de IAM federado actual. Si el rol actual aún no tiene los permisos necesarios, tendrá que configurar un dominio basado en IAM en Estudio unificado de Sagemaker y asignar permisos al rol para poder iniciar sesión en Estudio unificado de Sagemaker.

      2. En Datos del proyecto y control administrativo, seleccione Crear automáticamente un nuevo rol con los permisos necesarios para crear automáticamente un rol con los permisos necesarios o seleccione Usar un rol existente y elegir un rol. Si el rol actual aún no tiene los permisos necesarios, tendrá que configurar un dominio basado en IAM en Estudio unificado de Sagemaker y asignar permisos al rol de ejecución de administración para poder acceder a los datos en Estudio unificado de Sagemaker.

      3. En Cifrado de datos seleccione Usar una clave propiedad de AWS para permitir a AWS que posea y administre una clave por usted o Elija una clave de AWS AWS KMS diferente (avanzada) para usar una clave existente o crear una nueva.

      4. Seleccione Configurar Estudio unificado de Sagemaker.

      5. A continuación, la consola de Estudio unificado de Sagemaker se abre en el editor de consultas con una consulta SELECT de ejemplo cargada automáticamente. Modifique la consulta según proceda para su caso de uso.

        En el editor de consultas, el campo Catálogo se debe rellenar con s3tablescatalog/ seguido del nombre del bucket de tablas, por ejemplo, s3tablescatalog/amzn-s3-demo-table-bucket. El campo Base de datos se rellena con el espacio de nombres en el que está almacenada la tabla.