Eseguire query su dati di S3 Express One Zone - Amazon Athena

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Eseguire query su dati di S3 Express One Zone

La classe di archiviazione Amazon S3 Express One Zone è una classe di archiviazione di Amazon S3 ad alte prestazioni che fornisce tempi di risposta nell'ordine dei millisecondi. Pertanto, è utile per le applicazioni che accedono frequentemente ai dati con centinaia di migliaia di richieste al secondo.

S3 Express One Zone replica e archivia i dati all'interno della stessa zona di disponibilità per ottimizzare velocità e costi. Ciò si differenzia dalle classi di storage regionali di Amazon S3, che replicano automaticamente i dati su almeno AWS tre zone di disponibilità all'interno di una. Regione AWS

Per ulteriori informazioni, consulta la pagina What is S3 Express One Zone? nella Guida per l'utente di Amazon S3.

Prerequisiti

Prima di iniziare, verifica che siano soddisfatte le seguenti condizioni:

  • Versione 3 del motore Athena: per utilizzare S3 Express One Zone con Athena SQL, il gruppo di lavoro deve essere configurato per l'utilizzo della versione 3 del motore Athena.

  • Autorizzazioni S3 Express One Zone: quando S3 Express One Zone richiama un'operazione come GET, LIST o PUT su un oggetto Amazon S3, la classe di archiviazione chiama CreateSession per tuo conto. Per questo motivo, la tua policy IAM deve consentire l'operazione s3express:CreateSession, che consente ad Athena di invocare l'operazione dell'API corrispondente.

Considerazioni e limitazioni

Durante l'interrogazione di S3 Express One Zone con Athena, considera i seguenti punti.

  • I bucket S3 Express One Zone supportano la crittografia SSE_S3 e SSE-KMS. I risultati delle query Athena vengono scritti utilizzando la crittografia SSE_S3 indipendentemente dall'opzione di crittografia dei risultati delle query selezionata nelle impostazioni del gruppo di lavoro. Questa limitazione include tutti gli scenari in cui Athena scrive dati su bucket S3 Express One Zone, incluse le istruzioni CREATE TABLE AS (CTAS) e INSERT INTO.

  • Il AWS Glue crawler non è supportato per la creazione di tabelle sui dati di S3 Express One Zone.

  • L'istruzione MSCK REPAIR TABLE non è supportata. Come soluzione alternativa, utilizza ALTER TABLE ADD PARTITION.

  • In S3 Express One Zone, non è supportata alcuna istruzione DDL che modifichi tabelle per Apache Iceberg (ovvero nessuna istruzione ALTER TABLE).

  • Lake Formation non è supportato dai bucket di S3 Express One Zone.

  • I seguenti formati di file e tabelle non sono supportati o hanno un supporto limitato. Se i formati, pur non essendo elencati, sono supportati per Athena (come Parquet, ORC e JSON), sono supportati anche per l'uso con l'archiviazione S3 Express One Zone.

    Formato di file o tabella Limitazione
    Apache Avro Non supportata
    CloudTrail registri Non supportata
    Apache Hudi Non supportata
    Amazon Ion Non supportata
    Log di Logstash Non supportata
    registri di Apache WebServer Non supportata
    Delta Lake DDL non supportato. Per informazioni sulla creazione di una tabella Delta Lake utilizzando uno schema fittizio, consulta la pagina Sincronizzazione dei metadati Delta Lake. Le query SELECT sulla tabella sono supportate.

Nozioni di base

L'interrogazione dei dati di S3 Express One Zone con Athena è semplice. Per iniziare, attieniti alla procedura seguente.

Utilizzo di Athena SQL per interrogare i dati di S3 Express One Zone
  1. Trasferisci i tuoi dati all'archiviazione S3 Express One Zone. Per ulteriori informazioni, consulta la pagina Impostare la classe di archiviazione di un oggetto nella Guida per l'utente di Amazon S3.

  2. Utilizza un'istruzione CREATE TABLE in Athena per catalogare i tuoi dati in AWS Glue Data Catalog. Per ulteriori informazioni sulla creazione delle tabelle in Athena, consulta la pagina Crea tabelle in Athena e l'istruzione CREATE TABLE.

  3. (Facoltativo) Configura la posizione dei risultati della query del tuo gruppo di lavoro Athena per utilizzare un bucket di directory Amazon S3. I bucket di directory Amazon S3 sono più performanti dei bucket generici e sono progettati per carichi di lavoro o applicazioni critiche per le prestazioni che richiedono una latenza costante nell'ordine dei millisecondi. Per ulteriori informazioni, consulta la pagina Directory buckets overview nella Guida per l'utente di Amazon S3.