Utilizzo di Amazon SageMaker Feature Store nella console - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Utilizzo di Amazon SageMaker Feature Store nella console

Importante

Le politiche IAM personalizzate che consentono ad Amazon SageMaker Studio o Amazon SageMaker Studio Classic di creare SageMaker risorse Amazon devono inoltre concedere le autorizzazioni per aggiungere tag a tali risorse. L’autorizzazione per aggiungere tag alle risorse è necessaria perché Studio e Studio Classic applicano automaticamente tag a tutte le risorse che creano. Se una policy IAM consente a Studio e Studio Classic di creare risorse ma non consente l'etichettatura, possono verificarsi errori AccessDenied "" durante il tentativo di creare risorse. Per ulteriori informazioni, consulta Fornisci le autorizzazioni per etichettare SageMaker le risorse AI.

AWSpolitiche gestite per Amazon SageMaker AIche danno i permessi per creare SageMaker risorse includono già le autorizzazioni per aggiungere tag durante la creazione di tali risorse.

Puoi utilizzare Amazon SageMaker Feature Store sulla console per creare, visualizzare, aggiornare e monitorare i tuoi gruppi di funzionalità. In questa guida, il monitoraggio include la visualizzazione delle esecuzioni della pipeline e del lineage dei gruppi di funzionalità. Questa guida fornisce istruzioni su come eseguire queste attività dalla console.

Per esempi e risorse sul Feature Store che utilizzano Amazon SageMaker APIs eAWS SDK per Python (Boto3), consultaRisorse SageMaker di Amazon Feature Store.

Creazione di un gruppo di funzionalità dalla console

Il processo di creazione del gruppo di funzionalità prevede quattro fasi:

  1. Inserisci le informazioni sul gruppo di funzionalità.

  2. Inserisci le definizioni delle funzionalità.

  3. Inserisci le funzionalità richieste.

  4. Inserisci i tag del gruppo di funzionalità.

Considera quale delle seguenti opzioni si adatta meglio al tuo caso d’uso:

  • Crea un archivio online, un archivio offline o entrambi. Per ulteriori informazioni sulle differenze tra archivi online e offline, consulta Concetti di base sul Feature Store.

  • Usa una AWS Key Management Service chiave predefinita o la tua chiave KMS. La chiave predefinita è la chiave AWS KMS (SSE-KMS). Puoi ridurre i costi delle AWS KMS richieste configurando l'uso di Amazon S3 Bucket Keys nel bucket Amazon S3 dello store offline. La chiave del bucket Amazon S3 deve essere abilitata prima di utilizzare il bucket per i gruppi di funzionalità. Per ulteriori informazioni sulla riduzione dei costi grazie alle chiavi del bucket Amazon S3, consulta Riduzione del costo di SSE-KMS con le chiavi del bucket Amazon S3.

    Puoi utilizzare la stessa chiave per gli archivi online e offline o configurare una chiave univoca per ciascuno di essi. Per ulteriori informazioni su, consulta. AWS KMS AWS Key Management Service

  • Se crei un archivio offline:

    • Decidi se creare un bucket Amazon S3 o utilizzarne uno esistente. Nel secondo caso, devi conoscere l’URL del bucket Amazon S3 oppure il nome del bucket Amazon S3 e il nome della directory del set di dati, se richiesto.

    • Scegli quale nome della risorsa Amazon (ARN) utilizzare per specificare il ruolo IAM. Per ulteriori informazioni su come trovare il ruolo e le policy collegate, consulta Aggiunta di policy al ruolo IAM.

    • Decidi se utilizzare il formato AWS Glue (predefinito) o Apache Iceberg tabellare. Nella maggior parte dei casi d’uso, si utilizza il formato di tabella Apache Iceberg. Per ulteriori informazioni sui formati delle tabelle, consulta Utilizzo di Feature Store con SDK per Python (Boto3).

Puoi utilizzare la console per visualizzare il lineage di un gruppo di funzionalità. Le istruzioni sull’utilizzo dell’archivio delle caratteristiche dalla console variano a seconda che l’esperienza predefinita sia impostata su Amazon SageMaker Studio o Amazon SageMaker Studio Classic.

  1. Apri la console Studio seguendo le istruzioni riportate in Avvia Amazon SageMaker Studio.

  2. Scegli Dati dal riquadro di navigazione a sinistra per espandere l’elenco a discesa.

  3. Dall'elenco a discesa, scegli Feature Store.

  4. Seleziona Crea gruppo di funzionalità.

  5. In Dettagli del gruppo di funzionalità, inserisci un nome per il gruppo di funzionalità.

  6. (Facoltativo) Immetti una descrizione per il gruppo di funzionalità.

  7. In Configurazione di archiviazione del gruppo di funzionalità, scegli una configurazione di archiviazione dall’elenco a discesa. Per informazioni sulla configurazione di archiviazione, consulta Configurazioni di archiviazione dell'archivio funzionalità.

  8. Se hai scelto di abilitare l’archiviazione online:

    1. Se abiliti solo l’archiviazione online, puoi scegliere un tipo di archiviazione dall’elenco a discesa. Per informazioni sui tipi di archiviazione degli archivi online, consulta Archivio online.

    2. (Facoltativo) Applica Time to Live (TTL) posizionando l’interruttore su Attivato e specificando il valore e l’unità di Durata di Time to Live. Ciò aggiornerà la durata TTL predefinita per tutti i record aggiunti al gruppo di funzionalità dopo la creazione del gruppo di funzionalità. Per ulteriori informazioni su TTL, consulta Durata Time to live (TTL) per i record.

  9. Se hai scelto di abilitare l’archiviazione offline:

    1. Sotto il nome del bucket Amazon S3, inserisci il nome di un nuovo bucket o inserisci manualmente l’URL di un bucket esistente.

    2. Dall'elenco a discesa Formato tabella, scegli il formato di tabella. Nella maggior parte dei casi d’uso, si utilizza il formato di tabella Apache Iceberg. Per ulteriori informazioni sui formati delle tabelle, consulta Utilizzo di Feature Store con SDK per Python (Boto3).

    3. In ARN del ruolo IAM, scegli l'ARN del ruolo IAM che desideri collegare a questo gruppo di funzionalità. Per ulteriori informazioni su come trovare il ruolo e le policy collegate, consulta Aggiunta di policy al ruolo IAM.

    4. Se hai scelto di abilitare il formato tabella di archiviazione offline e il formato tabella AWS Glue (predefinito), in Catalogo dati puoi scegliere una delle due opzioni seguenti:

      • Utilizza i valori predefiniti per AWS Glue Data Catalog:

      • Fornisci il nome del catalogo dati esistente, il nome della tabella e il nome del database per estendere il AWS Glue Data Catalog esistente.

  10. Nell’elenco a discesa Chiave di crittografia dell’archivio online o Chiave di crittografia dell’archivio offline, scegli una delle seguenti opzioni:

    • Usa AWS gestito AWS KMS key (impostazione predefinita)

    • Inserisci un AWS KMS key ARN e inserisci la tua chiave AWS KMS ARN nella chiave di crittografia del negozio offline ARN. Per ulteriori informazioni in meritoAWS KMS, consulta AWSKey Management Service.

  11. Se applicabile, potrai scegliere la modalità di throughput, che influirà sulla modalità di addebito. In Modalità di throughput, scegli una modalità dall’elenco a discesa e inserisci le capacità di lettura e scrittura, se disponibili. Per informazioni sulle modalità di throughput, ad esempio quando applicare una determinata modalità e cosa sono le unità di capacità, consulta Modalità di velocità di trasmissione effettiva

  12. Una volta specificate tutte le informazioni richieste, viene reso disponibile il pulsante Continua. Scegli Continua.

  13. In Specifica definizioni di funzionalità, sono disponibili due opzioni per fornire uno schema per le funzionalità: un editor JSON o un editor di tabelle.

    • Editor JSON: nella scheda JSON, immetti o copia e incolla le definizioni delle funzionalità in formato JSON.

    • Editor delle tabelle: nella scheda Tabella, immetti il nome della funzionalità e scegli il tipo di dati corrispondente per ogni funzionalità del tuo gruppo di funzionalità. Scegli + Aggiungi definizioni di funzionalità per includere altre funzionalità. Tieni presente che non puoi rimuovere le definizioni delle funzionalità dai gruppi di funzionalità. Tuttavia, puoi aggiungere e aggiornare tali definizioni dopo la creazione del gruppo di funzionalità.

    Un gruppo di funzionalità deve contenere almeno due funzionalità che rappresentano l’identificatore del record e l’ora dell’evento:

    • Il Tipo di funzionalità del record può essere una stringa, un valore frazionario o un integrale.

    • Il Tipo di funzionalità dell’ora dell’evento deve essere una stringa o un valore frazionario. Tuttavia, se hai scelto il formato di tabella Iceberg, l’ora dell’evento deve essere una stringa.

  14. Una volta incluse tutte le funzionalità, scegli Continua.

  15. In Seleziona funzionalità richieste, devi specificare le funzionalità dell’identificatore del record e dell’ora dell’evento. Per farlo, scegli il nome della funzionalità nei rispettivi elenchi a discesa Nome della funzionalità dell’identificatore del record e Nome della funzionalità relativa all’ora dell’evento.

  16. Una volta scelte le funzionalità dell’identificatore del record e dell’ora dell’evento, scegli Continua.

  17. (Facoltativo) Per aggiungere tag al gruppo di funzionalità, scegli Aggiungi nuovo tag. Quindi inserisci una chiave di tag e il valore corrispondente rispettivamente in Chiave e Valore.

  18. Scegli Continua.

  19. In Rivedi gruppo di funzionalità, rivedi le informazioni sul gruppo di funzionalità. Puoi modificare qualsiasi fase selezionando il pulsante Modifica corrispondente alla fase. Si passa quindi alla fase di modifica corrispondente. Per tornare alla fase 5, scegli Continua fino a tornare alla fase 5.

  20. Dopo aver finalizzato la configurazione per il gruppo di funzionalità, scegli Crea gruppo di funzionalità.

    Se si verifica un problema durante la configurazione, nella parte inferiore della pagina viene visualizzato un messaggio di avviso pop-up con suggerimenti per risolvere il problema. Puoi tornare alle fasi precedenti per risolvere i problemi scegliendo Modifica nella fase che presenta conflitti.

    Se il gruppo di funzionalità è stato creato correttamente, nella parte inferiore della pagina viene visualizzato un messaggio pop-up verde. Il nuovo gruppo di funzionalità appare anche nel catalogo dei gruppi di funzionalità.

Visualizzazione dei dettagli del gruppo di funzionalità dalla console

Puoi visualizzare i dettagli dei tuoi gruppi di funzionalità dopo aver creato correttamente un gruppo di funzionalità nell’archivio delle caratteristiche.

Puoi utilizzare la console o l'API Amazon SageMaker Feature Store per visualizzare i dettagli del tuo gruppo di funzionalità. Le istruzioni sull’utilizzo dell’archivio delle caratteristiche dalla console variano a seconda che l’esperienza predefinita sia impostata su Amazon SageMaker Studio o Amazon SageMaker Studio Classic.

  1. Apri la console Studio seguendo le istruzioni riportate in Avvia Amazon SageMaker Studio.

  2. Scegli Dati nel riquadro di navigazione a sinistra per espandere l’elenco a discesa.

  3. Dall'elenco a discesa, scegli Feature Store.

  4. (Facoltativo) Per visualizzare i tuoi gruppi di funzionalità, scegli Il mio account. Per visualizzare i gruppi di funzionalità condivisi, scegli Multi-account.

  5. Nella scheda Catalogo del Feature Store, scegli il nome del tuo gruppo di funzionalità dall'elenco. Si apre la pagina del gruppo di funzionalità.

  6. Nella scheda Funzionalità, puoi trovare un elenco di tutte le funzionalità. Usa il filtro per perfezionare l'elenco. Scegli una funzionalità per visualizzarne i dettagli.

  7. Nella scheda Dettagli e nella sottoscheda Tag, puoi rivedere le informazioni del tuo gruppo di funzionalità. Ad esempio, puoi controllare Esecuzione più recente, Impostazioni di archiviazione offline, Impostazioni di archiviazione online e altro ancora.

  8. Nella scheda Dettagli e nella sottoscheda Tag, puoi rivedere i tag del tuo gruppo di funzionalità. Scegli Aggiungi nuovo tag per aggiungere un nuovo tag o Rimuovi per rimuovere un tag.

  9. Nella scheda Esecuzioni della pipeline, puoi visualizzare le pipeline associate o le esecuzioni della pipeline per il tuo gruppo di funzionalità.

  10. Nella scheda Lineage, puoi visualizzare il lineage del tuo gruppo di funzionalità.

Aggiornamento di un gruppo di funzionalità dalla console

Puoi aggiornare i tuoi gruppi di funzionalità dopo aver creato correttamente un gruppo di funzionalità nell’archivio delle caratteristiche.

Puoi utilizzare la console o l'API Amazon SageMaker Feature Store per aggiornare un gruppo di funzionalità. Le istruzioni sull’utilizzo dell’archivio delle caratteristiche dalla console variano a seconda che l’esperienza predefinita sia impostata su Amazon SageMaker Studio o Amazon SageMaker Studio Classic.

  1. Apri la console Studio seguendo le istruzioni riportate in Avvia Amazon SageMaker Studio.

  2. Scegli Dati nel riquadro di navigazione a sinistra per espandere l’elenco a discesa.

  3. Dall'elenco a discesa, scegli Feature Store.

  4. (Facoltativo) Per visualizzare i tuoi gruppi di funzionalità, scegli Il mio account. Per visualizzare i gruppi di funzionalità condivisi, scegli Multi-account.

  5. Nella scheda Catalogo del gruppo di funzionalità, cerca e scegli il nome del tuo gruppo di funzionalità dall'elenco. Si apre la pagina del gruppo di funzionalità.

  6. Seleziona Aggiorna gruppo di funzionalità.

  7. (Facoltativo) Se applicabile, puoi modificare la modalità di throughput, che influisce sulla modalità di addebito. In Modalità di throughput, scegli una modalità dall’elenco a discesa e inserisci le capacità di lettura e scrittura, se disponibili. Per informazioni sulle modalità di throughput, ad esempio quando applicare una determinata modalità e cosa sono le unità di capacità, consulta Modalità di velocità di trasmissione effettiva

  8. (Facoltativo) Se il tuo gruppo di funzionalità utilizza l'archivio online, puoi aggiornare il Time to Live (TTL) predefinito. Se il TTL non è stato abilitato per il gruppo di funzionalità, attiva l’interruttore in Time to Live (TTL) impostandolo su On. Puoi specificare il valore e l'unità TTL in Durata del Time to Live. Ciò aggiornerà la durata TTL predefinita per tutti i record aggiunti al gruppo di funzionalità dopo l'aggiornamento del gruppo di funzionalità.

  9. (Facoltativo) È possibile aggiungere definizioni di funzionalità al proprio gruppo di funzionalità, ma non è possibile rimuovere le definizioni di funzionalità dai gruppi di funzionalità. Per aggiungere una definizione di funzionalità, scegli + Aggiungi definizione di funzionalità, quindi specifica il nome della nuova definizione di funzionalità nella colonna Nome e seleziona il tipo di funzionalità nella colonna Tipo di funzionalità.

  10. Scegli Save changes (Salva modifiche).

  11. Per confermare le modifiche, scegli Conferma.

Visualizzazione delle esecuzioni della pipeline dalla console

Puoi visualizzare le informazioni più recenti sull’esecuzione della pipeline per una funzionalità o un gruppo di funzionalità in Esecuzioni della pipeline. Puoi anche ottenere link a pipeline, esecuzioni, codice e altre informazioni utili in merito.

Puoi utilizzare la console per visualizzare le esecuzioni della pipeline. Le istruzioni sull’utilizzo dell’archivio delle caratteristiche dalla console variano a seconda che l’esperienza predefinita sia impostata su Amazon SageMaker Studio o Amazon SageMaker Studio Classic.

  1. Apri la console Studio seguendo le istruzioni riportate in Avvia Amazon SageMaker Studio.

  2. Scegli Dati nel riquadro di navigazione a sinistra per espandere l’elenco a discesa.

  3. Dall'elenco a discesa, scegli Feature Store.

  4. (Facoltativo) Per visualizzare i tuoi gruppi di funzionalità, scegli Il mio account. Per visualizzare i gruppi di funzionalità condivisi, scegli Multi-account.

  5. Scegli un gruppo di funzionalità o una funzionalità di cui desideri visualizzare le esecuzioni della pipeline.

  6. Scegli la scheda Esecuzioni pipeline.

  7. Cerca una pipeline dall'elenco a discesa Seleziona pipeline.

  8. Puoi visualizzare i link per ottenere informazioni su pipeline, esecuzione e codice. Puoi anche visualizzare il proprietario, lo stato, la data e la durata dell’esecuzione.

Visualizzazione del lineage dalla console

È possibile visualizzare la discendenza di un gruppo di funzionalità. La discendenza include le informazioni sul codice di esecuzione del flusso di lavoro di elaborazione delle funzionalità, sulle fonti di dati utilizzate e sul modo in cui vengono inserite nel gruppo di funzionalità o nella funzionalità.

Puoi utilizzare la console per visualizzare il lineage di un gruppo di funzionalità. Le istruzioni sull’utilizzo dell’archivio delle caratteristiche dalla console variano a seconda che l’esperienza predefinita sia impostata su Amazon SageMaker Studio o Amazon SageMaker Studio Classic.

  1. Apri la console Studio seguendo le istruzioni riportate in Avvia Amazon SageMaker Studio.

  2. Scegli Dati dal riquadro di navigazione a sinistra per espandere l’elenco a discesa.

  3. Dall'elenco a discesa, scegli Feature Store.

  4. (Facoltativo) Per visualizzare i tuoi gruppi di funzionalità, scegli Il mio account. Per visualizzare i gruppi di funzionalità condivisi, scegli Multi-account.

  5. Scegli un gruppo di funzionalità o una funzionalità per visualizzarne i dettagli del lineage.

  6. Scegli la scheda Discendenza.

  7. Scegli un gruppo di funzionalità o un nodo di pipeline per espandere il nodo. Il nodo contiene ulteriori informazioni su un gruppo di funzionalità o una pipeline.

  8. È possibile ingrandire, rimpicciolire o ricentrare il grafico di discendenza utilizzando i pulsanti in basso a sinistra dello schermo.

  9. Puoi spostarti all’interno della mappa di lineage selezionando e trascinando lo schermo. Per spostare le mappe di lineage utilizzando i nodi come punto focale, puoi premere Tab o Maiusc+Tab per passare da un nodo all’altro.

  10. Se applicabile, puoi navigare lungo il lineage in modalità upstream (a sinistra, meno recente) o downstream (a destra, più recente). A tale scopo, seleziona un nodo e quindi scegli Query su lineage upstream o Query su lineage downstream.