Utilizzo degli asset (guida per l’utente) - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Utilizzo degli asset (guida per l’utente)

Usa SageMaker Assets per collaborare senza problemi a progetti di machine learning con altre persone della tua organizzazione. Con SageMaker Assets, tu e i tuoi collaboratori create e condividete modelli e tabelle di dati tra di voi. All'interno di SageMaker Assets, questi modelli e tabelle di dati sono noti come risorse.

SageMaker Assets è una funzionalità di Amazon SageMaker Studio. Tu o il tuo amministratore create un ambiente Studio all'interno di un DataZone progetto Amazon. Per ulteriori informazioni sulla configurazione di Amazon DataZone, consultaConfigura SageMaker Assets (guida per amministratori).

Gli asset sono di tipo dati o ML. Gli asset di ML sono metadati che rimandano a quanto segue:

  • Gruppi di funzionalità dell’archivio delle caratteristiche

  • SageMaker Gruppi di modelli AI

I gruppi di modelli e i gruppi di funzionalità sottostanti sono le origini dei dati. Se aggiorni un gruppo di funzionalità o un gruppo di modelli, l’asset relativo a tale gruppo viene aggiornato entro un giorno.

Gli asset di dati sono metadati che rimandano a quanto segue:

  • Tabelle Amazon Redshift

  • AWS Gluetavoli

Per gli asset di dati, l’origine dati è il meccanismo che estrae i metadati dalle tabelle di AWS Glue e dalle tabelle di Amazon Redshift e li inserisce nell’asset. Ad esempio, un'origine dati estrae i metadati da una AWS Glue tabella nella risorsa relativa a quella tabella.

Puoi rendere visibile un asset a tutti i membri dell’organizzazione pubblicandolo. Le persone possono esaminare i metadati dell’asset e richiedere l’accesso. Se lo concedi, possono accedere all’origine dati o alla tabella di machine learning sottostante.

È probabile che l’amministratore ti abbia concesso l’accesso ai gruppi di funzionalità, ai gruppi di modelli e alle tabelle. Se non lo ha fatto, consulta le informazioni in Configura SageMaker Assets (guida per amministratori) per iniziare.

Le sezioni seguenti forniscono informazioni di riferimento su gruppi di funzionalità e gruppi di modelli.

Amazon SageMaker Feature Store offre una posizione centralizzata per aiutarti a memorizzare e gestire le tue funzionalità. È un repository ad alte prestazioni che puoi utilizzare per l’ingegneria delle caratteristiche.

Nell’archivio delle caratteristiche, le funzionalità vengono archiviate in un gruppo di funzionalità. Un gruppo di funzionalità è una raccolta di funzionalità correlate a un progetto su cui stai lavorando. Ad esempio, se stai lavorando a un progetto per la previsione dei prezzi degli immobili, un gruppo di funzionalità potrebbe includere caratteristiche come l’ubicazione o il numero di camere da letto.

Per ulteriori informazioni su come utilizzare i gruppi di funzionalità per semplificare il processo di ingegneria delle caratteristiche, consulta Creazione, archiviazione e condivisione di funzionalità con l’archivio delle caratteristiche.

Puoi utilizzare i gruppi di modelli SageMaker AI all'interno di SageMaker Model Registry per organizzare e gestire diverse versioni dei tuoi modelli. Puoi confrontare le diverse versioni dei modelli per vedere quale offre le prestazioni migliori per il tuo caso d’uso. Per ulteriori informazioni su SageMaker Model Registry, consultaImplementazione della registrazione del modello con il registro dei modelli.

Di seguito sono riportate informazioni di base su Amazon Redshift e AWS Glue.

Amazon Redshift è un servizio di data warehousing su larga scala che consente query rapide su set di dati di grandi dimensioni. Per ulteriori informazioni su Amazon Redshift, consulta Amazon Redshift serverless.

AWS Glueè un servizio di estrazione, trasformazione, caricamento (ETL) che puoi utilizzare per semplificare il processo di preparazione dei dati. Per ulteriori informazioni suAWS Glue, consulta What isAWS Glue?

Puoi utilizzare l'editor SQL per connettere AWS Glue database Amazon Redshift ed eseguire query. Puoi condividere qualsiasi tabella creata nell'editor all'interno SageMaker di Assets. Per ulteriori informazioni, consulta Preparazione dei dati con SQL in Studio.

Concetti e terminologia

Prima di iniziare a utilizzare SageMaker Assets, è utile acquisire familiarità con la terminologia e i concetti seguenti:

  • Asset: i metadati che rimandano ai modelli o alle tabelle di dati che stai condividendo. Puoi richiedere l’accesso a un asset di proprietà di qualcun altro o condividere il tuo asset con altri. Tu e i tuoi colleghi accedete all’asset e alla tabella o al modello di dati sottostante ad esso associato.

  • Asset sottoscritti: per richiedere l’accesso a un asset, invii una richiesta di abbonamento. Se la richiesta viene approvata, l’asset viene visualizzato tra gli asset sottoscritti.

  • Asset di proprietà: gli asset che hai condiviso con i tuoi colleghi del team.

  • Catalogo degli asset: gli asset che hai condiviso all’interno dell’organizzazione.

Fase 1: Accedere alle risorse SageMaker

Accedi alle SageMaker risorse per visualizzare le tue risorse e condividerle con altri. Utilizza le informazioni seguenti per iniziare a utilizzare la soluzione.

Accedi a SageMaker Assets da un progetto all'interno di un DataZone dominio Amazon. Un progetto è una collaborazione tra te e i membri del tuo team. All’interno del progetto, tu e gli altri membri del progetto avete accesso agli asset che voi e gli altri membri del team create all’interno del catalogo dell’inventario. Puoi pubblicare gli asset nel catalogo pubblicato per renderli visibili agli altri membri dell’organizzazione.

Queste persone possono richiedere l’accesso al tuo asset. Se lo concedi, possono accedere all’origine dati aggiornata. Ad esempio, se una persona si iscrive a una AWS Glue tabella che aggiorni, può accedere alla AWS Glue tabella aggiornata in tempo reale.

Utilizzate la seguente procedura per accedere a SageMaker Assets.

Per accedere alle SageMaker risorse
  1. Apri la DataZone console Amazon.

  2. Scegli Visualizza domini.

  3. Accanto al dominio che contiene il progetto, scegli Apri il portale dei dati.

  4. In Strumenti di analisi, scegli SageMaker AI Studio.

  5. Scegli Open Amazon SageMaker AI.

  6. Scegliere Assets (Asset).

Gli asset che sono stati condivisi con te si trovano in Asset sottoscritti. Gli asset creati da te e dai membri del progetto si trovano in Asset di proprietà. Gli asset che tu e gli altri membri della tua organizzazione avete pubblicato si trovano nel Catalogo degli asset.

Fase 2. Condividi gli asset e gestiscine l’accesso

Dopo aver creato modelli di machine learning, gruppi di funzionalità o tabelle di dati, puoi renderli visibili alle persone che collaborano con te al progetto o, più in generale, alla tua organizzazione. Puoi rispondere alle richieste di accesso all’asset. Se approvi la richiesta di una persona, questa può modificare l’origine dati sottostante dell’asset.

Quando condividi un asset, hai due possibilità:

  • Pubblica nel catalogo degli asset: rendi l’asset visibile a tutti i membri dell’organizzazione

  • Pubblica nell’inventario: rendi l’asset visibile a tutti coloro che lavorano al tuo progetto

Se hai pubblicato il tuo asset nel catalogo degli asset, le persone della tua organizzazione possono trovarlo nel catalogo degli asset. Possono visualizzare i metadati del tuo asset e decidere se richiederne l’accesso. Se approvi la richiesta, avranno accesso all’origine dati sottostante.

Se pubblichi nell’inventario, tu e gli altri membri del progetto potete accedere all’asset senza alcuna azione aggiuntiva.

Gli asset pubblicati nell’inventario vengono visualizzati solo nella sezione Asset di proprietà. Gli asset pubblicati nel catalogo vengono visualizzati nella sezione Asset di proprietà e Catalogo degli asset.

Quando pubblichi una tabella di dati, devi creare un'origine dati che estragga i metadati dalla AWS Glue tabella sottostante o dalla tabella Amazon Redshift nella risorsa. Utilizza le seguenti procedure per pubblicare una AWS Glue o una tabella Amazon Redshift.

Publish anAWS Gluetable

Per pubblicare una risorsa per una AWS Glue tabella, devi creare una fonte di dati corrispondente e pubblicarla. Una fonte di dati è il meccanismo che estrae i metadati dalla AWS Glue tabella alla risorsa.

Utilizzate la procedura seguente per pubblicare una AWS Glue tabella.

Per pubblicare una AWS Glue tabella
  1. Vai alla pagina iniziale di SageMaker Assets.

  2. Seleziona Asset di proprietà.

  3. Scegli Visualizza origini dati.

  4. Seleziona Create data source (Crea origine dati).

  5. In Nome, specifica un nome per l’origine dati.

  6. In Descrizione, fornisci una descrizione.

  7. In Tipo, seleziona AWS Glue.

  8. Per la selezione dei dati, seleziona il database contenente la AWS Glue tabella.

  9. In Criteri di selezione della tabella, specifica il nome della tabella.

    Nota

    Anche se puoi specificare più di una tabella, ti consigliamo vivamente di limitarti a un solo nome.

  10. Scegli Next (Successivo).

    • In Pubblica asset nel catalogo, seleziona per la pubblicazione nel catalogo degli asset.

    • In Pubblica asset nel catalogo, seleziona No per la pubblicazione nel catalogo degli asset.

  11. Scegli Next (Successivo).

  12. In Dettagli dell’asset, scegli Esegui in base a una pianificazione o Esegui on demand per determinare in che modo i metadati della tabella AWS Glue vengono inseriti nell’asset.

  13. (Facoltativo) Se scegli Esegui in base a una pianificazione, specifica la pianificazione per l’inserimento dei metadati nell’asset.

  14. Scegli Next (Successivo).

  15. Scegli Create (Crea).

  16. (Facoltativo) Se non hai creato una pianificazione, scegli Esegui per trasferire i metadati dalla tabella AWS Glue all’asset.

Publish an Amazon Redshift table

Per pubblicare un asset per una tabella Amazon Redshift, devi creare e pubblicare un’origine dati per la tabella. Un’origine dati è il meccanismo che estrae i metadati dalla tabella Amazon Redshift e li inserisce nell’asset.

Utilizza la procedura seguente per pubblicare una tabella Amazon Redshift.

Per pubblicare una tabella Amazon Redshift
  1. Vai alla pagina iniziale di SageMaker Assets.

  2. Seleziona Asset di proprietà.

  3. Scegli Visualizza origini dati.

  4. Seleziona Create data source (Crea origine dati).

  5. In Nome, specifica un nome per l’origine dati.

  6. In Descrizione, fornisci una descrizione.

  7. In Tipo, seleziona Amazon Redshift.

    • Seleziona Cluster Redshift.

      1. In Cluster Redshift, specifica il nome del cluster Amazon Redshift che contiene il database per la tabella.

      2. Per Segreto, specifica il nome del Gestione dei segreti AWS segreto contenente le credenziali per il cluster.

    • Seleziona Redshift serverless.

      1. In Gruppo di lavoro Redshift, specifica il nome del gruppo di lavoro Amazon Redshift che contiene il database per la tabella.

      2. Per Segreto, specificare il nome del Gestione dei segreti AWS segreto contenente le credenziali per il gruppo di lavoro.

  8. In Pubblica selezione origine, seleziona il database che contiene la tabella Amazon Redshift.

  9. In Criteri di selezione della tabella, specifica il nome della tabella.

    Nota

    Anche se puoi specificare più di una tabella, ti consigliamo vivamente di limitarti a un solo nome.

  10. Scegli Next (Successivo).

    • In Pubblica asset nel catalogo, seleziona per la pubblicazione nel catalogo degli asset.

    • In Pubblica asset nel catalogo, seleziona No per la pubblicazione nel catalogo degli asset.

  11. Scegli Next (Successivo).

  12. In Dettagli dell’asset, scegli Esegui in base a una pianificazione o Esegui on demand per stabilire in che modo i metadati della tabella Amazon Redshift vengono inseriti nell’asset.

  13. (Facoltativo) Se scegli Esegui in base a una pianificazione, specifica la pianificazione per l’inserimento dei metadati nell’asset.

  14. Scegli Next (Successivo).

  15. Scegli Create (Crea).

  16. (Facoltativo) Se non hai creato una pianificazione, scegli Esegui per trasferire i metadati dalla tabella Amazon Redshift all’asset.

Utilizza le procedure seguenti per pubblicare un asset per un gruppo di funzionalità o un gruppo di pacchetti di modelli.

Publish a feature group

Utilizza la procedura seguente per accedere a un gruppo di funzionalità che hai creato e pubblicarlo sugli asset di tua proprietà o nel catalogo degli asset.

Per pubblicare il gruppo di funzionalità negli asset di proprietà o nel catalogo degli asset
  1. All’interno di Studio, seleziona Dati nel riquadro di navigazione a sinistra.

  2. Seleziona il gruppo di funzionalità che stai pubblicando.

  3. Scegli l’icona Three dots next to the feature group. .

    • Seleziona Pubblica nel catalogo degli asset per eseguire la pubblicazione nel catalogo degli asset.

    • Seleziona Pubblica nell’inventario per eseguire la pubblicazione sugli asset di proprietà del tuo gruppo.

Publish a model group

Utilizza la procedura seguente per accedere a un gruppo di modelli che hai creato e pubblicarlo sugli asset di tua proprietà o nel catalogo degli asset.

Per pubblicare il gruppo di modelli sugli asset di tua proprietà o nel catalogo degli asset
  1. All’interno di Studio, seleziona Modelli nel riquadro di navigazione a sinistra.

  2. Seleziona il gruppo di modelli che stai pubblicando.

  3. Scegli l’icona Three dots next to the model group. .

    • Seleziona Pubblica nel catalogo degli asset per eseguire la pubblicazione nel catalogo degli asset.

    • Seleziona Pubblica nell’inventario per eseguire la pubblicazione sugli asset di proprietà del tuo gruppo.

Utilizza la procedura seguente per pubblicare un asset dagli asset di tua proprietà al catalogo degli asset.

Per pubblicare una risorsa dalla pagina Risorse SageMaker
  1. All’interno di Studio, vai ad Asset.

  2. Seleziona Asset di proprietà.

  3. Specifica il nome dell’asset nella barra di ricerca.

  4. Scegli l’asset.

  5. Seleziona Pubblica.

È possibile utilizzare il seguente codice SageMaker Python SDK per pubblicare un gruppo di funzionalità o un gruppo di pacchetti di modelli. Il codice presuppone che il gruppo di funzionalità o il pacchetto di modelli da modificare siano stati già creati.

from sagemaker.asset import AssetManager publisher = AssetPublisher() publisher.publish_to_catalog(name-of-your-feature-group-or-model-package)

Fase 3. Gestisci le richieste di accesso

Dopo aver pubblicato un asset, gli utenti esterni al progetto potrebbero volervi accedere. Puoi fornire, rifiutare o revocare le richieste di accesso. Puoi anche eliminare gli asset per rendere disponibile l’origine dati sottostante solo per te.

Utilizza la procedura seguente per rispondere alle richieste di abbonamento.

Per approvare le richieste di abbonamento
  1. Vai alla pagina SageMaker Risorse.

  2. Scegli Gestisci gli asset dell’asset.

  3. Seleziona Richieste di abbonamento in arrivo.

    • (Facoltativo) Scegli Approva e fornisci il motivo.

    • (Facoltativo) Scegli Rifiuta.

Puoi revocare l’accesso a un asset che hai precedentemente approvato. Se scegli di revocare l’accesso, gli utenti perderanno l’accesso sia all’asset che l’origine dati sottostante dell’asset. Utilizza la procedura seguente per revocare l’acceso.

Per revocare l’accesso
  1. Vai alla pagina SageMaker Risorse.

  2. Scegli Gestisci gli asset dell’asset.

  3. Seleziona Richieste di abbonamento in arrivo.

  4. Seleziona la scheda Approvato.

  5. Scegli Revoca accanto all’asset.

Puoi anche annullare la pubblicazione degli asset, facendoli apparire solo come asset di proprietà. Gli asset non saranno visibili nel catalogo degli asset, ma le persone per cui hai approvato le richieste di abbonamento potranno comunque accedervi.

Per annullare la pubblicazione di un asset
  1. Vai alla pagina SageMaker Risorse.

  2. In Asset di proprietà, seleziona l’asset per il quale stai annullando la pubblicazione.

  3. Selezionare Unpublish (Annulla pubblicazione).

Gli asset possono essere eliminati anche dalla pagina di annullamento della pubblicazione. L’eliminazione di un asset non elimina l’origine dati. L’eliminazione di un asset lo rende solo invisibile agli altri membri del progetto o dell’organizzazione.

Fase 4. Individua gli asset e richiedine l’accesso

Puoi richiedere l’accesso agli asset che altri utenti hanno pubblicato nel catalogo degli asset. Se approvano la richiesta di abbonamento, avrai accesso all’origine dati sottostante.

Nella parte superiore della pagina SageMaker Risorse, puoi specificare una query di ricerca per trovare le risorse pubblicate da altri utenti dell'organizzazione. Puoi anche selezionare un tipo di asset per visualizzare tutti gli asset pubblicati di quel tipo. Ad esempio, puoi selezionare Tabella Glue per visualizzare tutte le tabelle AWS Glue pubblicate.

Il tipo di asset è anche visualizzato direttamente sotto il nome dell’asset. Di seguito sono riportati i nomi disponibili per i tipi di asset:

  • Tabella Redshift

  • Tabella Glue

  • Modelli  

  • Gruppo di funzionalità

Nota

I gruppi di funzionalità negli archivi seguenti hanno il tipo di tabella Glue:

  • Offline

  • Offline e online

Per effettuare una richiesta di abbonamento
  1. Passate alla pagina SageMaker Risorse.

    • Nella barra di ricerca, specifica il nome dell’asset e scegli Cerca.

    • In Tipi, seleziona il tipo di asset e trova un asset a cui puoi accedere nel catalogo degli asset.

  2. Scegli l’asset.

  3. Scegli Abbonati.

  4. Fornisci un motivo per la richiesta.

  5. Seleziona Invia.

La tua richiesta di abbonamento viene visualizzata in Richieste di abbonamento in uscita nella sezione Gestisci le richieste di asset. Se il publisher dell’asset approva la richiesta, questa viene visualizzata in Asset sottoscritti. Ora puoi utilizzare la fonte di dati Amazon Redshift, AWS Glue table o ML nei tuoi flussi di lavoro di machine learning.

Fase 5. Utilizza un asset condiviso nei flussi di lavoro di machine learning

Se la tua richiesta di abbonamento a un asset viene approvata, puoi utilizzarlo nei flussi di lavoro di machine learning.

I gruppi di funzionalità a cui hai avuto accesso vengono visualizzati nell’elenco dei gruppi di funzionalità in Studio.

I gruppi di modelli a cui hai avuto accesso vengono visualizzati nell’elenco dei gruppi di modelli in Studio. Puoi aprire il gruppo di modelli nel registro dei modelli da SageMaker Assets. Utilizza la procedura seguente per aprire il gruppo di modelli all’interno del registro dei modelli. Asset sottoscritti.

Per aprire un gruppo di modelli da SageMaker Assets
  1. Seleziona il gruppo di modelli.

  2. Scegli Apri nel registro dei modelli.

Puoi accedere alle nostre AWS Glue tabelle Amazon Redshift in Data Wrangler all'interno di Canvas. SageMaker SageMaker Canvas è un'applicazione che consente di eseguire analisi esplorative dei dati (EDA) e addestrare modelli senza codice. Per ulteriori informazioni su SageMaker Canvas, consultaAmazon SageMaker Tela.

Puoi anche trasferire i dati dalle tue tabelle AWS Glue o da Amazon Redshift nei tuoi notebook Jupyter utilizzando l'estensione SQL. Puoi convertire i dati in DataFrame pandas per i tuoi flussi di lavoro di machine learning. Per ulteriori informazioni, consulta Preparazione dei dati con SQL in Studio.