Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Utilizzo degli asset (guida per l’utente)
Usa SageMaker Assets per collaborare senza problemi a progetti di machine learning con altre persone della tua organizzazione. Con SageMaker Assets, tu e i tuoi collaboratori create e condividete modelli e tabelle di dati tra di voi. All'interno di SageMaker Assets, questi modelli e tabelle di dati sono noti come risorse.
SageMaker Assets è una funzionalità di Amazon SageMaker Studio. Tu o il tuo amministratore create un ambiente Studio all'interno di un DataZone progetto Amazon. Per ulteriori informazioni sulla configurazione di Amazon DataZone, consultaConfigura SageMaker Assets (guida per amministratori).
Gli asset sono di tipo dati o ML. Gli asset di ML sono metadati che rimandano a quanto segue:
-
Gruppi di funzionalità dell’archivio delle caratteristiche
-
SageMaker Gruppi di modelli AI
I gruppi di modelli e i gruppi di funzionalità sottostanti sono le origini dei dati. Se aggiorni un gruppo di funzionalità o un gruppo di modelli, l’asset relativo a tale gruppo viene aggiornato entro un giorno.
Gli asset di dati sono metadati che rimandano a quanto segue:
-
Tabelle Amazon Redshift
-
AWS Gluetavoli
Per gli asset di dati, l’origine dati è il meccanismo che estrae i metadati dalle tabelle di AWS Glue e dalle tabelle di Amazon Redshift e li inserisce nell’asset. Ad esempio, un'origine dati estrae i metadati da una AWS Glue tabella nella risorsa relativa a quella tabella.
Puoi rendere visibile un asset a tutti i membri dell’organizzazione pubblicandolo. Le persone possono esaminare i metadati dell’asset e richiedere l’accesso. Se lo concedi, possono accedere all’origine dati o alla tabella di machine learning sottostante.
È probabile che l’amministratore ti abbia concesso l’accesso ai gruppi di funzionalità, ai gruppi di modelli e alle tabelle. Se non lo ha fatto, consulta le informazioni in Configura SageMaker Assets (guida per amministratori) per iniziare.
Le sezioni seguenti forniscono informazioni di riferimento su gruppi di funzionalità e gruppi di modelli.
Amazon SageMaker Feature Store offre una posizione centralizzata per aiutarti a memorizzare e gestire le tue funzionalità. È un repository ad alte prestazioni che puoi utilizzare per l’ingegneria delle caratteristiche.
Nell’archivio delle caratteristiche, le funzionalità vengono archiviate in un gruppo di funzionalità. Un gruppo di funzionalità è una raccolta di funzionalità correlate a un progetto su cui stai lavorando. Ad esempio, se stai lavorando a un progetto per la previsione dei prezzi degli immobili, un gruppo di funzionalità potrebbe includere caratteristiche come l’ubicazione o il numero di camere da letto.
Per ulteriori informazioni su come utilizzare i gruppi di funzionalità per semplificare il processo di ingegneria delle caratteristiche, consulta Creazione, archiviazione e condivisione di funzionalità con l’archivio delle caratteristiche.
Puoi utilizzare i gruppi di modelli SageMaker AI all'interno di SageMaker Model Registry per organizzare e gestire diverse versioni dei tuoi modelli. Puoi confrontare le diverse versioni dei modelli per vedere quale offre le prestazioni migliori per il tuo caso d’uso. Per ulteriori informazioni su SageMaker Model Registry, consultaImplementazione della registrazione del modello con il registro dei modelli.
Di seguito sono riportate informazioni di base su Amazon Redshift e AWS Glue.
Amazon Redshift è un servizio di data warehousing su larga scala che consente query rapide su set di dati di grandi dimensioni. Per ulteriori informazioni su Amazon Redshift, consulta Amazon Redshift serverless.
AWS Glueè un servizio di estrazione, trasformazione, caricamento (ETL) che puoi utilizzare per semplificare il processo di preparazione dei dati. Per ulteriori informazioni suAWS Glue, consulta What isAWS Glue?
Puoi utilizzare l'editor SQL per connettere AWS Glue database Amazon Redshift ed eseguire query. Puoi condividere qualsiasi tabella creata nell'editor all'interno SageMaker di Assets. Per ulteriori informazioni, consulta Preparazione dei dati con SQL in Studio.
Argomenti
Concetti e terminologia
Prima di iniziare a utilizzare SageMaker Assets, è utile acquisire familiarità con la terminologia e i concetti seguenti:
-
Asset: i metadati che rimandano ai modelli o alle tabelle di dati che stai condividendo. Puoi richiedere l’accesso a un asset di proprietà di qualcun altro o condividere il tuo asset con altri. Tu e i tuoi colleghi accedete all’asset e alla tabella o al modello di dati sottostante ad esso associato.
-
Asset sottoscritti: per richiedere l’accesso a un asset, invii una richiesta di abbonamento. Se la richiesta viene approvata, l’asset viene visualizzato tra gli asset sottoscritti.
-
Asset di proprietà: gli asset che hai condiviso con i tuoi colleghi del team.
-
Catalogo degli asset: gli asset che hai condiviso all’interno dell’organizzazione.
Fase 1: Accedere alle risorse SageMaker
Accedi alle SageMaker risorse per visualizzare le tue risorse e condividerle con altri. Utilizza le informazioni seguenti per iniziare a utilizzare la soluzione.
Accedi a SageMaker Assets da un progetto all'interno di un DataZone dominio Amazon. Un progetto è una collaborazione tra te e i membri del tuo team. All’interno del progetto, tu e gli altri membri del progetto avete accesso agli asset che voi e gli altri membri del team create all’interno del catalogo dell’inventario. Puoi pubblicare gli asset nel catalogo pubblicato per renderli visibili agli altri membri dell’organizzazione.
Queste persone possono richiedere l’accesso al tuo asset. Se lo concedi, possono accedere all’origine dati aggiornata. Ad esempio, se una persona si iscrive a una AWS Glue tabella che aggiorni, può accedere alla AWS Glue tabella aggiornata in tempo reale.
Utilizzate la seguente procedura per accedere a SageMaker Assets.
Per accedere alle SageMaker risorse
-
Apri la DataZone console Amazon
. -
Scegli Visualizza domini.
-
Accanto al dominio che contiene il progetto, scegli Apri il portale dei dati.
-
In Strumenti di analisi, scegli SageMaker AI Studio.
-
Scegli Open Amazon SageMaker AI.
-
Scegliere Assets (Asset).
Gli asset che sono stati condivisi con te si trovano in Asset sottoscritti. Gli asset creati da te e dai membri del progetto si trovano in Asset di proprietà. Gli asset che tu e gli altri membri della tua organizzazione avete pubblicato si trovano nel Catalogo degli asset.
Fase 2. Condividi gli asset e gestiscine l’accesso
Dopo aver creato modelli di machine learning, gruppi di funzionalità o tabelle di dati, puoi renderli visibili alle persone che collaborano con te al progetto o, più in generale, alla tua organizzazione. Puoi rispondere alle richieste di accesso all’asset. Se approvi la richiesta di una persona, questa può modificare l’origine dati sottostante dell’asset.
Quando condividi un asset, hai due possibilità:
-
Pubblica nel catalogo degli asset: rendi l’asset visibile a tutti i membri dell’organizzazione
-
Pubblica nell’inventario: rendi l’asset visibile a tutti coloro che lavorano al tuo progetto
Se hai pubblicato il tuo asset nel catalogo degli asset, le persone della tua organizzazione possono trovarlo nel catalogo degli asset. Possono visualizzare i metadati del tuo asset e decidere se richiederne l’accesso. Se approvi la richiesta, avranno accesso all’origine dati sottostante.
Se pubblichi nell’inventario, tu e gli altri membri del progetto potete accedere all’asset senza alcuna azione aggiuntiva.
Gli asset pubblicati nell’inventario vengono visualizzati solo nella sezione Asset di proprietà. Gli asset pubblicati nel catalogo vengono visualizzati nella sezione Asset di proprietà e Catalogo degli asset.
Quando pubblichi una tabella di dati, devi creare un'origine dati che estragga i metadati dalla AWS Glue tabella sottostante o dalla tabella Amazon Redshift nella risorsa. Utilizza le seguenti procedure per pubblicare una AWS Glue o una tabella Amazon Redshift.
Utilizza le procedure seguenti per pubblicare un asset per un gruppo di funzionalità o un gruppo di pacchetti di modelli.
Utilizza la procedura seguente per pubblicare un asset dagli asset di tua proprietà al catalogo degli asset.
Per pubblicare una risorsa dalla pagina Risorse SageMaker
-
All’interno di Studio, vai ad Asset.
-
Seleziona Asset di proprietà.
-
Specifica il nome dell’asset nella barra di ricerca.
-
Scegli l’asset.
-
Seleziona Pubblica.
È possibile utilizzare il seguente codice SageMaker Python SDK per pubblicare un gruppo di funzionalità o un gruppo di pacchetti di modelli. Il codice presuppone che il gruppo di funzionalità o il pacchetto di modelli da modificare siano stati già creati.
from sagemaker.asset import AssetManager publisher = AssetPublisher() publisher.publish_to_catalog(name-of-your-feature-group-or-model-package)
Fase 3. Gestisci le richieste di accesso
Dopo aver pubblicato un asset, gli utenti esterni al progetto potrebbero volervi accedere. Puoi fornire, rifiutare o revocare le richieste di accesso. Puoi anche eliminare gli asset per rendere disponibile l’origine dati sottostante solo per te.
Utilizza la procedura seguente per rispondere alle richieste di abbonamento.
Per approvare le richieste di abbonamento
-
Vai alla pagina SageMaker Risorse.
-
Scegli Gestisci gli asset dell’asset.
-
Seleziona Richieste di abbonamento in arrivo.
-
-
(Facoltativo) Scegli Approva e fornisci il motivo.
-
(Facoltativo) Scegli Rifiuta.
-
Puoi revocare l’accesso a un asset che hai precedentemente approvato. Se scegli di revocare l’accesso, gli utenti perderanno l’accesso sia all’asset che l’origine dati sottostante dell’asset. Utilizza la procedura seguente per revocare l’acceso.
Per revocare l’accesso
-
Vai alla pagina SageMaker Risorse.
-
Scegli Gestisci gli asset dell’asset.
-
Seleziona Richieste di abbonamento in arrivo.
-
Seleziona la scheda Approvato.
-
Scegli Revoca accanto all’asset.
Puoi anche annullare la pubblicazione degli asset, facendoli apparire solo come asset di proprietà. Gli asset non saranno visibili nel catalogo degli asset, ma le persone per cui hai approvato le richieste di abbonamento potranno comunque accedervi.
Per annullare la pubblicazione di un asset
-
Vai alla pagina SageMaker Risorse.
-
In Asset di proprietà, seleziona l’asset per il quale stai annullando la pubblicazione.
-
Selezionare Unpublish (Annulla pubblicazione).
Gli asset possono essere eliminati anche dalla pagina di annullamento della pubblicazione. L’eliminazione di un asset non elimina l’origine dati. L’eliminazione di un asset lo rende solo invisibile agli altri membri del progetto o dell’organizzazione.
Fase 4. Individua gli asset e richiedine l’accesso
Puoi richiedere l’accesso agli asset che altri utenti hanno pubblicato nel catalogo degli asset. Se approvano la richiesta di abbonamento, avrai accesso all’origine dati sottostante.
Nella parte superiore della pagina SageMaker Risorse, puoi specificare una query di ricerca per trovare le risorse pubblicate da altri utenti dell'organizzazione. Puoi anche selezionare un tipo di asset per visualizzare tutti gli asset pubblicati di quel tipo. Ad esempio, puoi selezionare Tabella Glue per visualizzare tutte le tabelle AWS Glue pubblicate.
Il tipo di asset è anche visualizzato direttamente sotto il nome dell’asset. Di seguito sono riportati i nomi disponibili per i tipi di asset:
-
Tabella Redshift
-
Tabella Glue
-
Modelli
-
Gruppo di funzionalità
Nota
I gruppi di funzionalità negli archivi seguenti hanno il tipo di tabella Glue:
-
Offline
-
Offline e online
Per effettuare una richiesta di abbonamento
-
Passate alla pagina SageMaker Risorse.
-
-
Nella barra di ricerca, specifica il nome dell’asset e scegli Cerca.
-
In Tipi, seleziona il tipo di asset e trova un asset a cui puoi accedere nel catalogo degli asset.
-
-
Scegli l’asset.
-
Scegli Abbonati.
-
Fornisci un motivo per la richiesta.
-
Seleziona Invia.
La tua richiesta di abbonamento viene visualizzata in Richieste di abbonamento in uscita nella sezione Gestisci le richieste di asset. Se il publisher dell’asset approva la richiesta, questa viene visualizzata in Asset sottoscritti. Ora puoi utilizzare la fonte di dati Amazon Redshift, AWS Glue table o ML nei tuoi flussi di lavoro di machine learning.
Fase 5. Utilizza un asset condiviso nei flussi di lavoro di machine learning
Se la tua richiesta di abbonamento a un asset viene approvata, puoi utilizzarlo nei flussi di lavoro di machine learning.
I gruppi di funzionalità a cui hai avuto accesso vengono visualizzati nell’elenco dei gruppi di funzionalità in Studio.
I gruppi di modelli a cui hai avuto accesso vengono visualizzati nell’elenco dei gruppi di modelli in Studio. Puoi aprire il gruppo di modelli nel registro dei modelli da SageMaker Assets. Utilizza la procedura seguente per aprire il gruppo di modelli all’interno del registro dei modelli. Asset sottoscritti.
Per aprire un gruppo di modelli da SageMaker Assets
-
Seleziona il gruppo di modelli.
-
Scegli Apri nel registro dei modelli.
Puoi accedere alle nostre AWS Glue tabelle Amazon Redshift in Data Wrangler all'interno di Canvas. SageMaker SageMaker Canvas è un'applicazione che consente di eseguire analisi esplorative dei dati (EDA) e addestrare modelli senza codice. Per ulteriori informazioni su SageMaker Canvas, consultaAmazon SageMaker Tela.
Puoi anche trasferire i dati dalle tue tabelle AWS Glue o da Amazon Redshift nei tuoi notebook Jupyter utilizzando l'estensione SQL. Puoi convertire i dati in DataFrame pandas per i tuoi flussi di lavoro di machine learning. Per ulteriori informazioni, consulta Preparazione dei dati con SQL in Studio.