Creazione di un’istanza del notebook Amazon SageMaker
Importante
Le policy IAM personalizzate che consentono ad Amazon SageMaker Studio o Amazon SageMaker Studio Classic di creare risorse Amazon SageMaker devono inoltre concedere le autorizzazioni per aggiungere tag a tali risorse. L’autorizzazione per aggiungere tag alle risorse è necessaria perché Studio e Studio Classic applicano automaticamente tag a tutte le risorse che creano. Se una policy IAM consente a Studio e Studio Classic di creare risorse ma non consente il tagging, possono verificarsi errori di tipo “AccessDenied” quando provi a creare le risorse. Per ulteriori informazioni, consulta Concessione delle autorizzazioni per il tagging delle risorse SageMaker AI.
Policy gestite da AWS per Amazon SageMaker AI, che forniscono autorizzazioni per creare risorse SageMaker, includono già le autorizzazioni per aggiungere tag durante la creazione di tali risorse.
Una istanza del notebook Amazon SageMaker è un’istanza di calcolo di ML che esegue l’applicazione del notebook Jupyter. SageMaker AI gestisce la creazione dell’istanza e delle risorse correlate. Utilizza i notebook Jupyter nell’istanza del notebook per:
-
preparare ed elaborare i dati
-
scrivere codice per addestrare i modelli
-
implementare modelli in Hosting SageMaker AI
-
testare o convalidare i modelli
Per creare un’istanza del notebook, utilizza la console SageMaker AI oppure l’API CreateNotebookInstance.
Il tipo di istanza del notebook scelta dipende da come utilizzi l'istanza del notebook. Controlla che l’istanza del notebook non sia vincolata da memoria, CPU o IO. Per caricare un set di dati in memoria sull’istanza del notebook per esplorarlo o pre-elaborarlo, ti consigliamo di scegliere un tipo di istanza con memoria RAM sufficiente per il set di dati. Ciò richiede un’istanza con almeno 16 GB di memoria (.xlarge o superiore). Se prevedi di utilizzare l’istanza del notebook per la preelaborazione intensiva di elaborazione, ti consigliamo di scegliere un'istanza ottimizzata per il calcolo, ad esempio c4 o c5.
Una best practice quando si utilizza un notebook SageMaker consiste nell’utilizzare l’istanza del notebook per orchestrare altri servizi AWS. Ad esempio, puoi utilizzare l’istanza del notebook per gestire l’elaborazione di set di dati di grandi dimensioni. A tale scopo, effettua chiamate a AWS Glue per i servizi ETL (estrazione, trasformazione e caricamento) o ad Amazon EMR per la mappatura e la riduzione dei dati con Hadoop. Puoi utilizzare i servizi AWS come forme temporanee di calcolo o archiviazione per i dati.
Puoi archiviare e recuperare i dati di addestramento e test utilizzando un bucket Amazon Simple Storage Service. Puoi quindi utilizzare SageMaker AI per addestrare e creare il tuo modello. Il risultato è che il tipo di istanza del notebook non influirà sulla velocità di addestramento e test del modello.
Dopo avere ricevuto la richiesta, SageMaker AI procede come descritto di seguito:
-
Crea un’interfaccia di rete: se scegli la configurazione VPC facoltativa, SageMaker AI crea un’interfaccia di rete nel tuo VPC. Utilizza I'ID della sottorete che fornisci nella richiesta per determinare in quale zona di disponibilità creare la sottorete. SageMaker AI associa il gruppo di sicurezza che fornisci nella richiesta con la sottorete. Per ulteriori informazioni, consulta Connessione di un'istanza del notebook in un VPC a risorse esterne.
-
Avvia un’istanza di calcolo di ML: SageMaker AI avvia un’istanza di calcolo di ML in un VPC SageMaker AI. SageMaker AI esegue le attività di configurazione che consentono di gestire l’istanza del notebook. Se hai specificato il VPC, SageMaker AI abilita il traffico tra il VPC e l’istanza del notebook.
-
Installa pacchetti e librerie Anaconda per le piattaforme di deep learning più diffuse: SageMaker AI installa tutti i pacchetti Anaconda che sono inclusi nel programma di installazione. Per ulteriori informazioni, consulta Anaconda package lists
. SageMaker AI installa anche le librerie di deep learning TensorFlow e Apache MXNet. -
Collega un volume di archiviazione di ML: SageMaker AI collega un volume di archiviazione di ML all’istanza di calcolo di ML. Puoi utilizzare il volume come un'area di lavoro per pulire il set di dati di addestramento o per archiviare temporaneamente dati di convalida, testo o altri dati. Scegli qualsiasi dimensione tra 5 e 16384 GB, in incrementi di 1 GB, per il volume. Il valore predefinito è 5 GB. I volumi di archiviazione di ML sono crittografati, quindi SageMaker AI non può determinare la quantità di spazio disponibile sul volume. Per questo motivo è possibile aumentare, ma non ridurre, le dimensioni del volume quando si aggiorna un'istanza del notebook. Per ridurre le dimensioni del volume di storage ML in uso, è necessario creare una nuova istanza del notebook con le dimensioni desiderate.
Solo i file e i dati salvati all'interno della cartella
/home/ec2-user/SageMakerpersistono tra sessioni di istanze del notebook. I file e i dati che vengono salvati all'esterno di questa directory vengono sovrascritti quando l'istanza del notebook viene arrestata e riavviata. Ogni directory/tmp dell'istanza del notebook offre un minimo di 10 GB di storage in un archivio dell'istanza. Un archivio dell'istanza è uno storage temporaneo a livello di blocco che non è persistente. Quando l’istanza viene arrestata o riavviata, SageMaker AI elimina il contenuto della directory. Questo storage temporaneo fa parte del volume root dell'istanza del notebook.Se il tipo di istanza utilizzato dall’istanza del notebook dispone del supporto NVMe, i clienti possono utilizzare i volumi dell’archivio dell’istanza NVMe disponibili per quel tipo di istanza. Per i tipi di istanze con volumi dell’archivio dell’istanza NVMe, tutti i volumi dell’archivio dell’istanza supportati vengono automaticamente collegati all’istanza all’avvio. Per ulteriori informazioni sui tipi di istanze e sui volumi di archiviazione NVMe associati, consulta i dettagli sui tipi di istanze Amazon Elastic Compute Cloud
. Per rendere disponibile il volume dell’archivio NVMe collegato all’istanza del notebook, completa le fasi in Make instance store volumes available on your instance. Completa le fasi con l’accesso root o utilizzando uno script di configurazione del ciclo di vita.
Nota
I volumi dell’archivio dell’istanza NVMe non forniscono un’archiviazione persistente. Questa archiviazione è di breve durata nell’istanza e deve essere riconfigurata ogni volta che viene avviata un’istanza con questa archiviazione.
Per creare un’istanza del notebook SageMaker AI:
-
Apri la console di SageMaker AI all’indirizzo https://console.aws.amazon.com/sagemaker/
. -
Scegli Istanze del notebook, quindi Crea un'istanza del notebook.
-
Nella pagina Crea un'istanza del notebook, fornisci le seguenti informazioni:
-
In Nome dell’istanza notebook, digita un nome per l'istanza del notebook.
-
Per il Tipo di istanza notebook, scegli una dimensione dell'istanza adatta al tuo caso d'uso. Per un elenco dei tipi e delle quote delle istanze supportati, consulta Amazon SageMaker AI Service Quotas.
-
Per Identificatore piattaforma, scegli un tipo di piattaforma su cui creare l'istanza del notebook. Questo tipo di piattaforma determina il sistema operativo e la versione di JupyterLab con cui verrà creata l'istanza del notebook. Dal 30 giugno 2025, solo JupyterLab 4 sarà supportato per le nuove istanze. Per informazioni sul tipo di identificatore piattaforma, consulta Istanze del notebook Amazon Linux 2. Per ulteriori informazioni sulle versioni di JupyterLab, consulta Controllo delle versioni di JupyterLab.
Importante
JupyterLab 1 e JupyterLab 3 non sono più supportati dal 30 giugno 2025. Non puoi più creare nuove istanze del notebook o riavviare istanze del notebook interrotte utilizzando queste versioni. Le istanze in servizio esistenti potrebbero continuare a funzionare, ma non riceveranno più aggiornamenti di sicurezza o correzioni di bug. Esegui la migrazione alle istanze del notebook JupyterLab 4 per garantire un supporto continuo. Per ulteriori informazioni, consulta Manutenzione della versione di JupyterLab.
-
(Facoltativo) L'opzione Configurazione aggiuntiva consente agli utenti avanzati di creare uno script shell che può essere eseguito durante la creazione o l'avvio dell'istanza. Questo script, chiamato script di configurazione del ciclo di vita, può essere utilizzato per impostare l'ambiente per il notebook o per eseguire altre funzioni. Per informazioni, consulta Personalizzazione di un’istanza del notebook SageMaker con uno script LCC.
-
(Facoltativo) Configurazione aggiuntiva consente inoltre di specificare la dimensione, in GB, del volume di storage ML collegato all'istanza del notebook. È possibile scegliere una dimensione compresa tra 5 GB e 16.384 GB, in incrementi di 1 GB. Puoi utilizzare il volume per pulire il set di dati di addestramento o per archiviare temporaneamente dati di convalida o di altro tipo.
-
(Facoltativo) Per Versione minima di IMDS, seleziona una versione dall'elenco a discesa. Se questo valore è impostato su v1, con l'istanza del notebook si possono utilizzare entrambe le versioni. Se è selezionata la versione v2, con l'istanza del notebook si può utilizzare solo IMDSv2. Per informazioni su IMDSv2, consulta Use IMDSv2.
Nota
A partire dal 31 ottobre 2022, la versione minima di IMDS predefinita per le istanze del notebook di SageMaker è passata da iMDSv1 a IMDSv2.
A partire dal 1° febbraio 2023, IMDSv1 non è più disponibile per la creazione di nuove istanze del notebook. Dopo questa data, potrai creare istanze del notebook con una versione minima di IMDS di 2.
-
In Ruolo IAM, scegli un ruolo IAM esistente nell’account che dispone delle autorizzazioni necessarie per accedere alle risorse SageMaker AI oppure scegli Crea un nuovo ruolo. Se scegli Crea un nuovo ruolo, SageMaker AI crea un ruolo IAM denominato
AmazonSageMaker-ExecutionRole-. La policy AWS gestitaYYYYMMDDTHHmmSSAmazonSageMakerFullAccessè collegata al ruolo. Il ruolo fornisce le autorizzazioni che consentono all’istanza del notebook di chiamare SageMaker AI e Amazon S3. -
In Accesso root, per abilitare l’accesso root per tutti gli utenti dell’istanza del notebook, scegli Abilita. Per disabilitare l’accesso root per gli utenti, scegli Disabilita. Se abiliti l’accesso root, tutti gli utenti dell’istanza del notebook avranno privilegi di amministratore e potranno accedere a tutti i file che contiene e modificarli.
-
(Facoltativo) L'opzione Chiave di crittografia consente di crittografare i dati sul volume di storage ML collegato all'istanza del notebook utilizzando una chiave AWS Key Management Service (AWS KMS). Se si prevede di archiviare informazioni sensibili nel volume di storage ML, valutare se crittografare le informazioni.
-
(Facoltativo) Rete consente di inserire l'istanza del notebook in cloud privato virtuale (VPC, Virtual Private Cloud). Un VPC fornisce sicurezza aggiuntiva e limita l’accesso alle risorse del VPC da origini esterne al VPC. Per ulteriori informazioni sul VPC, consulta la Guida per l’utente di Amazon VPC.
Per aggiungere l'istanza del notebook a un VPC:
-
Scegli VPC e ID sottorete.
-
Per (Gruppo di sicurezza, scegli il gruppo di sicurezza predefinito del VPC.
-
Se l'istanza del notebook deve disporre dell'accesso a Internet, abilita l'accesso diretto a Internet. Per Accesso diretto a Internet, scegli Abilita. L'accesso a Internet può ridurre la sicurezza dell'istanza del notebook. Per ulteriori informazioni, consulta Connessione di un'istanza del notebook in un VPC a risorse esterne.
-
-
(Facoltativo) Per associare i repository Git all'istanza del notebook, scegli un repository di default e fino a tre repository aggiuntivi. Per ulteriori informazioni, consulta Repository Git con istanze del notebook SageMaker AI.
-
Scegli Crea un'istanza del notebook.
In pochi minuti, Amazon SageMaker AI avvia un’istanza di calcolo di ML, in questo caso un’istanza del notebook, e vi collega un volume di archiviazione di ML. L'istanza del notebook include un server Notebook Jupyter preconfigurato e un set di librerie Anaconda. Per ulteriori informazioni, consulta l'API
CreateNotebookInstance.
-
-
Quando lo stato dell'istanza del notebook è
InService, nella console, l'istanza del notebook è pronta per l'uso. Scegli Apri Jupyter accanto al nome notebook per aprire il panello di controllo di Jupyter in formato classico.Nota
Per aumentare la sicurezza della tua istanza del notebook Amazon SageMaker, tutti i domini
regionali sono registrati nella Public Suffix List (PSL)notebook.region.sagemaker.awsdi Internet. Per una maggiore sicurezza, consigliamo di utilizzare i cookie con un prefisso __Host-per impostare cookie sensibili per i domini delle istanze del notebook SageMaker. Questa pratica ti aiuterà a difendere il tuo dominio dai tentativi CSRF (cross-site request forgery). Per ulteriori informazioni, consulta la pagina Set-Cookienel sito web con la documentazione per gli sviluppatori mozilla.org . Puoi scegliere Apri JupyterLab per aprire il pannello di controllo di JupyterLab. La dashboard fornisce l’accesso all’istanza del notebook.
Per ulteriori informazioni sui notebook Jupyter, consulta il notebook Jupyter
.