Crea un'istanza Amazon SageMaker Notebook - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Crea un'istanza Amazon SageMaker Notebook

Importante

Le politiche IAM personalizzate che consentono ad Amazon SageMaker Studio o Amazon SageMaker Studio Classic di creare SageMaker risorse Amazon devono inoltre concedere le autorizzazioni per aggiungere tag a tali risorse. L’autorizzazione per aggiungere tag alle risorse è necessaria perché Studio e Studio Classic applicano automaticamente tag a tutte le risorse che creano. Se una policy IAM consente a Studio e Studio Classic di creare risorse ma non consente l'etichettatura, possono verificarsi errori AccessDenied "" durante il tentativo di creare risorse. Per ulteriori informazioni, consulta Fornisci le autorizzazioni per etichettare SageMaker le risorse AI.

AWS politiche gestite per Amazon SageMaker AIche danno i permessi per creare SageMaker risorse includono già le autorizzazioni per aggiungere tag durante la creazione di tali risorse.

Un'istanza Amazon SageMaker Notebook è un'istanza di calcolo ML che esegue l'applicazione Jupyter Notebook. SageMaker L'intelligenza artificiale gestisce la creazione dell'istanza e delle relative risorse. Utilizza i notebook Jupyter nell’istanza del notebook per:

  • preparare ed elaborare i dati

  • scrivere codice per addestrare i modelli

  • distribuisci modelli all'hosting SageMaker AI

  • testare o convalidare i modelli

Per creare un'istanza notebook, utilizza la console SageMaker AI o il CreateNotebookInstanceAPI.

Il tipo di istanza del notebook scelta dipende da come utilizzi l'istanza del notebook. Controlla che l’istanza del notebook non sia vincolata da memoria, CPU o IO. Per caricare un set di dati in memoria sull’istanza del notebook per esplorarlo o pre-elaborarlo, ti consigliamo di scegliere un tipo di istanza con memoria RAM sufficiente per il set di dati. Ciò richiede un’istanza con almeno 16 GB di memoria (.xlarge o superiore). Se prevedi di utilizzare l’istanza del notebook per la preelaborazione intensiva di elaborazione, ti consigliamo di scegliere un'istanza ottimizzata per il calcolo, ad esempio c4 o c5.

Una procedura ottimale per l'utilizzo di un SageMaker notebook consiste nell'utilizzare l'istanza del notebook per orchestrare altri AWS servizi. Ad esempio, puoi utilizzare l’istanza del notebook per gestire l’elaborazione di set di dati di grandi dimensioni. A tale scopo, effettua chiamate ai servizi AWS Glue for ETL (extract, transform, and load) o Amazon EMR per la mappatura e la riduzione dei dati tramite Hadoop. Puoi utilizzare AWS i servizi come forme temporanee di calcolo o archiviazione per i tuoi dati.

Puoi archiviare e recuperare i dati di addestramento e test utilizzando un bucket Amazon Simple Storage Service. Puoi quindi utilizzare l' SageMaker intelligenza artificiale per addestrare e costruire il tuo modello. Il risultato è che il tipo di istanza del notebook non influirà sulla velocità di addestramento e test del modello.

Dopo aver ricevuto la richiesta, SageMaker AI esegue le seguenti operazioni:

  • Crea un'interfaccia di rete: se scegli la configurazione VPC opzionale SageMaker , AI crea l'interfaccia di rete nel tuo VPC. Utilizza l'ID di sottorete fornito nella richiesta per determinare in quale zona di disponibilità creare la sottorete. SageMaker L'IA associa il gruppo di sicurezza fornito nella richiesta alla sottorete. Per ulteriori informazioni, consulta Connessione di un'istanza del notebook in un VPC a risorse esterne.

  • Avvia un'istanza di calcolo ML: SageMaker AI avvia un'istanza di calcolo ML in un VPC AI. SageMaker SageMaker L'intelligenza artificiale esegue le attività di configurazione che le consentono di gestire l'istanza del notebook. Se hai specificato il tuo VPC, l' SageMaker IA abilita il traffico tra il tuo VPC e l'istanza del notebook.

  • Installa pacchetti e librerie Anaconda per piattaforme di deep learning comuni: SageMaker AI installa tutti i pacchetti Anaconda inclusi nel programma di installazione. Per ulteriori informazioni, consulta l'elenco dei pacchetti di Anaconda. SageMaker L'IA installa anche le librerie di deep learning TensorFlow e Apache MXNet .

  • Allega un volume di archiviazione ML: l'SageMaker IA collega un volume di archiviazione ML all'istanza di calcolo ML. Puoi utilizzare il volume come un'area di lavoro per pulire il set di dati di addestramento o per archiviare temporaneamente dati di convalida, testo o altri dati. Scegli qualsiasi dimensione tra 5 e 16384 GB, in incrementi di 1 GB, per il volume. Il valore predefinito è 5 GB. I volumi di archiviazione ML sono crittografati, quindi l' SageMaker IA non è in grado di determinare la quantità di spazio libero disponibile sul volume. Per questo motivo è possibile aumentare, ma non ridurre, le dimensioni del volume quando si aggiorna un'istanza del notebook. Per ridurre le dimensioni del volume di storage ML in uso, è necessario creare una nuova istanza del notebook con le dimensioni desiderate.

    Solo i file e i dati salvati all'interno della cartella /home/ec2-user/SageMaker persistono tra sessioni di istanze del notebook. I file e i dati che vengono salvati all'esterno di questa directory vengono sovrascritti quando l'istanza del notebook viene arrestata e riavviata. La /tmp directory di ogni istanza di notebook fornisce un minimo di 10 GB di spazio di archiviazione in un instance store. Un archivio dell'istanza è uno storage temporaneo a livello di blocco che non è persistente. Quando l'istanza viene arrestata o riavviata, SageMaker AI elimina il contenuto della directory e tutte le personalizzazioni del sistema operativo. Questo storage temporaneo fa parte del volume root dell'istanza del notebook.

    Se l'istanza del notebook non è aggiornata e utilizza software non sicuro, l' SageMaker IA potrebbe aggiornare periodicamente l'istanza come parte della manutenzione regolare. Durante questi aggiornamenti, i dati al di fuori della cartella non /home/ec2-user/SageMaker vengono mantenuti. Per ulteriori informazioni sulle patch di manutenzione e sicurezza, vedere. Maintenance (Manutenzione)

    Se il tipo di istanza utilizzato dall'istanza notebook è NVMe supportato, i clienti possono utilizzare i volumi di NVMe Instance Store disponibili per quel tipo di istanza. Per le istanze con volumi di NVMe store, tutti i volumi di instance store vengono automaticamente collegati all'istanza al momento del lancio. Per ulteriori informazioni sui tipi di istanze e sui volumi di NVMe archiviazione associati, consulta i dettagli sul tipo di istanza Amazon Elastic Compute Cloud.

    Per rendere disponibile il volume di NVMe archiviazione collegato per l'istanza notebook, completa i passaggi in Rendere disponibili i volumi di store delle istanze sull'istanza. Completa le fasi con l’accesso root o utilizzando uno script di configurazione del ciclo di vita.

    Nota

    NVMe i volumi dell'instance store non sono storage persistente. Questa archiviazione è di breve durata nell’istanza e deve essere riconfigurata ogni volta che viene avviata un’istanza con questa archiviazione.

Per creare un'istanza di notebook SageMaker AI:
  1. Apri la console SageMaker AI all'indirizzo https://console.aws.amazon.com/sagemaker/.

  2. Scegli Istanze del notebook, quindi Crea un'istanza del notebook.

  3. Nella pagina Crea un'istanza del notebook, fornisci le seguenti informazioni:

    1. In Nome dell’istanza notebook, digita un nome per l'istanza del notebook.

    2. Per il Tipo di istanza notebook, scegli una dimensione dell'istanza adatta al tuo caso d'uso. Per un elenco dei tipi di istanze e delle quote supportati, consulta Amazon SageMaker AI Service Quotas.

    3. Per Identificatore piattaforma, scegli un tipo di piattaforma su cui creare l'istanza del notebook. Questo tipo di piattaforma determina il sistema operativo e la JupyterLab versione con cui viene creata l'istanza del notebook. La versione più recente e consigliata ènotebook-al2023-v1, per un'istanza di notebook Amazon Linux 2023. Al 30 giugno 2025, solo JupyterLab 4 sono supportate per le nuove istanze. Per informazioni sui tipi di identificatori di piattaforma, consulta e. AL2023 istanze di notebook Istanze del notebook Amazon Linux 2 Per informazioni sulle JupyterLab versioni, vedereJupyterLab controllo delle versioni.

      Importante

      JupyterLab Le versioni 1 e JupyterLab 3 non sono più supportate a partire dal 30 giugno 2025. Non puoi più creare nuove istanze del notebook o riavviare istanze del notebook interrotte utilizzando queste versioni. Le istanze in servizio esistenti potrebbero continuare a funzionare, ma non riceveranno più aggiornamenti di sicurezza o correzioni di bug. Esegui la migrazione a JupyterLab 4 istanze di notebook per un supporto continuo. Per ulteriori informazioni, consulta JupyterLab manutenzione della versione.

    4. (Facoltativo) L'opzione Configurazione aggiuntiva consente agli utenti avanzati di creare uno script shell che può essere eseguito durante la creazione o l'avvio dell'istanza. Questo script, chiamato script di configurazione del ciclo di vita, può essere utilizzato per impostare l'ambiente per il notebook o per eseguire altre funzioni. Per informazioni, consulta Personalizzazione di un'istanza di SageMaker notebook utilizzando uno script LCC.

    5. (Facoltativo) Configurazione aggiuntiva consente inoltre di specificare la dimensione, in GB, del volume di storage ML collegato all'istanza del notebook. È possibile scegliere una dimensione compresa tra 5 GB e 16.384 GB, in incrementi di 1 GB. Puoi utilizzare il volume per pulire il set di dati di addestramento o per archiviare temporaneamente dati di convalida o di altro tipo.

    6. (Facoltativo) Per Versione minima di IMDS, seleziona una versione dall'elenco a discesa. Se questo valore è impostato su v1, con l'istanza del notebook si possono utilizzare entrambe le versioni. Se è selezionata la versione v2, IMDSv2 può essere utilizzata solo con l'istanza del notebook. Per informazioni su IMDSv2, consulta IMDSv2Use.

      Nota

      A partire dal 31 ottobre 2022, la versione IMDS minima predefinita per le istanze dei SageMaker notebook cambia da a IMDSv1 . IMDSv2

      A partire dal 1° febbraio 2023, IMDSv1 non sarà più disponibile per la creazione di nuove istanze di notebook. Dopo questa data, potrai creare istanze del notebook con una versione minima di IMDS di 2.

    7. Per il ruolo IAM, scegli un ruolo IAM esistente nel tuo account con le autorizzazioni necessarie per accedere alle risorse SageMaker AI o crea un nuovo ruolo. Se scegli Crea un nuovo ruolo, l' SageMaker IA crea un ruolo IAM denominatoAmazonSageMaker-ExecutionRole-YYYYMMDDTHHmmSS. La policy AWS gestita AmazonSageMakerFullAccess è allegata al ruolo. Il ruolo fornisce autorizzazioni che consentono all'istanza del notebook di chiamare SageMaker AI e Amazon S3.

    8. In Accesso root, per abilitare l’accesso root per tutti gli utenti dell’istanza del notebook, scegli Abilita. Per disabilitare l’accesso root per gli utenti, scegli Disabilita. Se abiliti l’accesso root, tutti gli utenti dell’istanza del notebook avranno privilegi di amministratore e potranno accedere a tutti i file che contiene e modificarli.

    9. (Facoltativo) L'opzione Chiave di crittografia consente di crittografare i dati sul volume di storage ML collegato all'istanza del notebook utilizzando una chiave AWS Key Management Service (AWS KMS). Se si prevede di archiviare informazioni sensibili nel volume di storage ML, valutare se crittografare le informazioni.

    10. (Facoltativo) Rete consente di inserire l'istanza del notebook in cloud privato virtuale (VPC, Virtual Private Cloud). Un VPC fornisce sicurezza aggiuntiva e limita l’accesso alle risorse del VPC da origini esterne al VPC. Per ulteriori informazioni VPCs, consulta la Amazon VPC User Guide.

      Per aggiungere l'istanza del notebook a un VPC:

      1. Scegli il VPC e un. SubnetId

      2. Per (Gruppo di sicurezza, scegli il gruppo di sicurezza predefinito del VPC.

      3. Se l'istanza del notebook deve disporre dell'accesso a Internet, abilita l'accesso diretto a Internet. Per Accesso diretto a Internet, scegli Abilita. L'accesso a Internet può ridurre la sicurezza dell'istanza del notebook. Per ulteriori informazioni, consulta Connessione di un'istanza del notebook in un VPC a risorse esterne.

    11. (Facoltativo) Per associare i repository Git all'istanza del notebook, scegli un repository di default e fino a tre repository aggiuntivi. Per ulteriori informazioni, consulta Archivi Git con istanze SageMaker AI Notebook.

    12. Scegli Crea un'istanza del notebook.

      In pochi minuti, Amazon SageMaker AI lancia un'istanza di calcolo ML, in questo caso un'istanza notebook, e vi allega un volume di storage ML. L'istanza del notebook include un server Notebook Jupyter preconfigurato e un set di librerie Anaconda. Per ulteriori informazioni, consulta l'API CreateNotebookInstance.

  4. Quando lo stato dell'istanza del notebook è InService, nella console, l'istanza del notebook è pronta per l'uso. Scegli Apri Jupyter accanto al nome notebook per aprire il panello di controllo di Jupyter in formato classico.

    Nota

    Per aumentare la sicurezza della tua istanza di SageMaker notebook Amazon, tutti i notebook.region.sagemaker.aws domini regionali sono registrati nella Public Suffix List (PSL) di Internet. Per una maggiore sicurezza, ti consigliamo di utilizzare i cookie con un __Host- prefisso per impostare i cookie sensibili per i domini delle istanze del tuo notebook. SageMaker Questa pratica ti aiuterà a difendere il tuo dominio dai tentativi CSRF (cross-site request forgery). Per ulteriori informazioni, consulta la pagina Set-Cookie nel sito web con la documentazione per gli sviluppatori mozilla.org.

    Puoi scegliere Apri JupyterLab per aprire la dashboard. JupyterLab La dashboard fornisce l’accesso all’istanza del notebook.

    Per ulteriori informazioni sui notebook Jupyter, consulta il notebook Jupyter .