Connessione a un’applicazione EMR Serverless da Studio - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Connessione a un’applicazione EMR Serverless da Studio

I Data Scientist e gli ingegneri dei dati possono rilevare e quindi connettersi a un’applicazione EMR Serverless direttamente dall’interfaccia utente di Studio. Prima di iniziare, verifica di aver creato un’applicazione EMR Serverless con le istruzioni in Creazione di applicazioni EMR Serverless da Studio.

È possibile connettere un'applicazione EMR Serverless a un nuovo JupyterLab notebook direttamente dall'interfaccia utente di Studio o scegliere di avviare la connessione in un notebook di un'applicazione in esecuzione. JupyterLab

Importante

Quando si utilizza Studio, è possibile scoprire e connettersi alle applicazioni EMR Serverless solo per JupyterLab applicazioni avviate da spazi privati. Assicurati che le applicazioni EMR Serverless si trovino nella stessa AWS area del tuo ambiente Studio. Il tuo JupyterLab spazio deve utilizzare una versione dell'immagine SageMaker di distribuzione 1.10 o superiore.

Per connettere un'applicazione EMR Serverless a un nuovo JupyterLab notebook dall'interfaccia utente di Studio:
  1. Nell’interfaccia utente di Studio, vai al pannello di sinistra e seleziona il nodo Dati nel menu di navigazione a sinistra. Quindi, scorri e scegli l’opzione Applicazioni e cluster Amazon EMR. Si apre una pagina che mostra le applicazioni Amazon EMR a cui puoi accedere dall’ambiente Studio, nella scheda Applicazioni serverless.

    Nota

    Se tu o il tuo amministratore avete configurato le autorizzazioni per consentire l’accesso multi-account alle applicazioni EMR Serverless, viene visualizzato un elenco consolidato di applicazioni per tutti gli account a cui hai concesso l’accesso a Studio.

  2. Seleziona un’applicazione EMR Serverless da connettere a un nuovo notebook, quindi scegli Collega al notebook. Si apre una finestra modale che mostra l'elenco dei tuoi spazi. JupyterLab

    • Seleziona lo spazio privato da cui desideri avviare un' JupyterLabapplicazione, quindi scegli Apri notebook. Questo avvia un' JupyterLab applicazione dallo spazio prescelto e apre un nuovo taccuino.

    • In alternativa, puoi creare un nuovo spazio privato scegliendo il pulsante Crea nuovo spazio nella parte superiore della finestra modale. Inserisci un nome per lo spazio, quindi scegli Crea spazio e apri notebook. Questo crea uno spazio privato con il tipo di istanza predefinito e l'immagine di SageMaker distribuzione più recente disponibile, avvia un' JupyterLab applicazione e apre un nuovo notebook.

  3. Scegli il nome del ruolo di esecuzione di runtime IAM che la tua applicazione EMR Serverless può assumere per l’esecuzione del processo. Dopo averlo selezionato, un comando di connessione compila la prima cella del notebook e avvia la connessione con l’applicazione EMR Serverless.

    Importante

    Per connettere correttamente un JupyterLab notebook a un'applicazione EMR Serverless, è necessario innanzitutto associare l'elenco dei ruoli di runtime al dominio o al profilo utente, come indicato in. Configura le autorizzazioni per abilitare la pubblicazione e l'avvio di applicazioni Amazon EMR da Studio SageMaker Se non completi questa fase, non verrà stabilita la connessione.

    Una volta stabilita la connessione, viene visualizzato un messaggio di conferma e vengono avviate l’applicazione EMR Serverless e la sessione Spark.

    Nota

    Quando ti connetti a un’applicazione EMR Serverless, il suo stato passa da Stopped o Created a Started.

In alternativa, è possibile connettersi a un cluster da un notebook. JupyterLab
  1. Scegli il pulsante Cluster nella parte superiore a destra del notebook. Si apre una finestra modale che elenca le applicazioni EMR Serverless a cui puoi accedere. Puoi visualizzare le applicazioni nella scheda Applicazioni serverless.

  2. Seleziona l’applicazione a cui connetterti, quindi scegli Connetti.

  3. EMR Serverless supporta i ruoli IAM di runtime precaricati durante l’impostazione delle autorizzazioni richieste, come indicato in Configura le autorizzazioni per abilitare la pubblicazione e l'avvio di applicazioni Amazon EMR da Studio SageMaker. Se non completi questa fase, non verrà stabilita la connessione.

    Puoi selezionare il tuo ruolo dal menu a discesa Ruolo di esecuzione di Amazon EMR. Quando ti connetti a EMR Serverless, Studio aggiunge un blocco di codice a una cella attiva del notebook per stabilire la connessione.

  4. Una cella attiva viene popolata ed eseguita. Questa cella contiene il comando magic della connessione per collegare il notebook all’applicazione.

    Una volta completata la connessione, un messaggio conferma la connessione e l'avvio dell'applicazione Spark. È possibile iniziare a inviare i processi di elaborazione dati all’applicazione EMR Serverless.