Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Connect a un cluster Amazon EMR da SageMaker Studio o Studio Classic
I Data Scientist e gli ingegneri dei dati possono rilevare e quindi connettersi a un cluster Amazon EMR direttamente dall’interfaccia utente di Studio. Prima di iniziare, verifica di aver configurato le autorizzazioni necessarie come descritto nella sezione Fase 4. Configura le autorizzazioni per abilitare la pubblicazione e l’avvio di cluster Amazon EMR da Studio. Queste autorizzazioni garantiscono a Studio la possibilità di creare, avviare, visualizzare, accedere e terminare i cluster.
Puoi connettere un cluster Amazon EMR a un nuovo JupyterLab notebook direttamente dall'interfaccia utente di Studio o scegliere di avviare la connessione in un notebook di un'applicazione in esecuzione. JupyterLab
Importante
Puoi scoprire e connetterti ai cluster Amazon EMR solo per JupyterLab applicazioni Studio Classic lanciate da spazi privati. Assicurati che i cluster Amazon EMR si trovino nella stessa AWS regione del tuo ambiente Studio. Il tuo JupyterLab spazio deve utilizzare una versione dell'immagine SageMaker di distribuzione 1.10 o superiore.
Connessione a un cluster Amazon EMR con l’interfaccia utente di Studio
Per connetterti al cluster utilizzando l'interfaccia utente Studio o Studio Classic, puoi avviare una connessione dall'elenco dei cluster a cui si accede o da un notebook in SageMaker Studio o Studio Classic. Elenco dei cluster Amazon EMR da Studio o Studio Classic
Per connettere un cluster Amazon EMR a un nuovo JupyterLab notebook dall'interfaccia utente di Studio:
-
Nel pannello a sinistra dell’interfaccia utente di Studio, seleziona il nodo Dati nel menu di navigazione a sinistra. Vai ad Applicazioni e cluster Amazon EMR. Si apre una pagina che elenca i cluster Amazon EMR a cui puoi accedere da Studio nella scheda Cluster Amazon EMR.
Nota
Se tu o il tuo amministratore avete configurato le autorizzazioni per consentire l’accesso multi-account ai cluster Amazon EMR, viene visualizzato un elenco consolidato di cluster per tutti gli account a cui hai concesso l’accesso a Studio.
-
Seleziona un cluster Amazon EMR da connettere a un nuovo notebook, quindi scegli Collega al notebook. Si apre una finestra modale che mostra l'elenco dei tuoi JupyterLab spazi.
-
-
Seleziona lo spazio da cui desideri avviare un' JupyterLabapplicazione, quindi scegli Apri notebook. Questo avvia un' JupyterLab applicazione dallo spazio prescelto e apre un nuovo taccuino.
Nota
Gli utenti di Studio Classic devono selezionare un’immagine e un kernel. Per un elenco delle immagini supportate, consulta Immagini e kernel supportati per la connessione a un cluster Amazon EMR da Studio o Studio Classic o fai riferimento a Utilizza la tua immagine.
-
In alternativa, puoi creare un nuovo spazio privato scegliendo il pulsante Crea nuovo spazio nella parte superiore della finestra modale. Inserisci un nome per lo spazio, quindi scegli Crea spazio e apri notebook. Questo crea uno spazio privato con il tipo di istanza predefinito e l'immagine di SageMaker distribuzione più recente disponibile, avvia un' JupyterLabapplicazione e apre un nuovo notebook.
-
-
Se il cluster selezionato non utilizza Kerberos, LDAP o l’autenticazione con ruolo di runtime, Studio chiede di selezionare il tipo di credenziali. Scegli tra Autenticazione di base HTTP o Nessuna credenziale, quindi, se del caso, inserisci le tue credenziali.
Se il cluster selezionato supporta i ruoli di runtime, scegli il nome del ruolo IAM che il tuo cluster Amazon EMR può assumere per l’esecuzione del processo.
Importante
Per connettere correttamente un JupyterLab notebook a un cluster Amazon EMR che supporta i ruoli di runtime, devi prima associare l'elenco dei ruoli di runtime al tuo dominio o profilo utente, come indicato in. Configurazione dei ruoli di runtime IAM per l’accesso al cluster Amazon EMR in Studio Se non completi questa fase, non verrà stabilita la connessione.
Dopo averlo selezionato, un comando di connessione compila la prima cella del notebook e avvia la connessione con il cluster Amazon EMR.
Una volta completata la connessione, un messaggio conferma la connessione e l'avvio dell'applicazione Spark.
In alternativa, puoi connetterti a un cluster da un notebook Studio Classic JupyterLab o da un notebook Studio Classic.
-
Scegli il pulsante Cluster nella parte superiore del notebook. Si apre una finestra modale che elenca i cluster Amazon EMR in stato
Runninga cui puoi accedere. Puoi visualizzare i cluster Amazon EMRRunningnella scheda Cluster Amazon EMR.Nota
Per gli utenti di Studio Classic, Cluster è visibile solo quando si utilizza un kernel da Immagini e kernel supportati per la connessione a un cluster Amazon EMR da Studio o Studio Classic o da Utilizza la tua immagine. Se non riesci a visualizzare Cluster nella parte superiore del notebook, assicurati che l'amministratore abbia configurato la rilevabilità dei cluster e passa a un kernel supportato.
-
Seleziona il cluster a cui connetterti, quindi scegli Connessione.
-
Se hai configurato i cluster Amazon EMR per supportare i ruoli IAM di runtime, puoi selezionare il ruolo dal menu a discesa Ruolo di esecuzione di Amazon EMR.
Importante
Per connettere correttamente un JupyterLab notebook a un cluster Amazon EMR che supporta i ruoli di runtime, devi prima associare l'elenco dei ruoli di runtime al tuo dominio o profilo utente, come indicato in. Configurazione dei ruoli di runtime IAM per l’accesso al cluster Amazon EMR in Studio Se non completi questa fase, non verrà stabilita la connessione.
In alternativa, se il cluster selezionato non utilizza Kerberos, LDAP o l’autenticazione con ruolo di runtime, Studio o Studio Classic chiede di selezionare il tipo di credenziali. È possibile scegliere l'autenticazione di base HTTP o Nessuna credenziale.
-
Studio aggiunge e quindi esegue un blocco di codice su una cella attiva per stabilire la connessione. Questa cella contiene il comando magic di connessione per connettere il notebook all’applicazione in base al tipo di autenticazione.
Una volta completata la connessione, un messaggio conferma la connessione e l'avvio dell'applicazione Spark.
Connessione a un cluster Amazon EMR con un comando di connessione
Per stabilire una connessione a un cluster Amazon EMR, puoi eseguire comandi di connessione all’interno di una cella notebook.
Quando stabilisci la connessione, puoi eseguire l’autenticazione con Kerberos, Lightweight Directory Access Protocol (LDAP) o il ruolo IAM di runtime. Il metodo di autenticazione scelto dipende dalla configurazione del cluster.
Puoi fare riferimento a questo esempio Accesso ad Apache Livy utilizzando un Network Load Balancer su un cluster Amazon EMR abilitato per Kerberos
Se l'amministratore ha abilitato l'accesso tra account diversi, puoi connetterti al tuo cluster Amazon EMR da un notebook Studio Classic, indipendentemente dal fatto che l'applicazione Studio Classic e il cluster risiedano AWS nello stesso account o in account diversi.
Per ciascuno dei seguenti tipi di autenticazione, utilizza il comando specificato per connetterti manualmente al cluster dal tuo notebook Studio o Studio Classic.
-
Kerberos
Aggiungi l'argomento
--assumable-role-arnse hai bisogno di un accesso ad Amazon EMR multi-account. Aggiungi l'argomento--verify-certificatese ti connetti al cluster con HTTPS.%load_ext sagemaker_studio_analytics_extension.magics %sm_analytics emr connect --cluster-idcluster_id\ --auth-type Kerberos --language python [--assumable-role-arnEMR_access_role_ARN] [--verify-certificate/home/user/certificateKey.pem] -
LDAP
Aggiungi l'argomento
--assumable-role-arnse hai bisogno di un accesso ad Amazon EMR multi-account. Aggiungi l'argomento--verify-certificatese ti connetti al cluster con HTTPS.%load_ext sagemaker_studio_analytics_extension.magics %sm_analytics emr connect --cluster-idcluster_id\ --auth-type Basic_Access --language python [--assumable-role-arnEMR_access_role_ARN] [--verify-certificate/home/user/certificateKey.pem] -
NoAuth
Aggiungi l'argomento
--assumable-role-arnse hai bisogno di un accesso ad Amazon EMR multi-account. Aggiungi l'argomento--verify-certificatese ti connetti al cluster con HTTPS.%load_ext sagemaker_studio_analytics_extension.magics %sm_analytics emr connect --cluster-idcluster_id\ --auth-type None --language python [--assumable-role-arnEMR_access_role_ARN] [--verify-certificate/home/user/certificateKey.pem] -
Ruoli IAM di runtime
Aggiungi l'argomento
--assumable-role-arnse hai bisogno di un accesso ad Amazon EMR multi-account. Aggiungi l'argomento--verify-certificatese ti connetti al cluster con HTTPS.Per ulteriori informazioni sulla connessione a un cluster Amazon EMR utilizzando i ruoli IAM di runtime, consulta Configurazione dei ruoli di runtime IAM per l’accesso al cluster Amazon EMR in Studio .
%load_ext sagemaker_studio_analytics_extension.magics %sm_analytics emr connect --cluster-idcluster_id\ --auth-type Basic_Access \ --emr-execution-role-arn arn:aws:iam::studio_account_id:role/emr-execution-role-name[--assumable-role-arnEMR_access_role_ARN] [--verify-certificate/home/user/certificateKey.pem]
Connettiti a un cluster Amazon EMR tramite HTTPS
Se hai configurato il cluster Amazon EMR con la crittografia di transito abilitata e il server Apache Livy per HTTPS e vuoi che Studio o Studio Classic comunichi con Amazon EMR tramite HTTPS, devi configurare Studio o Studio Classic per accedere alla chiave del certificato.
Per i certificati autofirmati o firmati dall'autorità di certificazione (CA) locale, puoi farlo in due fasi:
-
scarica il file PEM del certificato nel file system locale utilizzando una delle seguenti opzioni:
-
Funzione di caricamento file integrata in Jupyter.
-
Una cella del notebook.
-
(Solo per utenti di Studio Classic) Uno script di configurazione del ciclo di vita (LCC).
Per informazioni su come utilizzare uno script LCC, consulta Personalizzare un'istanza di Notebook utilizzando uno script di configurazione del ciclo di vita
-
-
Abilita la convalida del certificato fornendo il percorso al certificato nell'argomento
--verify-certificatedel comando di connessione.%sm_analytics emr connect --cluster-idcluster_id\ --verify-certificate/home/user/certificateKey.pem...
Per i certificati pubblici emessi da CA, imposta la convalida del certificato configurando il parametro --verify-certificate su true.
In alternativa, è possibile disabilitare la convalida del certificato impostando il parametro --verify-certificate su false.
Puoi trovare l'elenco dei comandi di connessione disponibili a un cluster Amazon EMR in Connessione a un cluster Amazon EMR con un comando di connessione.