

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Datenaufbereitung mit Amazon EMR
<a name="studio-notebooks-emr-cluster"></a>

**Wichtig**  
Amazon SageMaker Studio und Amazon SageMaker Studio Classic sind zwei der Machine-Learning-Umgebungen, mit denen Sie mit SageMaker KI interagieren können.  
Wenn Ihre Domain nach dem 30. November 2023 erstellt wurde, ist Studio Ihre Standardkonfiguration.  
Wenn Ihre Domain vor dem 30. November 2023 erstellt wurde, ist Amazon SageMaker Studio Classic Ihr Standarderlebnis. Informationen zur Verwendung von Studio, wenn Amazon SageMaker Studio Classic Ihr Standarderlebnis ist, finden Sie unter[Migration von Amazon SageMaker Studio Classic](studio-updated-migrate.md).  
Wenn Sie von Amazon SageMaker Studio Classic zu Amazon SageMaker Studio migrieren, geht die Verfügbarkeit von Funktionen nicht verloren. Studio Classic ist auch als Anwendung in Amazon SageMaker Studio verfügbar, um Sie bei der Ausführung Ihrer älteren Machine-Learning-Workflows zu unterstützen.

Amazon SageMaker Studio und Studio Classic verfügen über eine integrierte Integration mit [Amazon EMR.](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-what-is-emr.html) [In JupyterLab und Studio Classic-Notebooks können Datenwissenschaftler und Dateningenieure bestehende Amazon EMR-Cluster erkennen und eine Verbindung zu ihnen herstellen und anschließend mithilfe von [Apache Spark, Apache](https://aws.amazon.com/emr/features/spark)[Hive](https://aws.amazon.com/emr/features/hive) oder Presto umfangreiche Daten interaktiv untersuchen, visualisieren und für maschinelles Lernen vorbereiten.](https://aws.amazon.com/emr/features/presto) Mit einem einzigen Klick können sie auf die Spark-Benutzeroberfläche zugreifen, um den Status und die Metriken ihrer Spark-Jobs zu überwachen, ohne ihr Notebook verlassen zu müssen.

Administratoren können [CloudFormation Vorlagen](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/Welcome.html) erstellen, die Amazon EMR-Cluster definieren. Sie können diese Cluster-Vorlagen dann [AWS Service Catalog](https://docs.aws.amazon.com/servicecatalog/latest/userguide/end-user-console.html)für Studio- und Studio Classic-Benutzer zum Start verfügbar machen. Datenwissenschaftler können dann eine vordefinierte Vorlage auswählen, um direkt aus ihrer Studio-Umgebung heraus selbst einen Amazon-EMR-Cluster bereitzustellen. Administratoren können die Vorlagen weiter parametrisieren, sodass der Benutzer anhand vordefinierter Werte Aspekte des Clusters auswählen kann. Beispielsweise möchten Benutzer möglicherweise die Anzahl der Kernknoten festlegen oder den Instance-Typ eines Knotens aus einem Dropdown-Menü auswählen.

Mithilfe dieser CloudFormation Funktion können Administratoren die Organisations-, Sicherheits- und Netzwerkkonfiguration von Amazon EMR-Clustern steuern. Datenwissenschaftler und Dateningenieure können diese Vorlagen dann an ihre Workloads anpassen, um Amazon EMR-Cluster bei Bedarf direkt aus Studio und Studio Classic zu erstellen, ohne komplexe Konfigurationen einrichten zu müssen. Benutzer können Amazon-EMR-Cluster nach Gebrauch beenden.
+ **Wenn Sie Administrator sind**:

  Stellen Sie sicher, dass Sie die Kommunikation zwischen Studio oder Studio Classic und Amazon EMR-Clustern aktiviert haben. Anweisungen dazu finden Sie im Abschnitt [Konfigurieren Sie den Netzwerkzugriff für Ihren Amazon-EMR-Cluster](studio-notebooks-emr-networking.md). Sobald diese Kommunikation aktiviert ist, können Sie:
  + [Amazon CloudFormation EMR-Vorlagen im Service Catalog konfigurieren](studio-notebooks-set-up-emr-templates.md)
  + [Amazon-EMR-Cluster konfigurieren](studio-notebooks-configure-discoverability-emr-cluster.md)
+ **Wenn Sie ein Datenwissenschaftler oder Dateningenieur sind**, können Sie:
  + [Starten eines Amazon-EMR-Clusters von Studio oder Studio Classic aus](studio-notebooks-launch-emr-cluster-from-template.md)
  + [Amazon EMR-Cluster aus Studio oder Studio Classic auflisten](discover-emr-clusters.md)
  + [Stellen Sie von SageMaker Studio oder Studio Classic aus eine Connect zu einem Amazon EMR-Cluster her](connect-emr-clusters.md)
  + [Beenden eines Amazon-EMR-Clusters von Studio oder Studio Classic aus](terminate-emr-clusters.md)
  + [Zugriff auf die Spark-Benutzeroberfläche über Studio oder Studio Classic](studio-notebooks-access-spark-ui.md)

**Topics**
+ [Schnellstart: Erstellen Sie eine SageMaker KI-Sandbox-Domain, um Amazon EMR-Cluster in Studio zu starten](studio-notebooks-emr-cluster-quickstart.md)
+ [Admin-Leitfaden](studio-emr-admin-guide.md)
+ [Benutzerhandbuch](studio-emr-user-guide.md)
+ [Blogs und Whitepaper](studio-notebooks-emr-resources.md)
+ [Fehlerbehebung](studio-notebooks-emr-troubleshooting.md)