Machine Learning - Amazon Redshift

Amazon Redshift wird UDFs ab dem 1. November 2025 die Erstellung von neuem Python nicht mehr unterstützen. Wenn Sie Python verwenden möchten UDFs, erstellen Sie das UDFs vor diesem Datum liegende. Bestehendes Python UDFs wird weiterhin wie gewohnt funktionieren. Weitere Informationen finden Sie im Blog-Posting.

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Machine Learning

Amazon Redshift Machine Learning (Amazon Redshift ML) ist ein robuster, cloudbasierter Service, der Analysten und Datenwissenschaftlern aller Kenntnisstufen die Arbeit mit Machine-Learning-Technologien erleichtert. Amazon Redshift ML verwendet ein Modell, um Ergebnisse zu generieren. Sie können Modelle auf folgende Weisen verwenden:

  • Sie können die Daten, die Sie zum Trainieren eines Modells verwenden möchten, sowie Metadaten, die mit Dateneingaben verknüpft sind, für Amazon Redshift bereitstellen. Anschließend erstellt Amazon Redshift ML Modelle in Amazon SageMaker AI, die Muster in den Eingabedaten erfassen. Durch die Verwendung eigener Daten für das Modell können Sie mithilfe von Amazon Redshift ML Trends in den Daten identifizieren, z. B. Abwanderungsprognosen, Customer Lifetime Value oder Umsatzprognosen. Sie können diese Modelle verwenden, um Prognosen für neue Eingabedaten zu generieren, ohne dass zusätzliche Kosten entstehen.

  • Sie können eines der von Amazon Bedrock bereitgestellten Basismodelle (FM) wie Claude oder Amazon Titan verwenden. Mit Amazon Bedrock können Sie die Leistungsfähigkeit großer Sprachmodelle (LLMs) in wenigen Schritten mit Ihren Analysedaten in Amazon Redshift kombinieren. Durch die Nutzung eines externen großen Sprachmodells (LLM) können Sie Amazon Redshift für die natürliche Sprachverarbeitung (NLP) Ihrer Daten verwenden. Sie können NLP für Anwendungen wie Textgenerierung, Stimmungsanalyse oder Übersetzung verwenden. Weitere Informationen zur Verwendung von Amazon Bedrock mit Amazon Redshift finden Sie unter Integration von Amazon Redshift ML mit Amazon Bedrock.

Anmerkung

Abmeldung von der Nutzung Ihrer Daten zur Serviceverbesserung

Wenn Sie Amazon Bedrock-Modelle verwenden, empfehlen wir Ihnen, die AWS Richtlinien darüber zu lesen, wie der Amazon Bedrock-Service mit Ihren Daten umgeht. Sie sollten feststellen, ob Sie eine Abmelderichtlinie verwenden müssen, um zu verhindern, dass der Service Ihre Daten für Modell- oder Serviceverbesserungen verwendet, falls Amazon Bedrock eine solche Funktionalität in der Zukunft implementiert. Um sicherzustellen, dass der Service Ihre Daten nicht für solche Zwecke verwendet, verwenden Sie die allgemeinen AWS Opt-Out-Richtlinien.

Weitere Informationen finden Sie hier:

Anmerkung

LLMs kann zu ungenauen oder unvollständigen Informationen führen. Wir empfehlen, die bereitgestellten Informationen zu überprüfen, LLMs um sicherzustellen, dass sie korrekt und vollständig sind.

So funktioniert Amazon Redshift ML mit Amazon AI SageMaker

Amazon Redshift arbeitet mit Amazon SageMaker AI Autopilot zusammen, um automatisch das beste Modell zu ermitteln und die Prognosefunktion in Amazon Redshift verfügbar zu machen.

Das folgende Diagramm veranschaulicht, wie Amazon Redshift ML funktioniert.

Workflow für die Integration von Amazon Redshift ML mit Amazon SageMaker AI Autopilot.

Im Allgemeinen sieht der Workflow wie folgt aus:

  1. Amazon Redshift exportiert die Trainingsdaten in Amazon S3.

  2. Amazon SageMaker AI Autopilot verarbeitet die Trainingsdaten vor. Die Vorverarbeitung umfasst wichtige Funktionen, wie zum Beispiel die Imputation fehlender Werte. Im Rahmen der Vorverarbeitung werden außerdem kategorische Spalten (zum Beispiel die Postleitzahl) erfasst und für das Training formatiert sowie weitere Funktionen durchgeführt. Die Auswahl der besten Präprozessoren für den Trainingsdatensatz ist an sich schon ein Problem, und Amazon SageMaker AI Autopilot automatisiert seine Lösung.

  3. Amazon SageMaker AI Autopilot findet den Algorithmus und die Algorithmus-Hyperparameter, die das Modell mit den genauesten Vorhersagen liefern.

  4. Amazon Redshift registriert die Prognosefunktion als SQL-Funktion in Ihrem Amazon-Redshift-Cluster.

  5. Wenn Sie CREATE MODEL-Anweisungen ausführen, verwendet Amazon Redshift Amazon SageMaker AI für Schulungen. Daher fallen Kosten für das Training Ihres Modells an. Dies ist ein separater Posten für Amazon SageMaker AI in Ihrer AWS Rechnung. Sie zahlen außerdem für den Speicher, der in Amazon S3 für die Speicherung Ihrer Trainingsdaten verwendet wird. Inferenzen mit Modellen, die mit CREATE MODEL erstellt wurden, die Sie kompilieren und auf Ihrem Redshift-Cluster ausführen können, werden nicht berechnet. Es fallen keine zusätzlichen Amazon-Redshift-Gebühren für die Verwendung von Amazon Redshift ML an.