Automatisieren der Dateneinrichtung für Kennzeichnungsaufträge - Amazon SageMaker AI

Automatisieren der Dateneinrichtung für Kennzeichnungsaufträge

Sie können die automatisierte Dateneinrichtung verwenden, um Manifestdateien für Ihre Kennzeichnungsaufträge in der Ground-Truth-Konsole mithilfe von Bildern, Videos, Video-Frames, Textdateien (.txt) und Dateien mit durch Kommas getrennten Werten (.csv) zu erstellen, die in Amazon S3 gespeichert sind. Wenn Sie die automatisierte Dateneinrichtung verwenden, geben Sie einen Amazon-S3-Speicherort an, an dem Ihre Eingabedaten gespeichert werden, und den Eingabedatentyp. Ground Truth sucht dann an dem von Ihnen angegebenen Speicherort nach den Dateien, die diesem Typ entsprechen.

Anmerkung

Ground Truth verwendet keinen AWS KMS-Schlüssel, um auf Ihre Eingabedaten zuzugreifen oder die Eingabemanifestdatei in den von Ihnen angegebenen Amazon-S3-Speicherort zu schreiben. Der Benutzer oder die Rolle, die den Kennzeichnungsauftrag erstellt, muss über Zugriffsberechtigungen für Ihre Eingabedatenobjekte in Amazon S3 verfügen.

Stellen Sie vor dem folgenden Verfahren sicher, dass die Eingabebilder oder -dateien korrekt formatiert sind:

  • Bilddateien – Bilddateien müssen die Größen- und Auflösungsgrenzen erfüllen, die in den Tabellen unter Größenkontingent für Eingabedateien aufgeführt sind.

  • Textdateien – Textdaten können in einer oder mehreren TXT-Dateien gespeichert werden. Jedes Element, das gekennzeichnet werden soll, muss durch einen Standardzeilenumbruch getrennt werden.

  • CSV-Dateien – Textdaten können in einer oder mehreren CSV-Dateien gespeichert werden. Jedes Element, das gekennzeichnet werden soll, muss sich in einer separaten Zeile befinden.

  • Videos – Videodateien können eines der folgenden Formate haben: .mp4, .ogg und .webm. Informationen zum Extrahieren von Video-Frames aus Ihren Videodateien zur Objekterkennung oder Objektverfolgung finden Sie unter Videodateien zur Verfügung stellen.

  • Video-Frames – Video-Frames sind Bilder, die aus Videos extrahiert wurden. Alle aus einem einzelnen Video extrahierten Bilder werden als Sequenz von Video-Frames bezeichnet. Jede Sequenz von Video-Frames muss in Amazon S3 eindeutige Präfixschlüssel haben. Siehe Stellen Sie Videoframes bereit. Informationen zu diesem Datentyp finden Sie unter Einrichten automatisierter Video-Frame-Eingabedaten.

Wichtig

Informationen zur Erkennung von Video-Frame-Objekten und für Kennzeichnungsaufträge zur Video-Frame-Objekterkennung finden Sie unter Einrichten automatisierter Video-Frame-Eingabedaten. Hier erfahren Sie, wie Sie die automatisierte Dateneinrichtung verwenden.

Verwenden Sie diese Anweisungen, um Ihre Eingabedatensatz-Verbindung mit Ground Truth automatisch einzurichten.

Automatisches Verbinden Ihrer Daten in Amazon S3 mit Ground Truth
  1. Navigieren Sie in der Konsole von Amazon SageMaker AI unter https://console.aws.amazon.com/sagemaker/ zur Seite Kennzeichnungsauftrag erstellen.

    Dieser Link bringt Sie in die AWS-Region Nord-Virginia (us-east-1). Wenn sich Ihre Eingabedaten in einem Amazon-S3-Bucket in einer anderen Region befinden, wechseln Sie in diese Region. Um Ihre AWS-Region zu ändern, wählen Sie in der Navigationsleiste den Namen der aktuell angezeigten Region.

  2. Wählen Sie Beschriftungsauftrag erstellen aus.

  3. Geben Sie einen Auftragsnamen ein.

  4. Wählen Sie im Abschnitt Einrichtung der Eingabedaten die Option Automatisierte Dateneinrichtung aus.

  5. Geben Sie eine Amazon-S3-URI für S3-Standort für Eingabedatensätze ein.

  6. Geben Sie Ihren S3-Standort für Ausgabedatensätze an. Dies ist der Ort, an dem Ihre Ausgabedaten gespeichert werden.

  7. Wählen Sie Ihren Datentyp mithilfe der Dropdown-Liste aus.

  8. Verwenden Sie das Dropdown-Menü unter IAM-Rolle, um eine Ausführungsrolle auszuwählen. Wenn Sie Eine neue Rolle erstellen auswählen, geben Sie die Amazon-S3-Buckets an, auf die Sie dieser Rolle Zugriff gewähren möchten. Diese Rolle muss über die Zugriffsberechtigung für die S3-Buckets verfügen, die Sie in den Schritten 5 und 6 angegeben haben.

  9. Wählen Sie Dateneinrichtung fertigstellen aus.

Dadurch wird ein Eingabemanifest am Amazon-S3-Speicherort für Eingabedatensätze erstellt, die Sie in Schritt 5 angegeben haben. Wenn Sie einen Kennzeichnungsauftrag mit der SageMaker-API, AWS CLI oder einem AWS SDK erstellen, verwenden Sie den Amazon-S3-URI für diese Eingabemanifestdatei als Eingabe für den Parameter ManifestS3Uri.

Das folgende GIF zeigt, wie Sie die automatisierte Dateneinrichtung für Bilddaten verwenden können. In diesem Beispiel wird eine Datei dataset-YYMMDDTHHMMSS.manifest im Amazon-S3-Bucket example-groundtruth-images erstellt, wobei YYMMDDTHHmmSS das Jahr (YY), den Monat (MM), den Tag (DD) und die Uhrzeit in Stunden (HH), Minuten (mm) und Sekunden (ss) angibt, zu der die Eingabemanifestdatei erstellt wurde.

GIF, das zeigt, wie Sie die automatisierte Dateneinrichtung für Bilddaten verwenden können