So funktioniert die Objekterkennung - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

So funktioniert die Objekterkennung

Der Objekterkennungsalgorithmus identifiziert und sucht alle Instances von Objekten in einem Bild aus einer bekannten Sammlung von Objektkategorien. Der Algorithmus akzeptiert ein Bild als Eingabe und gibt die Kategorie, der das Objekt angehört, zusammen mit einem Zuverlässigkeitswert aus, der zeigt, dass es der Kategorie angehört. Der Algorithmus prognositiziert außerdem den Speicherort und die Größe des Objekts mit einem rechteckigen Begrenzungsrahmen. Die Objekterkennung von Amazon SageMaker AI verwendet den Single Shot Multibox Detection (SSD)-Algorithmus, der ein für die Klassifizierungsaufgabe vortrainiertes faltendes neuronales Netzwerk (CNN) als Basisnetzwerk verwendet. SSD verwendet die Ausgabe von intermediären Ebenen als Funktionen zur Erkennung.

Verschiedene CNNs wie z. B. VGG und ResNet haben eine hohe Leistung in der Bildklassifizierungsaufgabe erreicht. Die Objekterkennung in Amazon SageMaker AI unterstützt sowohl VGG-16 als auch ResNet-50 als Basisnetzwerk für SSD. Der Algorithmus kann im vollständigen Trainingsmodus oder im Transferlern-Modus trainiert werden. Im vollständigen Trainingsmodus wird das Basisnetzwerk mit zufälligen Gewichtungen initialisiert und anschließend mit Benutzerdaten trainiert. Im Transferlernmodus werden die Gewichtungen des Basisnetzwerks aus den vortrainierten Modellen geladen.

Der Objekterkennungsalgorithmus verwendet während des Betriebs intern Standard-Operationen zur Datenaugmentierung, wie z. B. Flip, Rescale und Jitter, um Overfitting-Probleme zu vermeiden.