So funktioniert die Objekterkennung

Der Objekterkennungsalgorithmus identifiziert und sucht alle Instances von Objekten in einem Bild aus einer bekannten Sammlung von Objektkategorien. Der Algorithmus akzeptiert ein Bild als Eingabe und gibt die Kategorie, der das Objekt angehört, zusammen mit einem Zuverlässigkeitswert aus, der zeigt, dass es der Kategorie angehört. Der Algorithmus prognositiziert außerdem den Speicherort und die Größe des Objekts mit einem rechteckigen Begrenzungsrahmen. Die Objekterkennung von Amazon SageMaker AI verwendet den Single Shot Multibox Detection (SSD)-Algorithmus, der ein für die Klassifizierungsaufgabe vortrainiertes faltendes neuronales Netzwerk (CNN) als Basisnetzwerk verwendet. SSD verwendet die Ausgabe von intermediären Ebenen als Funktionen zur Erkennung.

Verschiedene CNNs wie z. B. VGG und ResNet haben eine hohe Leistung in der Bildklassifizierungsaufgabe erreicht. Die Objekterkennung in Amazon SageMaker AI unterstützt sowohl VGG-16 als auch ResNet-50 als Basisnetzwerk für SSD. Der Algorithmus kann im vollständigen Trainingsmodus oder im Transferlern-Modus trainiert werden. Im vollständigen Trainingsmodus wird das Basisnetzwerk mit zufälligen Gewichtungen initialisiert und anschließend mit Benutzerdaten trainiert. Im Transferlernmodus werden die Gewichtungen des Basisnetzwerks aus den vortrainierten Modellen geladen.

Der Objekterkennungsalgorithmus verwendet während des Betriebs intern Standard-Operationen zur Datenaugmentierung, wie z. B. Flip, Rescale und Jitter, um Overfitting-Probleme zu vermeiden.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Objekterkennung – MXNet

Hyperparameter