Come funziona il rilevamento oggetti - Amazon SageMaker AI

Come funziona il rilevamento oggetti

L'algoritmo di rilevamento oggetti identifica e individua tutte le istanze degli oggetti in un'immagine da una raccolta nota di categorie di oggetti. L'algoritmo accetta un'immagine come input e restituisce la categoria a cui appartiene l'oggetto, insieme a un punteggio di attendibilità che appartiene alla categoria. L'algoritmo prevede anche la posizione e la scala dell'oggetto con un riquadro di delimitazione rettangolare. Rilevamento degli oggetti di Amazon SageMaker AI utilizza l’algoritmo Single Shot Multibox Detector (SSD), che impiega come rete di base una rete neurale convoluzionale (CNN) preaddestrata per l’attività di classificazione. SSD utilizza l'output dei livelli intermedi come caratteristiche per il rilevamento.

Varie CNN come VGG e ResNet hanno ottenuto prestazioni elevate nell'attività di classificazione dell'immagine. Il rilevamento degli oggetti in Amazon SageMaker AI supporta VGG-16 e ResNet-50 come rete di base per SSD. L'algoritmo può essere addestrato in modalità completa o in modalità di trasferimento dell'apprendimento. Nella modalità di addestramento completo, la rete di base viene inizializzata con pesi casuali e preparata sui dati utente. In modalità di trasferimento dell'apprendimento, i pesi della rete di base sono caricati dai modelli già addestrati.

L'algoritmo di rilevamento degli oggetti utilizza operazioni di ottimizzazione dei dati standard, ad esempio capovolgimento, ridimensionamento e jitter in modo immediato internamente per evitare l'overfitting.