Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Selezionare dati per l’etichettatura
È possibile utilizzare la console di Amazon SageMaker AI per selezionare una porzione del set di dati per l’etichettatura. I dati devono essere archiviati in un bucket S3 Amazon. Sono disponibili tre opzioni:
-
Utilizzare il set di dati completo.
-
Scegliere un campione del set di dati selezionato casualmente.
-
Specificare un sottoinsieme del set di dati utilizzando una query.
Le seguenti opzioni sono disponibili nella sezione Processi di etichettatura della console di SageMaker AI
Utilizzo del set di dati completo
Quando scegli di utilizzare il set di dati completo devi fornire un file manifest per gli oggetti dati. Puoi fornire il percorso del bucket Amazon S3 che contiene il file di manifesto oppure utilizzare la console di SageMaker AI per creare il file. Per informazioni su come creare un file manifest utilizzando la console, consulta Automatizzare la configurazione dei dati per i processi di etichettatura.
Scelta di un campione casuale
Quando vuoi etichettare un sottoinsieme casuale di dati, seleziona Campione casuale. Il set di dati viene archiviato nel bucket S3 Amazon specificato nel campo Posizione del set di dati di input.
Dopo aver specificato la percentuale di oggetti dati che desideri includere nel campione, scegli Crea sottoinsieme. SageMaker AI seleziona casualmente gli oggetti di dati per il processo di etichettatura. Dopo aver selezionato gli oggetti, scegli Usa questo sottoinsieme.
SageMaker AI crea un file di manifesto per gli oggetti di dati selezionati. Inoltre modifica il valore nel campo Posizione del set di dati di input in modo da puntare al nuovo file manifest.
Specificare un sottoinsieme
Amazon S3 Select
Amazon S3 Select non è più disponibile per i nuovi clienti. I clienti esistenti di Amazon S3 Select possono continuare a utilizzare la funzionalità come di consueto. Per ulteriori informazioni, consulta How to optimize querying your data in Amazon S3
Puoi specificare un sottoinsieme degli oggetti dati utilizzando una query SELECT di S3 Amazon sui nomi di file di oggetti.
L'istruzione SELECT della query SQL è definita per l'utente. La clausola WHERE serve a specificare quali oggetti dati devono essere restituiti.
Per ulteriori informazioni sull'istruzione SELECT di S3 Amazon, consulta Selecting content from Objects.
Scegli Crea sottoinsieme per avviare la selezione, quindi seleziona Usa questo sottoinsieme per utilizzare i dati selezionati.
SageMaker AI crea un file di manifesto per gli oggetti di dati selezionati. Aggiorna inoltre il campo Posizione del set di dati di input per puntare al nuovo file manifest.