Requisiti dei set di dati per la previsione in batch - Amazon SageMaker AI

Requisiti dei set di dati per la previsione in batch

Per generare previsioni in batch, assicurati che i set di dati soddisfino i requisiti descritti in Creazione di un set di dati. Se il set di dati è più grande di 5 GB, Canvas utilizza Amazon EMR serverless per elaborare i dati e dividerli in batch più piccoli. Dopo aver suddiviso i dati, Canvas utilizza la trasformazione di batch di SageMaker AI per generare previsioni. Potresti vedere gli addebiti di entrambi i servizi dopo aver eseguito le previsioni in batch. Per ulteriori informazioni, consulta Prezzi di Canvas.

Potresti non riuscire a generare previsioni su alcuni set di dati perché hanno schemi incompatibili. Uno schema è una struttura organizzativa. Per un set di dati tabellare, lo schema è costituito dai nomi delle colonne e dal tipo di dati nelle colonne. Uno schema potrebbe essere considerato incompatibile per uno dei seguenti motivi:

  • Il set di dati che stai usando per fare previsioni ha meno colonne rispetto al set di dati che stai usando per creare il modello.

  • I tipi di dati nelle colonne che hai usato per creare il set di dati potrebbero essere diversi dai tipi di dati del set di dati che stai usando per generare previsioni.

  • I nomi delle colonne del set di dati che stai usando per generare previsioni e i nomi delle colonne del set di dati che hai usato per creare il modello non corrispondono. I nomi delle colonne fanno distinzione tra maiuscole e minuscole. Column1 non è uguale a column1.

Per assicurarti di poter generare le previsioni in batch correttamente, abbina lo schema del set di dati delle previsioni in batch al set di dati utilizzato per addestrare il modello.

Nota

Per le previsioni in batch, se hai eliminato delle colonne durante la creazione del modello, Canvas le aggiunge nuovamente ai risultati della previsione. Tuttavia, Canvas non aggiunge le colonne eliminate alle previsioni in batch per i modelli di serie temporali.