Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Modifica della configurazione per il campionamento del flusso di dati
Quando importi dati tabulari in un flusso di dati Data Wrangler, puoi decidere di prelevare un campione del set di dati per accelerare il processo di esplorazione e pulizia dei dati. L’esecuzione di trasformazioni esplorative su un campione del set di dati è spesso più veloce rispetto all’esecuzione di trasformazioni sull’intero set di dati. Inoltre, quando è tutto pronto per esportare il set di dati e creare un modello, puoi applicare le trasformazioni all’intero set di dati.
Canvas supporta i metodi di campionamento seguenti:
FirstK: Canvas seleziona i primi K elementi dal set di dati, dove K è un numero che specifichi. Questo metodo di campionamento è semplice, ma può introdurre bias se il set di dati non è ordinato in modo casuale.
Casuale: Canvas seleziona gli elementi dal set di dati in modo casuale, quindi ogni elemento ha la stessa probabilità di essere scelto. Questo metodo di campionamento contribuisce a garantire che il campione sia rappresentativo dell’intero set di dati.
Stratificato: Canvas divide il set di dati in gruppi (o strati) in base a uno o più attributi (ad esempio, età e livello di reddito). Quindi, un numero proporzionale di elementi viene selezionato casualmente da ciascun gruppo. Questo metodo garantisce che tutti i sottogruppi pertinenti siano adeguatamente rappresentati nel campione.
Puoi modificare la configurazione del campionamento in qualsiasi momento per ridimensionare il campione utilizzato per l’esplorazione dei dati.
Per modificare la configurazione del campionamento, procedi come descritto di seguito:
Nel grafo del flusso di dati, seleziona il nodo dell’origine dati.
Scegli Campionamento nella barra di navigazione in basso.
Si apre la finestra di dialogo Campionamento. Nell’elenco a discesa Metodo di campionamento, seleziona il metodo di campionamento desiderato.
In Dimensione massima del campione, inserisci il numero di righe da campionare.
Scegli Update (Aggiorna) per salvare le modifiche.
A questo punto, le modifiche alla configurazione del campionamento dovrebbero essere applicate.