Set di dati di esempio in Canvas - Amazon SageMaker AI

Set di dati di esempio in Canvas

SageMaker Canvas fornisce set di dati di esempio rivolti a casi d'uso unici in modo da poter iniziare a creare, addestrare e convalidare modelli rapidamente senza scrivere alcun codice. I casi d'uso associati a questi set di dati evidenziano le funzionalità di SageMaker Canvas ed è possibile sfruttare questi set di dati per iniziare a creare modelli. È possibile trovare i set di dati di esempio nella pagina Set di dati dell'applicazione SageMaker Canvas.

I seguenti set di dati sono gli esempi che SageMaker Canvas fornisce per impostazione predefinita. Questi set di dati coprono casi d'uso come la previsione dei prezzi delle abitazioni, l'insolvenza dei prestiti e la riammissione per i pazienti diabetici, la previsione delle vendite, la previsione dei guasti delle macchine per semplificare la manutenzione predittiva nelle unità di produzione e la generazione di previsioni sulla filiera per il trasporto e la logistica. I set di dati sono archiviati nella cartella sample_dataset del bucket Amazon S3 predefinito che SageMaker AI crea per il tuo account in una Regione.

  • canvas-sample-diabetic-readmission.csv: questo set di dati contiene dati storici, tra cui oltre quindici funzionalità con esiti dei pazienti e degli ospedali. È possibile utilizzare questo set di dati per prevedere se è probabile che i pazienti diabetici ad alto rischio vengano riammessi in ospedale entro 30 giorni dalla dimissione, dopo 30 giorni o non vengano ricoverati affatto. Utilizza la colonna redadmitted come colonna di destinazione e utilizza il tipo di modello di previsione a 3 o più categorie con questo set di dati. Per ulteriori informazioni su come creare un modello con questo set di dati, consulta la pagina dei workshop SageMaker Canvas. Questo set di dati è stato ottenuto dall'UCI Machine Learning Repository.

  • canvas-sample-housing.csv: questo set di dati contiene dati sulle caratteristiche legate a un determinato prezzo delle abitazioni. È possibile utilizzare questo set di dati per prevedere i prezzi delle abitazioni. Utilizza la colonna median_house_value come colonna di destinazione e utilizza il tipo di modello di previsione numerico con questo set di dati. Per ulteriori informazioni su come creare un modello con questo set di dati, consulta la pagina dei workshop SageMaker Canvas. Questo è il set di dati sulle abitazioni in California ottenuto dal StatLib repository.

  • canvas-sample-loans.csv: questo set di dati contiene dati completi sui prestiti per tutti i prestiti emessi dal 2007 al 2011, incluso lo stato attuale del prestito e le ultime informazioni di pagamento. È possibile utilizzare questo set di dati per prevedere se un cliente rimborserà un prestito. Utilizza la colonna loan_status come colonna di destinazione e utilizza il tipo di modello di previsione a 3 o più categorie con questo set di dati. Per ulteriori informazioni su come creare un modello con questo set di dati, consulta la pagina dei workshop SageMaker Canvas. Questi dati utilizzano LendingClub data ottenuti da Kaggle.

  • canvas-sample-maintenance.csv: questo set di dati contiene dati sulle caratteristiche legate a un determinato tipo di errore di manutenzione. È possibile utilizzare questo set di dati per prevedere quali guasti si verificheranno in futuro. Utilizza la colonna Tipo di errore come colonna di destinazione e utilizza il tipo di modello di previsione a 3 o più categorie con questo set di dati. Per ulteriori informazioni su come creare un modello con questo set di dati, consulta la pagina dei workshop SageMaker Canvas. Questo set di dati è stato ottenuto dall'UCI Machine Learning Repository.

  • canvas-sample-shipping-logs.csv: questo set di dati contiene dati di spedizione completi per tutti i prodotti consegnati, compresi il tempo stimato, la priorità di spedizione, il corriere e l'origine. È possibile utilizzare questo set di dati per prevedere l'ora di arrivo prevista della spedizione in numero di giorni. Utilizza la colonna ActualShippingDays come colonna di destinazione e utilizza il tipo di modello di previsione numerico con questo set di dati. Per ulteriori informazioni su come creare un modello con questo set di dati, consulta la pagina dei workshop SageMaker Canvas. Si tratta di un set di dati sintetico creato da Amazon.

  • canvas-sample-sales-forecasting.csv: questo set di dati contiene dati storici sulle vendite in serie temporali per i negozi di vendita al dettaglio. È possibile utilizzare questo set di dati per prevedere le vendite di un particolare punto vendita al dettaglio. Utilizza la colonna sales come colonna di destinazione e utilizza il tipo di modello di previsione delle serie temporali con questo set di dati. Per ulteriori informazioni su come creare un modello con questo set di dati, consulta la pagina dei workshop SageMaker Canvas. Si tratta di un set di dati sintetico creato da Amazon.