Tutorial per la creazione di modelli con le istanze del notebook
Questo tutorial introduttivo illustra come creare un’istanza del notebook SageMaker, aprire un notebook Jupyter con un kernel preconfigurato con l’ambiente Conda per il machine learning e avviare una sessione di SageMaker AI per eseguire un ciclo di ML end-to-end. Scoprirai come salvare un set di dati in un bucket Amazon S3 predefinito associato automaticamente alla sessione di SageMaker AI, inviare un job di addestramento di un modello di ML ad Amazon EC2 e implementare il modello addestrato per la previsione mediante hosting o inferenza in batch con Amazon EC2.
Questo tutorial mostra esplicitamente un flusso di ML completato per l’addestramento dei modelli XGBoost dal pool di modelli integrati di SageMaker AI. Utilizzerai il set di dati US Adult Census
-
XGBoost di SageMaker AI: il modello XGBoost
è adattato all’ambiente SageMaker AI e preconfigurato come container Docker. SageMaker AI offre una suite di algoritmi integrati preparati per l’utilizzo delle funzionalità di SageMaker AI. Per ulteriori informazioni su quali algoritmi di ML sono adattati a SageMaker AI, consulta Choose an Algorithm e Use Amazon SageMaker Built-in Algorithms. Per le operazioni API degli algoritmi integrati di SageMaker AI, consulta First-party algorithms in Amazon SageMaker Python SDK . -
Set di dati Adult Census
: il set di dati del database del Census Bureau del 1994 di Ronny Kohavi e Barry Becker (Data Mining and Visualization, Silicon Graphics). Il modello XGBoost di SageMaker AI viene addestrato utilizzando questo set di dati per prevedere se una persona guadagnerà più o meno di 50.000 dollari all’anno.