Utilizzare uno strumento di stima SageMaker AI per eseguire un job di addestramento - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Utilizzare uno strumento di stima SageMaker AI per eseguire un job di addestramento

Puoi anche utilizzare uno strumento di valutazione dall’SDK SageMaker Python per gestire la configurazione e l'esecuzione del processo di addestramento su SageMaker. Gli esempi di codice seguenti mostrano come configurare ed eseguire uno strumento di valutazione utilizzando immagini da un registro Docker privato.

  1. Importa le librerie e le dipendenze richieste, come mostrato nell'esempio di codice seguente.

    import boto3 import sagemaker from sagemaker.estimator import Estimator session = sagemaker.Session() role = sagemaker.get_execution_role()
  2. Fornisci un URI (Uniform Resource Identifier) all'immagine di addestramento, ai gruppi di sicurezza e alle sottoreti per la configurazione VPC per il processo di addestramento, come mostrato nel seguente esempio di codice.

    image_uri = "myteam.myorg.com/docker-local/my-training-image:<IMAGE-TAG>" security_groups = ["sg-0123456789abcdef0"] subnets = ["subnet-0123456789abcdef0", "subnet-0123456789abcdef0"]

    Per ulteriori informazioni su security_group_ids e subnets, vedi la descrizione appropriata dei parametri nella sezione Strumenti di valutazione di SageMaker Python SDK.

    Nota

    SageMaker AI utilizza una connessione di rete all’interno del VPC per accedere alle immagini nel registro Docker. Per utilizzare le immagini del registro Docker per l’addestramento, il registro deve essere accessibile da un Amazon VPC del proprio account.

  3. Facoltativamente, se il registro Docker richiede l’autenticazione, è necessario specificare anche il nome della risorsa Amazon (ARN) di una funzione AWS Lambda che fornisce le credenziali di accesso a SageMaker AI. Il seguente esempio di codice mostra come specificare l’ARN.

    training_repository_credentials_provider_arn = "arn:aws:lambda:us-west-2:1234567890:function:test"

    Per ulteriori informazioni sull'utilizzo di immagini in un registro Docker che richiede l'autenticazione, consulta Use a Docker registry that requires authentication for training di seguito.

  4. Usa gli esempi di codice delle fasi precedenti per configurare uno strumento di valutazione, come mostrato nel seguente esempio di codice.

    # The training repository access mode must be 'Vpc' for private docker registry jobs training_repository_access_mode = "Vpc" # Specify the instance type, instance count you want to use instance_type="ml.m5.xlarge" instance_count=1 # Specify the maximum number of seconds that a model training job can run max_run_time = 1800 # Specify the output path for the model artifacts output_path = "s3://your-output-bucket/your-output-path" estimator = Estimator( image_uri=image_uri, role=role, subnets=subnets, security_group_ids=security_groups, training_repository_access_mode=training_repository_access_mode, training_repository_credentials_provider_arn=training_repository_credentials_provider_arn, # remove this line if auth is not needed instance_type=instance_type, instance_count=instance_count, output_path=output_path, max_run=max_run_time )
  5. Avvia il processo di addestramento chiamando estimator.fit con il nome del processo e il percorso di input come parametri, come illustrato nel seguente esempio di codice.

    input_path = "s3://your-input-bucket/your-input-path" job_name = "your-job-name" estimator.fit( inputs=input_path, job_name=job_name )