Utilizzare uno strumento di stima SageMaker AI per eseguire un job di addestramento

Puoi anche utilizzare uno strumento di valutazione dall’SDK SageMaker Python per gestire la configurazione e l'esecuzione del processo di addestramento su SageMaker. Gli esempi di codice seguenti mostrano come configurare ed eseguire uno strumento di valutazione utilizzando immagini da un registro Docker privato.

Importa le librerie e le dipendenze richieste, come mostrato nell'esempio di codice seguente.


import boto3
import sagemaker
from sagemaker.estimator import Estimator

session = sagemaker.Session()

role = sagemaker.get_execution_role()

Fornisci un URI (Uniform Resource Identifier) all'immagine di addestramento, ai gruppi di sicurezza e alle sottoreti per la configurazione VPC per il processo di addestramento, come mostrato nel seguente esempio di codice.
```
image_uri = "myteam.myorg.com/docker-local/my-training-image:<IMAGE-TAG>"

security_groups = ["sg-0123456789abcdef0"]
subnets = ["subnet-0123456789abcdef0", "subnet-0123456789abcdef0"]
```
Per ulteriori informazioni su security_group_ids e subnets, vedi la descrizione appropriata dei parametri nella sezione Strumenti di valutazione di SageMaker Python SDK.

Nota
SageMaker AI utilizza una connessione di rete all’interno del VPC per accedere alle immagini nel registro Docker. Per utilizzare le immagini del registro Docker per l’addestramento, il registro deve essere accessibile da un Amazon VPC del proprio account.
Facoltativamente, se il registro Docker richiede l’autenticazione, è necessario specificare anche il nome della risorsa Amazon (ARN) di una funzione AWS Lambda che fornisce le credenziali di accesso a SageMaker AI. Il seguente esempio di codice mostra come specificare l’ARN.
```
training_repository_credentials_provider_arn = "arn:aws:lambda:us-west-2:1234567890:function:test"
```
Per ulteriori informazioni sull'utilizzo di immagini in un registro Docker che richiede l'autenticazione, consulta Use a Docker registry that requires authentication for training di seguito.

Usa gli esempi di codice delle fasi precedenti per configurare uno strumento di valutazione, come mostrato nel seguente esempio di codice.


# The training repository access mode must be 'Vpc' for private docker registry jobs 
training_repository_access_mode = "Vpc"

# Specify the instance type, instance count you want to use
instance_type="ml.m5.xlarge"
instance_count=1

# Specify the maximum number of seconds that a model training job can run
max_run_time = 1800

# Specify the output path for the model artifacts
output_path = "s3://your-output-bucket/your-output-path"

estimator = Estimator(
    image_uri=image_uri,
    role=role,
    subnets=subnets,
    security_group_ids=security_groups,
    training_repository_access_mode=training_repository_access_mode,
    training_repository_credentials_provider_arn=training_repository_credentials_provider_arn,  # remove this line if auth is not needed
    instance_type=instance_type,
    instance_count=instance_count,
    output_path=output_path,
    max_run=max_run_time
)

Avvia il processo di addestramento chiamando estimator.fit con il nome del processo e il percorso di input come parametri, come illustrato nel seguente esempio di codice.
```
input_path = "s3://your-input-bucket/your-input-path"
job_name = "your-job-name"

estimator.fit(
    inputs=input_path,
    job_name=job_name
)
```

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Adatta il tuo processo di addestramento per accedere alle immagini in un registro Docker privato

Utilizzo di un registro Docker che richiede l'autenticazione per l’addestramento

Utilizzare uno strumento di stima SageMaker AI per eseguire un job di addestramento

Nota