Adatta il tuo processo di addestramento per accedere alle immagini in un registro Docker privato
Puoi utilizzare un registro Docker
Creazione e archiviazione di immagini in un registro Docker privato
Creazione di un registro Docker privato per archiviare le immagini. Il registro deve:
-
utilizzare il protocollo del Registro Docker HTTP API
-
essere accessibile dallo stesso VPC specificato nel parametro VpcConfig nell'API
CreateTrainingJob. InserisciVpcConfigquando crei il processo di addestramento. -
protetto con un certificato TLS
rilasciato da un'autorità di certificazione pubblica nota.
Per ulteriori informazioni sulla creazione di un registro Docker, consulta Deploy a registry server
Configura il tuo processo di addestramento su VPC e SageMaker
SageMaker AI utilizza una connessione di rete all’interno del VPC per accedere alle immagini nel registro Docker. Per utilizzare le immagini del registro Docker per l’addestramento, il registro deve essere accessibile da un Amazon VPC del proprio account. Per ulteriori informazioni, consulta Utilizzo di un registro Docker che richiede l'autenticazione per l’addestramento.
Devi inoltre configurare il processo di addestramento per connetterti allo stesso VPC a cui ha accesso il registro Docker. Per ulteriori informazioni, consulta Configure a Training Job for Amazon VPC Access.
Creazione di un processo di addestramento utilizzando un'immagine dal registro Docker privato
Per utilizzare un'immagine del registro Docker privato per l’addestramento, usa la seguente guida per configurare l'immagine, configurare e creare un processo di addestramento. Gli esempi di codice che seguono utilizzano il client AWS SDK per Python (Boto3).
-
Crea un oggetto di configurazione dell'immagine di addestramento e inserisci
Vpcil campoTrainingRepositoryAccessModecome segue.training_image_config = { 'TrainingRepositoryAccessMode': 'Vpc' }Nota
Se il registro Docker privato richiede l'autenticazione, devi aggiungere un oggetto
TrainingRepositoryAuthConfigall'oggetto di configurazione dell'immagine di addestramento. Devi inoltre specificare il nome della risorsa Amazon (ARN) di una funzione AWS Lambda che fornisce le credenziali di accesso a SageMaker AI utilizzando il campoTrainingRepositoryCredentialsProviderArndell’oggettoTrainingRepositoryAuthConfig. Per ulteriori informazioni, consulta la struttura del codice di esempio qui di seguito.training_image_config = { 'TrainingRepositoryAccessMode': 'Vpc', 'TrainingRepositoryAuthConfig': { 'TrainingRepositoryCredentialsProviderArn': 'arn:aws:lambda:Region:Acct:function:FunctionName' } }Per informazioni su come creare la funzione Lambda per consentire l'autenticazione, consulta Utilizzo di un registro Docker che richiede l'autenticazione per l’addestramento.
-
Utilizzo di un client Boto3 per creare un processo di addestramento e inoltrare la configurazione corretta all'API create_training_job. Le seguenti istruzioni mostrano come configurare i componenti e creare un processo di addestramento.
-
Crea l’oggetto
AlgorithmSpecificationche desideri inoltrare acreate_training_job. Utilizza l'oggetto di configurazione dell'immagine di addestramento creato nella fase precedente, come illustrato nell'esempio di codice seguente.algorithm_specification = { 'TrainingImage': 'myteam.myorg.com/docker-local/my-training-image:<IMAGE-TAG>', 'TrainingImageConfig': training_image_config, 'TrainingInputMode': 'File' }Nota
Per utilizzare una versione fissa, anziché aggiornata, di un'immagine, fai riferimento al digest
dell'immagine anziché al nome o al tag. -
Specifica il nome del processo di addestramento e il ruolo che desideri inoltrare a
create_training_job, come illustrato nell'esempio di codice seguente.training_job_name = 'private-registry-job' execution_role_arn = 'arn:aws:iam::123456789012:role/SageMakerExecutionRole' -
Specifica un gruppo di sicurezza e una sottorete per la configurazione VPC per il processo di addestramento. Il registro Docker privato deve consentire il traffico in entrata proveniente dai gruppi di sicurezza specificati, come illustrato nel seguente esempio di codice.
vpc_config = { 'SecurityGroupIds': ['sg-0123456789abcdef0'], 'Subnets': ['subnet-0123456789abcdef0','subnet-0123456789abcdef1'] }Nota
Se la sottorete non si trova nello stesso VPC del registro Docker privato, è necessario configurare una connessione di rete tra i due VPC. Per ulteriori informazioni, consulta Connetti VPC utilizzando Peering di VPC.
-
Specifica la configurazione delle risorse, incluse le istanze di calcolo di machine learning e i volumi di archiviazione da utilizzare per l’addestramento, come illustrato nel seguente esempio di codice.
resource_config = { 'InstanceType': 'ml.m4.xlarge', 'InstanceCount':1, 'VolumeSizeInGB':10, } -
Specifica la configurazione dei dati di input e output, dove è archiviato il set di dati di addestramento e dove desideri memorizzare gli artefatti del modello, come illustrato nel seguente esempio di codice.
input_data_config = [ { "ChannelName": "training", "DataSource": { "S3DataSource": { "S3DataDistributionType": "FullyReplicated", "S3DataType": "S3Prefix", "S3Uri": "s3://your-training-data-bucket/training-data-folder" } } } ] output_data_config = { 'S3OutputPath': 's3://your-output-data-bucket/model-folder' } -
Specifica il numero massimo di secondi in cui un processo di addestramento del modello può effettuare l’esecuzione come illustrato nel seguente esempio di codice.
stopping_condition = { 'MaxRuntimeInSeconds':1800} -
Infine, crea il processo di addestramento utilizzando i parametri specificati nella fase precedente, come illustrato nell'esempio di codice seguente.
import boto3 sm = boto3.client('sagemaker') try: resp = sm.create_training_job( TrainingJobName=training_job_name, AlgorithmSpecification=algorithm_specification, RoleArn=execution_role_arn, InputDataConfig=input_data_config, OutputDataConfig=output_data_config, ResourceConfig=resource_config, VpcConfig=vpc_config, StoppingCondition=stopping_condition ) except Exception as e: print(f'error calling CreateTrainingJob operation: {e}') else: print(resp)
-