Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Gestione dei percorsi di archiviazione per diversi tipi di archiviazione locale delle istanze
Considerate quanto segue quando impostate i percorsi di archiviazione per i lavori di formazione in AI. SageMaker
-
Se desideri memorizzare gli artefatti didattici per l’addestramento distribuito nella directory
/opt/ml/output/data, devi aggiungere correttamente le sottodirectory o utilizzare nomi di file univoci per gli artefatti tramite la definizione del modello o lo script di addestramento. Se le sottodirectory e i nomi dei file non sono configurati correttamente, tutti gli addetti all’addestramento distribuito potrebbero scrivere output con lo stesso nome di file nello stesso percorso di output in Amazon S3. -
Se utilizzi un contenitore di formazione personalizzato, assicurati di installare il SageMaker Training Toolkit
che aiuta a configurare l'ambiente per i lavori di SageMaker formazione. Altrimenti, è necessario specificare le variabili di ambiente in modo esplicito nel Dockerfile. Per ulteriori informazioni, consulta Creare un container con algoritmi e modelli personalizzati. -
Quando si utilizza un'istanza ML con volumi SSD NVMe, l' SageMaker IA non fornisce lo storage Amazon EBS gp2. Lo storage disponibile è fissato alla capacità di storage dell'istanza. NVMe-type SageMaker L'intelligenza artificiale configura percorsi di archiviazione per addestrare set di dati, checkpoint, artefatti del modello e output per utilizzare l'intera capacità dello storage dell'istanza. Ad esempio, le famiglie di istanze ML con storage di istanze includono NVMe-type , e.
ml.p4dml.g4dnml.g5Quando si utilizza un'istanza ML con l'opzione di EBS-only archiviazione e senza l'archiviazione delle istanze, è necessario definire la dimensione del volume EBS tramite ilvolume_sizeparametro nella classe di stima SageMaker AI (oVolumeSizeInGBse si utilizza l'ResourceConfigAPI). Ad esempio, le famiglie di istanze ML che utilizzano volumi EBS includonoml.c5eml.p2. Per cercare i tipi di istanze e i relativi tipi e volumi di storage delle istanze, consulta la sezione Tipi di istanze Amazon EC2. -
I percorsi predefiniti per i lavori di SageMaker formazione sono montati su volumi Amazon EBS o su volumi SSD NVMe dell'istanza ML. Quando adattate lo script di addestramento all' SageMaker intelligenza artificiale, assicuratevi di utilizzare i percorsi predefiniti elencati nell'argomento precedente. SageMaker Variabili di ambiente AI e percorsi predefiniti per l'addestramento dei luoghi di archiviazione Si consiglia di utilizzare la directory
/tmpcome spazio di memoria virtuale per memorizzare temporaneamente oggetti di grandi dimensioni durante l'addestramento. Ciò significa che non è necessario utilizzare directory montate su un piccolo spazio su disco allocato al sistema, come/usere/home, per evitare errori di esaurimento dello spazio.
Per saperne di più, consulta il blog sull'apprendimento AWS automatico Scegli la migliore fonte di dati per il tuo lavoro di SageMaker formazione su Amazon