Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Implementazione di modelli di fondazione e di modelli ottimizzati con fine-tuning personalizzati
Che tu stia implementando modelli open weight di base o modelli gated pre-addestrati di Amazon o i tuoi modelli personalizzati o SageMaker JumpStart ottimizzati archiviati in Amazon S3 o Amazon SageMaker HyperPod FSx, offre l'infrastruttura flessibile e scalabile di cui hai bisogno per i carichi di lavoro di inferenza di produzione.
| Implementa modelli di base aperti e chiusi da JumpStart | Implementazione di modelli personalizzati e ottimizzati con fine-tuning da Amazon S3 e Amazon FSx | Implementa modelli dallo storage NVMe locale | |
|---|---|---|---|
| Descrizione |
Implementa da un catalogo completo di modelli di fondazione preaddestrati con policy di ottimizzazione e dimensionamento automatiche personalizzate per ogni famiglia di modelli. |
Porta i tuoi modelli personalizzati e ottimizzati e utilizza l'infrastruttura aziendale per l'inferenza su scala SageMaker HyperPod di produzione. Scegli tra un’archiviazione conveniente con Amazon S3 o un file system ad alte prestazioni con Amazon FSx. | Carica i pesi dei modelli dallo storage NVMe locale di un nodo per eliminare la latenza di rete durante l'avvio del pod. Utile per eventi di scalabilità automatica, carichi di lavoro con scalabilità da zero e failover sensibili alla latenza. |
| Vantaggi principali |
|
|
|
| Opzioni di implementazione |
|
|
|
Le seguenti sezioni illustrano la distribuzione di modelli da Amazon SageMaker JumpStart, Amazon S3 e Amazon FSx e dallo storage NVMe locale.