Implementazione di modelli di fondazione e di modelli ottimizzati con fine-tuning personalizzati

Che tu stia implementando modelli open weight di base o modelli gated pre-addestrati di Amazon o i tuoi modelli personalizzati o SageMaker JumpStart ottimizzati archiviati in Amazon S3 o Amazon SageMaker HyperPod FSx, offre l'infrastruttura flessibile e scalabile di cui hai bisogno per i carichi di lavoro di inferenza di produzione.

	Implementa modelli di base aperti e chiusi da JumpStart	Implementazione di modelli personalizzati e ottimizzati con fine-tuning da Amazon S3 e Amazon FSx	Implementa modelli dallo storage NVMe locale
Descrizione	Implementa da un catalogo completo di modelli di fondazione preaddestrati con policy di ottimizzazione e dimensionamento automatiche personalizzate per ogni famiglia di modelli.	Porta i tuoi modelli personalizzati e ottimizzati e utilizza l'infrastruttura aziendale per l'inferenza su scala SageMaker HyperPod di produzione. Scegli tra un’archiviazione conveniente con Amazon S3 o un file system ad alte prestazioni con Amazon FSx.	Carica i pesi dei modelli dallo storage NVMe locale di un nodo per eliminare la latenza di rete durante l'avvio del pod. Utile per eventi di scalabilità automatica, carichi di lavoro con scalabilità da zero e failover sensibili alla latenza.
Vantaggi principali	One-click distribuzione tramite l'interfaccia utente di Amazon SageMaker Studio Auto-scaling in base alle richieste in arrivo, abilitata automaticamente Pre-optimized contenitori e configurazioni per ogni famiglia di modelli Gestione dell’EULA per i modelli gated	Supporto per più backend di archiviazione: Amazon S3, Amazon FSx Supporto flessibile per container e framework Policy di dimensionamento personalizzate in base alle caratteristiche del modello	Riduzione del tempo di avvio a freddo grazie alla lettura locale dei pesi Nessuna dipendenza dalla rete per il caricamento del modello Fallback opzionale su Amazon S3 quando manca la cache NVMe Volumi Kubernetes e InitContainers personalizzati
Opzioni di implementazione	Amazon SageMaker Studio per la distribuzione visiva kubectl per le operazioni Kubernetes-native Python SDK per l’integrazione programmatica HyperPod CLI per l'automazione da riga di comando	kubectl per le operazioni Kubernetes-native Python SDK per l’integrazione programmatica HyperPod CLI per l'automazione da riga di comando	kubectl per le operazioni Kubernetes-native Python SDK per l’integrazione programmatica HyperPod CLI per l'automazione da riga di comando

Le seguenti sezioni illustrano la distribuzione di modelli da Amazon SageMaker JumpStart, Amazon S3 e Amazon FSx e dallo storage NVMe locale.

Argomenti

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Configurazione dei HyperPod cluster per la distribuzione dei modelli

Distribuisci modelli utilizzando Studio JumpStart