View a markdown version of this page

Implementazione di modelli di fondazione e di modelli ottimizzati con fine-tuning personalizzati - Amazon SageMaker AI

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Implementazione di modelli di fondazione e di modelli ottimizzati con fine-tuning personalizzati

Che tu stia implementando modelli open weight di base o modelli gated pre-addestrati di Amazon o i tuoi modelli personalizzati o SageMaker JumpStart ottimizzati archiviati in Amazon S3 o Amazon SageMaker HyperPod FSx, offre l'infrastruttura flessibile e scalabile di cui hai bisogno per i carichi di lavoro di inferenza di produzione.

Implementa modelli di base aperti e chiusi da JumpStart Implementazione di modelli personalizzati e ottimizzati con fine-tuning da Amazon S3 e Amazon FSx Implementa modelli dallo storage NVMe locale
Descrizione

Implementa da un catalogo completo di modelli di fondazione preaddestrati con policy di ottimizzazione e dimensionamento automatiche personalizzate per ogni famiglia di modelli.

Porta i tuoi modelli personalizzati e ottimizzati e utilizza l'infrastruttura aziendale per l'inferenza su scala SageMaker HyperPod di produzione. Scegli tra un’archiviazione conveniente con Amazon S3 o un file system ad alte prestazioni con Amazon FSx. Carica i pesi dei modelli dallo storage NVMe locale di un nodo per eliminare la latenza di rete durante l'avvio del pod. Utile per eventi di scalabilità automatica, carichi di lavoro con scalabilità da zero e failover sensibili alla latenza.
Vantaggi principali
  • One-click distribuzione tramite l'interfaccia utente di Amazon SageMaker Studio

  • Auto-scaling in base alle richieste in arrivo, abilitata automaticamente

  • Pre-optimized contenitori e configurazioni per ogni famiglia di modelli

  • Gestione dell’EULA per i modelli gated

  • Supporto per più backend di archiviazione: Amazon S3, Amazon FSx

  • Supporto flessibile per container e framework

  • Policy di dimensionamento personalizzate in base alle caratteristiche del modello

  • Riduzione del tempo di avvio a freddo grazie alla lettura locale dei pesi

  • Nessuna dipendenza dalla rete per il caricamento del modello

  • Fallback opzionale su Amazon S3 quando manca la cache NVMe

  • Volumi Kubernetes e InitContainers personalizzati

Opzioni di implementazione
  • Amazon SageMaker Studio per la distribuzione visiva

  • kubectl per le operazioni Kubernetes-native

  • Python SDK per l’integrazione programmatica

  • HyperPod CLI per l'automazione da riga di comando

  • kubectl per le operazioni Kubernetes-native

  • Python SDK per l’integrazione programmatica

  • HyperPod CLI per l'automazione da riga di comando

  • kubectl per le operazioni Kubernetes-native

  • Python SDK per l’integrazione programmatica

  • HyperPod CLI per l'automazione da riga di comando

Le seguenti sezioni illustrano la distribuzione di modelli da Amazon SageMaker JumpStart, Amazon S3 e Amazon FSx e dallo storage NVMe locale.