

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Parametri avanzati di Amazon SageMaker AI per gli endpoint di inferenza
<a name="monitoring-cloudwatch-enhanced-metrics"></a>

Le metriche avanzate forniscono dati di monitoraggio a livello di istanza e contenitore per gli endpoint Amazon AI in tempo reale. SageMaker Quando abiliti i parametri avanzati, i parametri di Amazon CloudWatch possono includere `InstanceId` e `AcceleratorId` dimensioni (la disponibilità varia in base allo spazio dei nomi) per una visibilità granulare per istanza, per contenitore e per GPU. `ContainerId` Sono disponibili metriche avanzate per endpoint e componenti di inferenza a modello singolo. Multi-Container Gli endpoint (MCE) supportano metriche avanzate a livello di istanza ma non metriche a livello di contenitore.

Caratteristiche chiave delle metriche avanzate:
+ **Instance-level granularità**. Le metriche di utilizzo e invocazione includono una `InstanceId` dimensione che identifica l'istanza specifica che ospita l'endpoint. È disponibile per tutti gli endpoint in tempo reale.
+ **Container-level granularità**. Per gli endpoint che utilizzano componenti di inferenza, le metriche includono una `ContainerId` dimensione che identifica il contenitore specifico che esegue il modello. Container-level le dimensioni vengono visualizzate sia nello spazio dei `AWS/SageMaker` nomi (metriche di invocazione) che nello spazio dei nomi (metriche di utilizzo). `/aws/sagemaker/InferenceComponents`
+ **Per-GPU granularità.** Le metriche di utilizzo della GPU includono una `AcceleratorId` dimensione che identifica la GPU specifica su un'istanza.
+ **Frequenza** di pubblicazione configurabile. Puoi configurare l'intervallo di pubblicazione delle metriche su 10, 30, 60, 120, 180, 240 o 300 secondi. Il valore predefinito è 60 secondi. Questo intervallo si applica alle metriche di utilizzo indipendentemente dal fatto che le metriche avanzate siano abilitate. Con le metriche avanzate abilitate, si applica anche alle metriche di invocazione.

## Abilitazione di metriche avanzate
<a name="enhanced-metrics-enabling"></a>

Puoi abilitare le metriche avanzate impostando `EnableEnhancedMetrics` su `True` nel [MetricsConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_MetricsConfig.html)parametro quando chiami l'[CreateEndpointConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateEndpointConfig.html)API.

Il `MetricsConfig` parametro ha i seguenti campi:


**MetricsConfig parametri**  

| Parametro | Tipo | Obbligatorio | Predefinita | Description | 
| --- | --- | --- | --- | --- | 
| EnableEnhancedMetrics | Boolean | No | False | Abilita le dimensioni metriche a livello di istanza e di contenitore. | 
| MetricPublishFrequencyInSeconds | Numero intero | No | 60 | L'intervallo, in secondi, in base al quale le metriche vengono pubblicate su Amazon. CloudWatch L’impostazione predefinita è `60`. Valori validi:`10`,`30`,`60`,, `120``180`,`240`. `300` Quando `EnableEnhancedMetrics` è impostato su`False`, questo intervallo si applica solo alle metriche di utilizzo; le metriche di chiamata continuano a essere pubblicate all'intervallo predefinito di 60 secondi. Se impostato su, questo intervallo si applica sia alle metriche di utilizzo che di `True` invocazione. | 

**Nota**  
`MetricsConfig`è impostato a livello di configurazione dell'endpoint. Non è possibile configurare impostazioni diverse per i singoli componenti di inferenza sullo stesso endpoint.

Per abilitare metriche avanzate su un endpoint esistente, crea una nuova configurazione dell'endpoint con `MetricsConfig` le impostazioni desiderate, quindi chiama [UpdateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateEndpoint.html)con il nuovo nome di configurazione dell'endpoint. Ciò attiva una distribuzione progressiva. blue/green Le metriche avanzate non vengono visualizzate fino al completamento della distribuzione. Lo stesso processo si applica quando si modificano `MetricsConfig` le impostazioni su un endpoint già configurato.

Quando si configura`MetricsConfig`, entrambi [DescribeEndpointConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeEndpointConfig.html)restituiscono [DescribeEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeEndpoint.html)`MetricsConfig`la risposta.

Quando abiliti metriche avanzate, l' SageMaker intelligenza artificiale aggiunge dimensioni aggiuntive alle metriche in tre CloudWatch namespace: `/aws/sagemaker/Endpoints` per le metriche di utilizzo, `AWS/SageMaker` per le metriche di invocazione e per le metriche di utilizzo dei componenti di inferenza. `/aws/sagemaker/InferenceComponents`

## Instance-level metriche di utilizzo
<a name="enhanced-metrics-instance-utilization"></a>

Il `/aws/sagemaker/Endpoints` namespace include metriche di utilizzo per tutti gli endpoint in tempo reale, compresi quelli che utilizzano componenti di inferenza. Quando abiliti le metriche avanzate, le dimensioni `InstanceId` and `AcceleratorId` (solo metriche GPU) diventano disponibili insieme alle dimensioni del namespace esistenti. Per un elenco completo di metriche e dimensioni, consulta. [SageMaker Metriche degli endpoint AI](monitoring-cloudwatch.md#cloudwatch-metrics-endpoints)

Quando abiliti le metriche avanzate, sono disponibili le seguenti dimensioni aggiuntive:


**Dimensioni aggiuntive per le metriche di utilizzo a livello di istanza**  

| Dimensione | Description | 
| --- | --- | 
| InstanceId | Filtra le metriche di utilizzo per un'istanza specifica. | 
| AcceleratorId | (Solo metriche GPU) Filtra le metriche di utilizzo per una GPU specifica. | 

## Metriche di chiamata a livello di istanza e contenitore
<a name="enhanced-metrics-invocation"></a>

Il `AWS/SageMaker` namespace include metriche di invocazione. Quando abiliti le metriche avanzate, le dimensioni `InstanceId` and `ContainerId` (solo componenti di inferenza) diventano disponibili insieme alle dimensioni del namespace esistenti. Per un elenco completo di metriche e dimensioni, consulta. [SageMaker Metriche di invocazione degli endpoint AI](monitoring-cloudwatch.md#cloudwatch-metrics-endpoint-invocation)

Quando abiliti le metriche avanzate, sono disponibili le seguenti dimensioni aggiuntive:


**Dimensioni aggiuntive per le metriche di invocazione**  

| Dimensione | Description | 
| --- | --- | 
| InstanceId | Filtra le metriche di chiamata per un'istanza specifica. | 
| ContainerId | (Solo componenti di inferenza) Filtra le metriche di invocazione per un contenitore specifico. | 

## Container-level metriche di utilizzo
<a name="enhanced-metrics-container"></a>

Il `/aws/sagemaker/InferenceComponents` namespace include metriche di utilizzo per gli endpoint che utilizzano componenti di inferenza. Quando abiliti le metriche avanzate, le dimensioni `InstanceId``ContainerId`, e `AcceleratorId` (solo metriche GPU) diventano disponibili insieme alle dimensioni del namespace esistenti. Per un elenco completo di metriche e dimensioni, consulta. [SageMaker Metriche dei componenti di inferenza AI](monitoring-cloudwatch.md#cloudwatch-metrics-inference-component)

Quando abiliti le metriche avanzate, sono disponibili le seguenti dimensioni aggiuntive:


**Dimensioni aggiuntive per le metriche di utilizzo a livello di contenitore**  

| Dimensione | Description | 
| --- | --- | 
| InstanceId | Filtra le metriche di utilizzo per un'istanza specifica. | 
| ContainerId | Filtra le metriche di utilizzo per un contenitore specifico. | 
| AcceleratorId | (Solo metriche GPU) Filtra le metriche di utilizzo per una GPU specifica. | 

## Frequenza metrica configurabile
<a name="enhanced-metrics-frequency"></a>

È possibile configurare l'intervallo in cui vengono pubblicate le metriche. CloudWatch La frequenza predefinita è 60 secondi.

**Valori validi:** 10, 30, 60, 120, 180, 240 o 300 secondi.

Quando `EnableEnhancedMetrics` è impostata su`False`, questa frequenza si applica solo alle metriche di utilizzo; le metriche di invocazione continuano a essere pubblicate all'intervallo predefinito di 60 secondi. Se impostata su`True`, questa frequenza si applica sia alle metriche di utilizzo che a quelle di invocazione.

**Nota**  
Le metriche pubblicate a intervalli inferiori a 60 secondi (alta risoluzione) vengono conservate per 3 ore.

 CloudWatch I prezzi standard si applicano per metrica per combinazione di dimensioni unica. Le metriche avanzate aumentano il numero di flussi di metriche perché ogni istanza, contenitore e GPU crea combinazioni di dimensioni aggiuntive. Per i dettagli sui prezzi, consulta la pagina [ CloudWatch dei prezzi di Amazon](https://aws.amazon.com/cloudwatch/pricing/).

## Esempi di codice: configura metriche avanzate
<a name="enhanced-metrics-code-examples"></a>

Gli esempi seguenti mostrano come creare una configurazione di endpoint con metriche avanzate abilitate e come verificare la configurazione.

### Crea una configurazione degli endpoint con metriche avanzate
<a name="enhanced-metrics-create-example"></a>

------
#### [ AWS SDK for Python (Boto3) ]

**Example Crea una configurazione degli endpoint con metriche avanzate**  

```
import boto3

sagemaker_client = boto3.client('sagemaker')

response = sagemaker_client.create_endpoint_config(
    EndpointConfigName='{{my-enhanced-metrics-config}}',
    ProductionVariants=[
        {
            'VariantName': '{{AllTraffic}}',
            'ModelName': '{{my-model}}',
            'InstanceType': '{{ml.m5.xlarge}}',
            'InitialInstanceCount': {{2}},
        }
    ],
    MetricsConfig={
        'EnableEnhancedMetrics': True,
        'MetricPublishFrequencyInSeconds': {{60}}
    }
)
```

------
#### [ AWS CLI ]

**Example Crea una configurazione degli endpoint con metriche avanzate**  

```
aws sagemaker create-endpoint-config \
    --endpoint-config-name {{my-enhanced-metrics-config}} \
    --production-variants file://production-variants.json \
    --metrics-config file://metrics-config.json
```
Dove `metrics-config.json` contiene:  

```
{
    "EnableEnhancedMetrics": true,
    "MetricPublishFrequencyInSeconds": {{60}}
}
```

------

### Verifica la configurazione avanzata delle metriche
<a name="enhanced-metrics-verify-example"></a>

------
#### [ AWS SDK for Python (Boto3) ]

**Example Verifica la configurazione avanzata delle metriche**  

```
response = sagemaker_client.describe_endpoint_config(
    EndpointConfigName='{{my-enhanced-metrics-config}}'
)
print(response['MetricsConfig'])
# {'EnableEnhancedMetrics': True, 'MetricPublishFrequencyInSeconds': 60}

response = sagemaker_client.describe_endpoint(
    EndpointName='{{my-endpoint}}'
)
print(response['MetricsConfig'])
```

------
#### [ AWS CLI ]

**Example Verifica la configurazione avanzata delle metriche**  

```
aws sagemaker describe-endpoint-config \
    --endpoint-config-name {{my-enhanced-metrics-config}} \
    --query 'MetricsConfig'
```

```
aws sagemaker describe-endpoint \
    --endpoint-name {{my-endpoint}} \
    --query 'MetricsConfig'
```

------