

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Verbesserte Amazon SageMaker AI-Metriken für Inferenzendpunkte
<a name="monitoring-cloudwatch-enhanced-metrics"></a>

Verbesserte Metriken bieten Überwachungsdaten auf Instance- und Container-Ebene für Amazon SageMaker AI-Echtzeit-Endpunkte. Wenn Sie erweiterte Metriken aktivieren, können CloudWatch Amazon-Metriken `AcceleratorId` Dimensionen und Dimensionen (Verfügbarkeit variiert je nach Namespace) beinhalten `InstanceId``ContainerId`, um eine detaillierte Sichtbarkeit pro Instance, pro Container und pro GPU zu gewährleisten. Erweiterte Metriken sind für Einzelmodell-Endpunkte und Inferenzkomponenten verfügbar. Multi-Container Endpoints (MCE) unterstützen erweiterte Metriken auf Instanzebene, aber keine Metriken auf Container-Ebene.

Hauptmerkmale erweiterter Metriken:
+ **Instance-level Granularität**. Die Nutzungs- und Aufrufmetriken beinhalten eine `InstanceId` Dimension, die die spezifische Instanz identifiziert, die den Endpunkt hostet. Dies ist für alle Echtzeit-Endpunkte verfügbar.
+ **Container-level Granularität**. Bei Endpunkten, die Inferenzkomponenten verwenden, enthalten die Metriken eine `ContainerId` Dimension, die den spezifischen Container identifiziert, auf dem das Modell ausgeführt wird. Container-level Dimensionen erscheinen sowohl im `AWS/SageMaker` Namespace (Aufrufmetriken) als auch im `/aws/sagemaker/InferenceComponents` Namespace (Nutzungsmetriken).
+ **Per-GPU Granularität.** Zu den GPU-Nutzungsmetriken gehört eine `AcceleratorId` Dimension, die die spezifische GPU auf einer Instance identifiziert.
+ **Konfigurierbare Veröffentlichungshäufigkeit**. Sie können das Intervall für die Veröffentlichung von Metriken auf 10, 30, 60, 120, 180, 240 oder 300 Sekunden konfigurieren. Standardmäßig ist ein Zeitraum von 60 Sekunden festgelegt. Dieses Intervall gilt für Nutzungsmetriken, unabhängig davon, ob erweiterte Metriken aktiviert sind. Wenn erweiterte Metriken aktiviert sind, gilt es auch für Aufrufmetriken.

## Erweiterte Metriken aktivieren
<a name="enhanced-metrics-enabling"></a>

Sie aktivieren erweiterte Metriken`EnableEnhancedMetrics`, `True` indem Sie beim Aufruf der [CreateEndpointConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateEndpointConfig.html)API den [MetricsConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_MetricsConfig.html)Parameter auf einstellen.

Der `MetricsConfig` Parameter hat die folgenden Felder:


**MetricsConfig Parameter**  

| Parameter | Typ | Erforderlich | Standard | Description | 
| --- | --- | --- | --- | --- | 
| EnableEnhancedMetrics | Boolesch | Nein | False | Ermöglicht metrische Dimensionen auf Instance- und Container-Ebene. | 
| MetricPublishFrequencyInSeconds | Ganzzahl | Nein | 60 | Das Intervall in Sekunden, in dem Metriken auf Amazon veröffentlicht werden CloudWatch. Standardeinstellung: `60`. Gültige Werte: `10``30`,`60`,`120`,`180`,`240`,`300`. Wenn auf gesetzt `EnableEnhancedMetrics` ist`False`, gilt dieses Intervall nur für Nutzungsmetriken. Aufrufmetriken werden weiterhin im Standardintervall von 60 Sekunden veröffentlicht. Wenn auf gesetzt`True`, gilt dieses Intervall sowohl für Nutzungs- als auch für Aufrufmetriken. | 

**Anmerkung**  
`MetricsConfig`ist auf der Endpunktkonfigurationsebene festgelegt. Sie können keine unterschiedlichen Einstellungen für einzelne Inferenzkomponenten auf demselben Endpunkt konfigurieren.

Um erweiterte Metriken auf einem vorhandenen Endpunkt zu aktivieren, erstellen Sie eine neue Endpunktkonfiguration mit den gewünschten `MetricsConfig` Einstellungen und rufen Sie dann [UpdateEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateEndpoint.html)mit dem neuen Namen der Endpunktkonfiguration auf. Dies löst eine blue/green oder fortlaufende Bereitstellung aus. Verbesserte Messwerte werden erst angezeigt, wenn die Bereitstellung abgeschlossen ist. Derselbe Vorgang gilt, wenn `MetricsConfig` Einstellungen auf einem bereits konfigurierten Endpunkt geändert werden.

Wenn Sie beides konfigurieren `MetricsConfig` [DescribeEndpoint](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeEndpoint.html)und `MetricsConfig` in der [DescribeEndpointConfig](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeEndpointConfig.html)Antwort zurückkehren.

Wenn Sie erweiterte Metriken aktivieren, fügt SageMaker KI den Metriken in drei CloudWatch Namespaces zusätzliche Dimensionen hinzu: `/aws/sagemaker/Endpoints` für Nutzungsmetriken, für Aufrufmetriken und `AWS/SageMaker` `/aws/sagemaker/InferenceComponents` für Nutzungsmetriken von Inferenzkomponenten.

## Instance-level Nutzungsmetriken
<a name="enhanced-metrics-instance-utilization"></a>

Der `/aws/sagemaker/Endpoints` Namespace umfasst Nutzungsmetriken für alle Echtzeit-Endpunkte, einschließlich solcher, die Inferenzkomponenten verwenden. Wenn Sie erweiterte Metriken aktivieren, werden die Dimensionen `InstanceId` und `AcceleratorId` (nur GPU-Metriken) neben den vorhandenen Namespace-Dimensionen verfügbar. Eine vollständige Liste der Metriken und Dimensionen finden Sie unter[SageMaker KI-Endpunktmetriken](monitoring-cloudwatch.md#cloudwatch-metrics-endpoints).

Wenn Sie erweiterte Metriken aktivieren, sind die folgenden zusätzlichen Dimensionen verfügbar:


**Zusätzliche Dimensionen für Nutzungsmetriken auf Instanzebene**  

| Dimension | Description | 
| --- | --- | 
| InstanceId | Filtert Nutzungsmetriken für eine bestimmte Instanz. | 
| AcceleratorId | (Nur GPU-Metriken) Filtert Nutzungsmetriken für eine bestimmte GPU. | 

## Aufrufmetriken auf Instanz- und Containerebene
<a name="enhanced-metrics-invocation"></a>

Der `AWS/SageMaker` Namespace umfasst Aufrufmetriken. Wenn Sie erweiterte Metriken aktivieren, werden die Dimensionen `InstanceId` und `ContainerId` (nur Inferenzkomponenten) neben den vorhandenen Namespace-Dimensionen verfügbar. Eine vollständige Liste der Metriken und Dimensionen finden Sie unter. [SageMaker Metriken zum Aufrufen von KI-Endpunkten](monitoring-cloudwatch.md#cloudwatch-metrics-endpoint-invocation)

Wenn Sie erweiterte Metriken aktivieren, sind die folgenden zusätzlichen Dimensionen verfügbar:


**Zusätzliche Dimensionen für Aufrufmetriken**  

| Dimension | Description | 
| --- | --- | 
| InstanceId | Filtert Aufrufmetriken für eine bestimmte Instanz. | 
| ContainerId | (Nur Inferenzkomponenten) Filtert Aufrufmetriken für einen bestimmten Container. | 

## Container-level Nutzungsmetriken
<a name="enhanced-metrics-container"></a>

Der `/aws/sagemaker/InferenceComponents` Namespace umfasst Nutzungsmetriken für Endpunkte, die Inferenzkomponenten verwenden. Wenn Sie erweiterte Metriken aktivieren, werden die Dimensionen `InstanceId``ContainerId`, und `AcceleratorId` (nur GPU-Metriken) neben den vorhandenen Namespace-Dimensionen verfügbar. Eine vollständige Liste der Metriken und Dimensionen finden Sie unter[SageMaker Metriken für KI-Inferenzkomponenten](monitoring-cloudwatch.md#cloudwatch-metrics-inference-component).

Wenn Sie erweiterte Metriken aktivieren, sind die folgenden zusätzlichen Dimensionen verfügbar:


**Zusätzliche Dimensionen für Nutzungsmetriken auf Containerebene**  

| Dimension | Description | 
| --- | --- | 
| InstanceId | Filtert Nutzungsmetriken für eine bestimmte Instanz. | 
| ContainerId | Filtert Nutzungsmetriken für einen bestimmten Container. | 
| AcceleratorId | (Nur GPU-Metriken) Filtert Nutzungsmetriken für eine bestimmte GPU. | 

## Konfigurierbare metrische Frequenz
<a name="enhanced-metrics-frequency"></a>

Sie können das Intervall konfigurieren, in dem Metriken veröffentlicht werden CloudWatch. Die Standardfrequenz beträgt 60 Sekunden.

**Gültige Werte:** 10, 30, 60, 120, 180, 240 oder 300 Sekunden.

Wenn auf eingestellt `EnableEnhancedMetrics` ist`False`, gilt diese Häufigkeit nur für Nutzungsmetriken. Aufrufmetriken werden weiterhin im Standardintervall von 60 Sekunden veröffentlicht. Wenn auf gesetzt`True`, gilt diese Frequenz sowohl für Nutzungs- als auch für Aufrufmetriken.

**Anmerkung**  
Metriken, die in Intervallen von weniger als 60 Sekunden veröffentlicht werden (hohe Auflösung), werden 3 Stunden lang aufbewahrt.

 CloudWatch Die Standardpreise gelten pro Metrik pro eindeutiger Dimensionskombination. Verbesserte Metriken erhöhen die Anzahl der Metrik-Streams, da jede Instance, jeder Container und jede GPU zusätzliche Dimensionskombinationen erstellt. Preisdetails finden Sie unter [ CloudWatch Amazon-Preise](https://aws.amazon.com/cloudwatch/pricing/).

## Codebeispiele: Konfigurieren Sie erweiterte Metriken
<a name="enhanced-metrics-code-examples"></a>

Die folgenden Beispiele zeigen, wie Sie eine Endpunktkonfiguration mit aktivierten erweiterten Metriken erstellen und wie die Konfiguration überprüft wird.

### Erstellen Sie eine Endpunktkonfiguration mit erweiterten Metriken
<a name="enhanced-metrics-create-example"></a>

------
#### [ AWS SDK for Python (Boto3) ]

**Example Erstellen Sie eine Endpunktkonfiguration mit erweiterten Metriken**  

```
import boto3

sagemaker_client = boto3.client('sagemaker')

response = sagemaker_client.create_endpoint_config(
    EndpointConfigName='{{my-enhanced-metrics-config}}',
    ProductionVariants=[
        {
            'VariantName': '{{AllTraffic}}',
            'ModelName': '{{my-model}}',
            'InstanceType': '{{ml.m5.xlarge}}',
            'InitialInstanceCount': {{2}},
        }
    ],
    MetricsConfig={
        'EnableEnhancedMetrics': True,
        'MetricPublishFrequencyInSeconds': {{60}}
    }
)
```

------
#### [ AWS CLI ]

**Example Erstellen Sie eine Endpunktkonfiguration mit erweiterten Metriken**  

```
aws sagemaker create-endpoint-config \
    --endpoint-config-name {{my-enhanced-metrics-config}} \
    --production-variants file://production-variants.json \
    --metrics-config file://metrics-config.json
```
Wobei `metrics-config.json` Folgendes enthält:  

```
{
    "EnableEnhancedMetrics": true,
    "MetricPublishFrequencyInSeconds": {{60}}
}
```

------

### Überprüfen Sie die Konfiguration der erweiterten Metriken
<a name="enhanced-metrics-verify-example"></a>

------
#### [ AWS SDK for Python (Boto3) ]

**Example Überprüfen Sie die Konfiguration der erweiterten Metriken**  

```
response = sagemaker_client.describe_endpoint_config(
    EndpointConfigName='{{my-enhanced-metrics-config}}'
)
print(response['MetricsConfig'])
# {'EnableEnhancedMetrics': True, 'MetricPublishFrequencyInSeconds': 60}

response = sagemaker_client.describe_endpoint(
    EndpointName='{{my-endpoint}}'
)
print(response['MetricsConfig'])
```

------
#### [ AWS CLI ]

**Example Überprüfen Sie die Konfiguration der erweiterten Metriken**  

```
aws sagemaker describe-endpoint-config \
    --endpoint-config-name {{my-enhanced-metrics-config}} \
    --query 'MetricsConfig'
```

```
aws sagemaker describe-endpoint \
    --endpoint-name {{my-endpoint}} \
    --query 'MetricsConfig'
```

------