Formatos de datos de inferencia de Información IP - Amazon SageMaker AI

Formatos de datos de inferencia de Información IP

Lo que sigue son los formatos de entrada y salida disponibles para el algoritmo IP Insights. Los algoritmos integrados de Amazon SageMaker AI siguen el formato de inferencia de entrada común descrito en Formatos de datos comunes para la inferencia. Sin embargo, el algoritmo de SageMaker AI IP Insights actualmente no admite el formato RecordIO.

Formatos de solicitud de entrada de Información IP

INPUT: Formato CSV

El archivo CSV debe tener dos columnas. La primera columna es una cadena opaca que corresponde a un identificador único de la entidad. La segunda columna es la dirección IPv4 del evento de acceso de la entidad en formato decimal con punto.

content-type: text/csv

entity_id_1, 192.168.1.2 entity_id_2, 10.10.1.2

INPUT: Formato JSON

Los datos JSON se puede proporcionar en diferentes formatos. IP Insights sigue los formatos SageMaker AI comunes. Para obtener más información sobre los formatos de inferencia, consulte Formatos de datos comunes para la inferencia.

content-type: application/json

{ "instances": [ {"data": {"features": {"values": ["entity_id_1", "192.168.1.2"]}}}, {"features": ["entity_id_2", "10.10.1.2"]} ] }

INPUT: Formato JSONLINES

El tipo de contenido JSON Lines es útil para la ejecución de los trabajos de transformación por lotes. Para obtener más información sobre formatos de inferencia de SageMaker AI, consulte Formatos de datos comunes para la inferencia. Para obtener más información sobre la ejecución de los trabajos de transformación por lotes, consulte Transformación por lotes para inferencias con Amazon SageMaker AI.

content-type: application/jsonlines

{"data": {"features": {"values": ["entity_id_1", "192.168.1.2"]}}}, {"features": ["entity_id_2", "10.10.1.2"]}]

Formatos de respuesta de salida de Información IP

SALIDA: Formato de respuesta JSON

La salida predeterminada del algoritmo SageMaker AI IP Insights es el dot_product entre la entidad de entrada y la dirección IP. El dot_product indica el grado de compatibilidad de la entidad y dirección IP según lo determina el modelo. El dot_product es ilimitado. Para realizar predicciones sobre si un evento es anómalo, debe establecer un umbral basado en función de su distribución definida. Para obtener información sobre cómo utilizar el dot_product para la detección de anomalías, consulte An Introduction to the SageMaker AI IP Insights Algorithm.

accept: application/json

{ "predictions": [ {"dot_product": 0.0}, {"dot_product": 2.0} ] }

Los usuarios avanzados pueden acceder a la entidad aprendida del modelo e incrustaciones IP proporcionando el parámetro de tipo de contenido adicional verbose=True en el encabezado Aceptar. Puede utilizar entity_embedding e ip_embedding para la depuración, visualización y comprensión del modelo. Además, puede utilizar estas incrustaciones en otras técnicas de machine learning, como clasificación clustering.

accept: application/json;verbose=True

{ "predictions": [ { "dot_product": 0.0, "entity_embedding": [1.0, 0.0, 0.0], "ip_embedding": [0.0, 1.0, 0.0] }, { "dot_product": 2.0, "entity_embedding": [1.0, 0.0, 1.0], "ip_embedding": [1.0, 0.0, 1.0] } ] }

SALIDA: Formato de respuesta JSONLINES

accept: application/jsonlines

{"dot_product": 0.0} {"dot_product": 2.0}

accept: application/jsonlines; verbose=True

{"dot_product": 0.0, "entity_embedding": [1.0, 0.0, 0.0], "ip_embedding": [0.0, 1.0, 0.0]} {"dot_product": 2.0, "entity_embedding": [1.0, 0.0, 1.0], "ip_embedding": [1.0, 0.0, 1.0]}