Almacenamiento en línea
El almacenamiento en línea es un almacén de datos de baja latencia y alta disponibilidad que proporciona una búsqueda de características en tiempo real. Por lo general, se utiliza para atender modelos de machine learning (ML). Cuando cree un grupo de características, puede elegir entre el almacenamiento en línea estándar (Standard) o el almacenamiento en línea integrada en la memoria (InMemory). De esta forma, puede seleccionar el tipo de almacenamiento que mejor se adapte a los patrones de lectura y escritura de una aplicación concreta, teniendo en cuenta el rendimiento y el costo. Para obtener más información sobre los precios, consulte Precios de Amazon SageMaker
El almacenamiento en línea contiene las siguientes opciones de StorageType. Para obtener más información sobre el contenido del almacenamiento en línea, consulte OnlineStoreConfig.
Tipo de almacenamiento estándar
El nivel Standard es un almacén de datos administrado de baja latencia para los grupos de características del almacenamiento en línea. Proporciona una recuperación rápida de datos para atender modelos de ML para sus aplicaciones. Standard es el tipo de almacenamiento predeterminado.
Tipo de almacenamiento en memoria
El nivel InMemory es un almacén de datos administrado para los grupos de características del almacenamiento en línea que admite recuperaciones de muy baja latencia. Proporciona una recuperación de datos a gran escala en tiempo real para atender los modelos de ML que se utilizan en aplicaciones de alto rendimiento. El nivel InMemory se basa en Amazon ElastiCache (Redis OSS). Para obtener más información, consulte What is Amazon ElastiCache (Redis OSS)?
El nivel InMemory del almacenamiento en línea admite los tipos de colección, a saber, lista, conjunto y vector. Para obtener más información sobre los tipos de colección InMemory, consulte Tipos de colección.
El almacén de características proporciona lectura y escritura de baja latencia al almacenamiento en línea. La latencia de la aplicación consta principalmente de dos componentes: latencia de infraestructura o red y latencia de API del almacén de características. La reducción de la latencia de la red ayuda a obtener las lecturas y escrituras con la latencia más baja en el almacén de características. Puede reducir la latencia de la red en el almacén de características con la implementación de AWS PrivateLink en el punto de conexión del tiempo de ejecución del almacén de características. Con AWS PrivateLink, puede acceder de forma privada a todas las operaciones de la API de tiempo de ejecución del almacén de características desde su nube privada virtual (VPC) de Amazon de forma escalable mediante puntos de conexión de VPC de interfaz. Una implementación AWS PrivateLink con la opción privateDNSEnabled establecida en verdadera:
-
Mantiene todo el tráfico de lectura/escritura del almacén de características dentro de su VPC.
-
Mantiene el tráfico de invocación en la misma AZ que el cliente que lo originó al utilizar el almacén de características. Esto evita los “saltos” entre las AZ y reduce la latencia de red.
Siga los pasos en Acceda a un Servicio de AWS mediante un punto de conexión de VPC de interfaz para configurar AWS PrivateLink en el almacén de características. El nombre del servicio para el tiempo de ejecución del almacén de características en AWS PrivateLink es com.amazonaws.region.sagemaker.featurestore-runtime.
El nivel InMemory del almacenamiento en línea se escala automáticamente en función del uso del almacenamiento y las solicitudes. El escalado automatizado puede tardar unos minutos en adaptarse a un nuevo patrón de uso si este cambia rápidamente. Durante el escalado automatizado:
-
Las operaciones de escritura en el grupo de características pueden recibir errores de limitación. Debe volver a intentar realizar las solicitudes unos minutos más tarde.
-
Las operaciones de lectura en el grupo de características pueden recibir errores de limitación. En este caso, son adecuadas las estrategias de reintento estándar.
-
Es posible que las operaciones de lectura sufran una alta latencia.
El tamaño máximo predeterminado del grupo de características del nivel InMemory es 50 GiB.
Tenga en cuenta que, actualmente, el nivel InMemory solo admite grupos de características en línea, no grupos de características en línea y sin conexión, por lo que no hay replicación entre el almacenamiento sin conexión y en línea para el nivel InMemory. Además, actualmente, el nivel InMemory no admite claves de KMS administradas por el cliente.