Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Algoritmos de Built-in SageMaker IA no supervisados
Amazon SageMaker AI proporciona varios algoritmos integrados que se pueden usar para una variedad de tareas de aprendizaje sin supervisión, como la agrupación en clústeres, la reducción de dimensiones, el reconocimiento de patrones y la detección de anomalías.
-
Información de IP: aprende los patrones de uso de las direcciones IPv4. Está diseñado para capturar asociaciones entre las direcciones IPv4 y diversas entidades, como ID de usuario o números de cuenta.
-
K-Means Algoritmo: busca agrupaciones discretas dentro de datos; en estas, los miembros de un mismo grupo tienen el mayor grado de similitud posible entre sí, pero el menor grado de similitud posible con respecto a los miembros de otros grupos.
-
Algoritmo de análisis de componente principal (PCA): reduce la dimensionalidad (número de características) dentro de un conjunto de datos mediante la proyección de puntos de datos en los primeros componentes principales. El objetivo es retener la mayor cantidad de información o variación posible. Para los matemáticos, los componentes principales son los vectores propios de la matriz de covarianza de los datos.
-
Algoritmo de bosque de corte aleatorio (RCF): detecta puntos de datos anómalos dentro de un conjunto de datos divergente con respecto a datos que, por todo lo demás, tienen un buen nivel de organización o uniformidad.
| Nombre de algoritmo | Nombre de canal | Modo de entrada de capacitación | Tipo de archivo | Clase de instancia | Paralelizable |
|---|---|---|---|---|---|
| Información de IP | capacitación y validación (opcional) | Archivos | CSV | CPU o GPU | Sí |
| K-Means | capacitación y prueba (opcional) | Archivo o canalización | registro o CSV IO-protobuf | CPU o GPUCommon (dispositivo de GPU único en una o varias instancias) | No |
| PCA | capacitación y prueba (opcional) | Archivo o canalización | registro IO-protobuf o CSV | GPU o CPU | Sí |
| Bosque de corte aleatorio | capacitación y prueba (opcional) | Archivo o canalización | registro IO-protobuf o CSV | CPU | Sí |