View a markdown version of this page

Envío del trabajo a un clúster de Amazon EMR - Amazon EMR

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Envío del trabajo a un clúster de Amazon EMR

En esta sección se describen los métodos que puede utilizar para enviar el trabajo a un clúster de Amazon EMR. Para enviar el trabajo, puede agregar pasos o enviar los trabajos de Hadoop de forma interactiva al nodo principal.

Tenga en cuenta las siguientes reglas de comportamiento de los pasos al enviar los pasos a un clúster:

  • El ID de paso puede contener un máximo de 256 caracteres.

  • Puede tener hasta 256 pasos pendientes y en ejecución en un clúster.

  • Incluso si tiene 256 pasos activos en ejecución en el clúster, puede enviar trabajos de forma interactiva al nodo principal. Puede enviar un número ilimitado de pasos a lo largo de la vida útil de un clúster en ejecución prolongada, pero solo puede haber 256 pasos en ejecución o pendientes en un momento dado.

  • Con las versiones 4.8.0 y posteriores de Amazon EMR, excepto la versión 5.0.0, puede cancelar los pasos pendientes. Para obtener más información, consulte Cancelación de pasos al enviar trabajo a un clúster de Amazon EMR.

  • Con las versiones 5.28.0 y posteriores de Amazon EMR, puede cancelar los pasos pendientes y en ejecución. También puede optar por ejecutar varios pasos en paralelo para mejorar la utilización del clúster y ahorrar costos. Para obtener más información, consulte Consideraciones para ejecutar varios pasos en paralelo al enviar un trabajo a Amazon EMR.

  • Con Amazon EMR, versión 7.14.0 y versiones posteriores, el número máximo de pasos que puede añadir o cancelar por solicitud es de 100. Con las versiones anteriores, el máximo es de 256 pasos por solicitud.

nota

Para obtener el mejor rendimiento, le recomendamos que almacene las acciones de arranque personalizadas, los scripts y otros archivos que desee utilizar con Amazon EMR en un bucket de Amazon S3 que se encuentre en el Región de AWS mismo lugar que su clúster.