¿Qué es Auto Scaling de aplicaciones? - Aplicación de escalado automático

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

¿Qué es Auto Scaling de aplicaciones?

Application Auto Scaling es un servicio web para desarrolladores y administradores de sistemas que necesitan una solución para escalar automáticamente sus recursos escalables para AWS servicios individuales más allá de Amazon EC2 Auto Scaling. Con Application Auto Scaling, puede configurar el escalado automático para los siguientes recursos:

  • AppStream Flotas 2.0

  • Réplicas de Aurora

  • Puntos de conexión de reconocedor de identidades y clasificación de documentos de Amazon Comprehend

  • Tablas de DynamoDB e índices secundarios globales

  • Servicios de Amazon ECS

  • ElastiCache grupos de replicación (Redis OSS y Valkey) y clústeres de Memcached

  • Clústeres de Amazon EMR

  • Tablas de Amazon Keyspaces (for Apache Cassandra)

  • Disponibilidad aprovisionada con la función Lambda

  • Almacenamiento de agente Amazon Managed Streaming for Apache Kafka (MSK)

  • Clústeres de Amazon Neptune

  • SageMaker variantes de puntos finales de IA

  • SageMaker Componentes de inferencia de IA

  • SageMaker Simultaneidad aprovisionada sin servidor de IA

  • Solicitudes de flota de spot

  • Pool de Amazon WorkSpaces

  • Los recursos personalizados proporcionados por sus propias aplicaciones o servicios. Para obtener más información, consulta el GitHubrepositorio.

Para ver la disponibilidad regional de cualquiera de los AWS servicios enumerados anteriormente, consulte la tabla de regiones Tabla de .

Para obtener información sobre cómo escalar su flota de EC2 instancias de Amazon mediante grupos de Auto Scaling, consulte la Guía del usuario de Amazon EC2 Auto Scaling.

Características de Auto Scaling de aplicaciones

Auto Scaling de aplicaciones lo permite escalar automáticamente sus recursos escalables en función de las condiciones que defina.

  • Escalado de seguimiento de objetivos: escale un recurso en función del valor objetivo de una CloudWatch métrica específica.

  • Escalado por pasos: escala un recurso en función de un conjunto de ajustes de escalado que varían según el tamaño de la vulneración de la alarma.

  • Escalado programado: escala un recurso solo una vez o según un programa periódico.

  • Escalamiento predictivo: escale un recurso de forma proactiva para que coincida con la carga prevista en función de los datos históricos.

Trabajar con Application Auto Scaling

Puede configurar el escalado con las siguientes interfaces según el recurso que esté escalando:

Para conectarse mediante programación a un dispositivo Servicio de AWS, se utiliza un punto final. Para obtener información sobre los puntos de enlace de las llamadas a Application Auto Scaling, consulte los puntos de enlace y las cuotas de Application Auto Scaling en los Referencia general de AWS