amazon web services - una - Grupos de escalamiento automático de AWS EC2: obtengo Mín. Y Máx., Pero ¿para qué sirve el límite de instancias deseadas?

tipos de instancia en aws (4)

Cuando configura un grupo de escalamiento automático en AWS EC2, los límites de Min y Max parecen tener sentido:

El número mínimo de instancias para escalar a base de políticas
El número máximo de instancias a escalar según las políticas

Sin embargo, nunca he sido capaz de entender qué diablos Desired afectar.

Siempre acabo de establecer Desired igual a Min , porque, en general, quiero pagarle a Amazon el diezmo mínimo posible, ya menos que necesite una instancia para manejar la carga, debe estar en el número Min de instancias.

Sé que si usa ElasticBeanstalk y establece un Min a 1 y Max a 2 establece un Desired en 2 (¡por supuesto!) - no puede elegir un valor para Desired .

¿Cuál sería el caso de uso para un número diferente de instancias Desired y cómo difiere? ¿Cuándo espera que AWS escale más bajo que su Desired si lo desea es mayor que Min ?

¿Cuándo espera que AWS escale más bajo que su Deseado si lo desea es mayor que Min?

Esto sucede cuando configura una alarma de CloudWatch basada en alguna política de AutoScaling. Cada vez que se active esa alarma, actualizará el DesiredCount a lo que se menciona en config.

por ejemplo, si una configuración AutoScalingGroup tiene Min = 1, Deseado = 3, Máx. = 5 y hay una Alarma configurada en una AutoScalingPolicy que dice que si el uso de la CPU es <50% durante 10 minutos consecutivos, entonces Remove 1 instances luego reducirá la el recuento de instancias por 1 cada vez que se activa la alarma hasta el DesiredCount = MinCount.

Lecciones aprendidas: configure MinCount para que sea> 0 o = DesiredCount. Esto se asegurará de que la aplicación no se caiga cuando mincount = 0 y el uso de la CPU disminuye.

De acuerdo con mi lectura, en términos DesiredCapacity , el valor de DesiredCapacity se actualiza automáticamente en los eventos scale-in y scale-out.

En otras palabras,

Scale-in o Scale-out se hacen disminuyendo o aumentando el valor de la DesiredCapacity .

Estas son las explicaciones para los valores "mínimo, deseado y máximo" del soporte de AWS:

MIN: Esta será la cantidad mínima de instancias que se pueden ejecutar en su grupo de escala automática. Si se activa su báscula de alarma de CloudWatch, su grupo de escala automática nunca terminará las instancias debajo de este número
DESEADO: Si activa una alarma de CloudWatch para un evento de ampliación, notificará al escalador automático para que cambie el valor deseado a una cantidad especificada mayor y el escalador automático iniciará una o varias instancias para cumplir ese número. Si activa una alarma de CloudWatch para escalar, entonces cambiará el escalador automático deseado a un número inferior especificado y el escalador automático terminará la / s instancia / s para llegar a ese número.
MAX: Esta será la cantidad máxima de instancias que puede ejecutar en su grupo de escala automática. Si su escala de alarma de CloudWatch permanece activada, su grupo de escala automática nunca creará instancias superiores a la cantidad máxima especificada.

Piénselo como un elemento UI de rango deslizante.

Con mín. Y máx., Está configurando el límite inferior de la escala de su instancia. Con la capacidad deseada, está configurando lo que le gustaría que el recuento de instancias fluctúe.

Ejemplo: usted sabe que su aplicación tendrá mucha carga debido a un correo electrónico de marketing o al lanzamiento del producto ... simplemente amplíe de antemano su capacidad deseada:

aws autoscaling set-desired-capacity --auto-scaling-group-name my-auto-scaling-group --desired-capacity 2 --honor-cooldown

Source