Cloud computing 2 min

Autoescalado

Auto scaling

En una frase

Capacidad de añadir o quitar servidores automáticamente según la demanda, para no pagar de más en horas tranquilas ni caerse en los picos.

Qué es Autoescalado

El autoescalado ajusta solo la cantidad de recursos: cuando el tráfico o el uso de CPU sube de cierto umbral, lanza más instancias; cuando baja, las apaga. Mantiene el rendimiento sin sobredimensionar permanentemente y es una de las grandes ventajas del modelo cloud.

Cómo funciona

Defines un grupo de instancias con un mínimo y un máximo, y reglas (p. ej. "si la CPU media supera el 70% durante 5 minutos, añade una instancia"). Un balanceador de carga reparte el tráfico entre las activas. Al bajar la demanda, se retiran instancias sobrantes. También puede programarse por horarios previsibles.

Cuándo usarlo

Para tráfico variable: tiendas con campañas, eventos, picos estacionales, apps que crecen a saltos. No aporta nada si tu carga es plana y constante (ahí, capacidad fija sale más barata).

Datos curiosos

Mal configurado puede "escalar a la luna" y dispararte la factura; conviene poner un máximo.
El escalado horizontal (más instancias) es el habitual en cloud; el vertical (más recursos a una) suele requerir reinicio.
Los servicios serverless escalan automáticamente "hasta cero" cuando nadie los usa.

Preguntas frecuentes

¿Funciona solo?

Sí, según las reglas que definas. Pero hay que afinarlas y poner un tope para evitar costes desbocados.

¿Lo necesito si mi tráfico es estable?

No realmente. Su valor está en absorber picos y ahorrar en valles.

¿Necesita balanceador de carga?

Sí: alguien tiene que repartir el tráfico entre las instancias que van apareciendo y desapareciendo.