¿Cuál es la tasa máxima de solicitudes que puede manejar una aplicación web?

¿Cuál es la tasa máxima de solicitudes que puede manejar una aplicación web?

La respuesta depende de muchas cosas, pero principalmente:

  • Qué poderoso es el servidor web. Es posible que necesite un servidor con muchos núcleos de CPU y mucha RAM, o incluso varios servidores.
  • Lo que cada solicitud está haciendo. ¿Cuánto código debe ejecutarse para cada solicitud? ¿El código necesita acceder a un recurso más lento como una base de datos?
  • ¿Cuántas solicitudes pueden ejecutarse simultáneamente? ¿O las solicitudes necesitan acceder a algún recurso común que limite su paralelismo?

El diseño de aplicaciones web para una tasa muy alta de solicitudes es un área compleja de especialización. Es posible que desee leer un libro como Arquitectura de Internet escalable de Theo Schlossnagle. También habla sobre la escalabilidad. Aquí hay un breve extracto de una de sus charlas. Hay más videos en la página a la que enlacé.

Cuando se prueba la carga de una aplicación, el primer conjunto de pruebas debe centrarse en medir el rendimiento máximo. Esto es especialmente cierto en el caso de las aplicaciones interactivas para múltiples usuarios, como las aplicaciones web. El rendimiento máximo se mide mejor ejecutando algunos usuarios emulados con cero tiempo de reflexión. Esto significa que cada usuario emulado envía una solicitud, recibe una respuesta e inmediatamente regresa para enviar la siguiente solicitud. Aunque esto es artificial, es la mejor manera de determinar rápidamente el rendimiento máximo de la infraestructura del servidor.

Estimación de usuarios máximos que una aplicación puede admitir