tipica - ¿Cómo puedo calcular la mediana y la desviación estándar de una serie de números en Perl?

media y desviacion estandar (4)

Ver el artículo Cálculo de percentiles en aplicaciones de memoria . Explica cómo calcular la mediana y otros percentiles de manera eficiente.

Además, aquí hay un artículo sobre el cálculo de la desviación estándar (varianza) a medida que avanza: calcular con precisión la varianza en ejecución .

En nuestros archivos de registro almacenamos tiempos de respuesta para las solicitudes. ¿Cuál es la forma más eficiente de calcular el tiempo medio de respuesta, el "75/90/95% de las solicitudes fueron atendidas en menos de N tiempo" números, etc.? (Supongo que una variación de mi pregunta es: ¿Cuál es la mejor manera de calcular la mediana y la desviación estándar de una serie de números).

Lo mejor que se me ocurrió fue solo leer todos los números, ordenarlos y luego seleccionar los números, pero eso parece realmente ridículo. ¿No hay una manera más inteligente?

Usamos Perl, pero las soluciones para cualquier idioma pueden ser útiles.

puede ver la selección rápida:

http://en.wikipedia.org/wiki/Selection_algorithm

O en el algoritmo de Wirth: http://www.mail-archive.com/[email protected]/msg20059.html

El punto de referencia para la mediana se puede encontrar aquí: http://ndevilla.free.fr/median/median/index.html

Aquí hay ejemplos de código: http://rosettacode.org/wiki/Standard_Deviation

Eche un vistazo a PDL ... el lenguaje de datos de Perl.

También vea estas preguntas SO anteriores sobre mean / std dev:

/ I3az /