tipica - ¿Cómo puedo calcular la mediana y la desviación estándar de una serie de números en Perl?
media y desviacion estandar (4)
Ver el artículo Cálculo de percentiles en aplicaciones de memoria . Explica cómo calcular la mediana y otros percentiles de manera eficiente.
Además, aquí hay un artículo sobre el cálculo de la desviación estándar (varianza) a medida que avanza: calcular con precisión la varianza en ejecución .
En nuestros archivos de registro almacenamos tiempos de respuesta para las solicitudes. ¿Cuál es la forma más eficiente de calcular el tiempo medio de respuesta, el "75/90/95% de las solicitudes fueron atendidas en menos de N tiempo" números, etc.? (Supongo que una variación de mi pregunta es: ¿Cuál es la mejor manera de calcular la mediana y la desviación estándar de una serie de números).
Lo mejor que se me ocurrió fue solo leer todos los números, ordenarlos y luego seleccionar los números, pero eso parece realmente ridículo. ¿No hay una manera más inteligente?
Usamos Perl, pero las soluciones para cualquier idioma pueden ser útiles.
puede ver la selección rápida:
http://en.wikipedia.org/wiki/Selection_algorithm
O en el algoritmo de Wirth: http://www.mail-archive.com/[email protected]/msg20059.html
El punto de referencia para la mediana se puede encontrar aquí: http://ndevilla.free.fr/median/median/index.html
Aquí hay ejemplos de código: http://rosettacode.org/wiki/Standard_Deviation
Eche un vistazo a PDL ... el lenguaje de datos de Perl.
También vea estas preguntas SO anteriores sobre mean / std dev:
- ¿Cómo calcular eficientemente una desviación estándar corriente?
- ¿Cómo puedo obtener el promedio y las desviaciones estándar agrupadas por clave?
- ¿Hay algún paquete de estadísticas de Perl que no me obligue a cargar todo el conjunto de datos a la vez?
/ I3az /