linq standard-deviation

Desviación estándar en LINQ



standard-deviation (5)

¿LINQ modela la función SQL agregada STDDEV() (desviación estándar)?

Si no, ¿cuál es la forma más simple / de mejores prácticas para calcularlo?

Ejemplo:

SELECT test_id, AVERAGE(result) avg, STDDEV(result) std FROM tests GROUP BY test_id


Esto convierte la respuesta de David Clarke en una extensión que sigue la misma forma que las otras funciones agregadas de LINQ como Promedio.

El uso sería: var stdev = data.StdDev(o => o.number)

public static class Extensions { public static double StdDev<T>(this IEnumerable<T> list, Func<T, double> values) { // ref: https://.com/questions/2253874/linq-equivalent-for-standard-deviation // ref: http://warrenseen.com/blog/2006/03/13/how-to-calculate-standard-deviation/ var mean = 0.0; var sum = 0.0; var stdDev = 0.0; var n = 0; foreach (var value in list.Select(values)) { n++; var delta = value - mean; mean += delta / n; sum += delta * (value - mean); } if (1 < n) stdDev = Math.Sqrt(sum / (n - 1)); return stdDev; } }


La respuesta de Dynami funciona pero realiza múltiples pases a través de los datos para obtener un resultado. Este es un método de pase único que calcula la desviación estándar de la muestra :

public static double StdDev(this IEnumerable<double> values) { // ref: http://warrenseen.com/blog/2006/03/13/how-to-calculate-standard-deviation/ double mean = 0.0; double sum = 0.0; double stdDev = 0.0; int n = 0; foreach (double val in values) { n++; double delta = val - mean; mean += delta / n; sum += delta * (val - mean); } if (1 < n) stdDev = Math.Sqrt(sum / (n - 1)); return stdDev; }

Esta es la desviación estándar de muestra ya que se divide por n - 1 . Para la desviación estándar normal, necesita dividir por n lugar.

Esto utiliza el método de Welford, que tiene una mayor precisión numérica en comparación con el método Average(x^2)-Average(x)^2 .


Puedes hacer tu propia extensión calculandolo

public static class Extensions { public static double StdDev(this IEnumerable<double> values) { double ret = 0; int count = values.Count(); if (count > 1) { //Compute the Average double avg = values.Average(); //Perform the Sum of (value-avg)^2 double sum = values.Sum(d => (d - avg) * (d - avg)); //Put it all together ret = Math.Sqrt(sum / count); } return ret; } }

Si tiene una muestra de la población en lugar de toda la población, entonces debe usar ret = Math.Sqrt(sum / (count - 1)); .

Transformado en extensión de Agregar desviación estándar a LINQ por Chris Bennett .


public static double StdDev(this IEnumerable<int> values, bool as_sample = false) { var count = values.Count(); if (count > 0) // check for divide by zero // Get the mean. double mean = values.Sum() / count; // Get the sum of the squares of the differences // between the values and the mean. var squares_query = from int value in values select (value - mean) * (value - mean); double sum_of_squares = squares_query.Sum(); return Math.Sqrt(sum_of_squares / (count - (as_sample ? 1 : 0))) }


var stddev = Math.Sqrt(data.Average(z=>z*z)-Math.Pow(data.Average(),2));