ejemplos sql sql-server tsql stdevp stdev

ejemplos - stdevp sql



SQL-STDEVP o STDEV y cómo usarlo? (3)

En general, debe usar STDEV cuando tenga que estimar la desviación estándar en base a una muestra. Pero si tiene datos completos de columna dados como argumentos, entonces use STDEVP .

En general, si sus datos representan a toda la población, use STDEVP ; de lo contrario, utilice STDEV .

Tenga en cuenta que para muestras grandes, las funciones devuelven casi el mismo valor, por lo que es mejor usar STDEV en este caso.

Tengo una mesa

LocationId OriginalValue Mean 1 0.45 3.99 2 0.33 3.99 3 16.74 3.99 4 3.31 3.99

Etcétera...

¿Cómo puedo calcular la Standard Deviation utilizando esta tabla y también qué recomendaría: STDEVP o STDEV ?


En las estadísticas hay dos tipos de desviaciones estándar: una para una muestra y otra para una población. La desviación estándar de la muestra, generalmente indicada por la letra s, se utiliza como una estimación de la desviación estándar de la población. La desviación estándar de la población, generalmente indicada por la letra griega sigma minúscula, se utiliza cuando los datos constituyen la población completa. Es difícil responder a su pregunta directamente (muestra o población) porque es difícil decir con qué está trabajando: una muestra o una población. A menudo depende del contexto. Considere el siguiente ejemplo. Si quiero saber la desviación estándar de la edad de los estudiantes en mi clase, entonces u = usaría STDEVP porque la clase es mi población. Pero si quiero usar mi clase como una muestra de la población de todos los estudiantes en la escuela (esto sería lo que se conoce como una muestra de conveniencia, y probablemente estaría sesgada, pero estoy divagando), entonces usaría STDEV porque mi La clase es una muestra. El valor resultante sería mi mejor estimación de STDEVP. Como se mencionó anteriormente (1) para tamaños de muestra grandes (por ejemplo, más de treinta), la diferencia entre los dos se vuelve trivial, y (2) generalmente debe usar STDEV, no STDEVP, porque en la práctica generalmente no tenemos acceso a la población. De hecho, se podría argumentar que si siempre tuviéramos acceso a las poblaciones, no necesitaríamos estadísticas. Todo el punto de la estadística inferencial es poder hacer inferencias sobre una población basada en la muestra.


Para usarlo, simplemente:

SELECT STDEVP(OriginalValue) FROM yourTable

Desde abajo, es probable que desee STDEVP .

Desde here

STDEV se usa cuando el grupo de números que se evalúa es solo una muestra parcial de toda la población. El denominador para dividir la suma de las desviaciones al cuadrado es N-1, donde N es el número de observaciones (un recuento de elementos en el conjunto de datos). Técnicamente, restar el 1 se conoce como "no sesgado".

STDEVP se usa cuando el grupo de números que se evalúa está completo, es la totalidad de la población de valores. En este caso, el 1 NO se resta y el denominador para dividir la suma de las desviaciones al cuadrado es simplemente N, el número de observaciones (un recuento de elementos en el conjunto de datos). Técnicamente, esto se conoce como "sesgado". Recordar que la P en STDEVP significa "población" puede ser útil. Dado que el conjunto de datos no es una mera muestra, sino que está constituido por TODOS los valores reales, esta función de desviación estándar puede devolver un resultado más preciso.