test stats interval importar confidence python scipy statistics confidence-interval t-test

interval - scipy.stats python



¿Cómo interpretar el límite superior/inferior de un punto de datos con intervalos de confianza? (2)

En breve

Su llamada da el intervalo de confianza para el parámetro medio de una ley normal de parámetros desconocidos de la que observó 100 observaciones con un promedio de 10 y un stdv de 29. Además, no es correcto interpretarlo, ya que su distribución claramente no es normal, y porque 10 no es la media observada.

TL; DR

Hay muchos conceptos erróneos que flotan en torno a los intervalos de confianza, la mayoría de los cuales aparentemente provienen de un malentendido de lo que estamos seguros. Debido a que existe cierta confusión en su comprensión del intervalo de confianza, tal vez una explicación más amplia le dará una comprensión más profunda de los conceptos que está manejando y, con suerte, descartará cualquier fuente de error.

Limpiando conceptos erróneos

Muy brevemente para configurar las cosas. Estamos en una situación en la que queremos estimar un parámetro, o más bien, queremos probar una hipótesis para el valor de un parámetro que parametriza la distribución de una variable aleatoria. Ejemplo: Supongamos que tengo una variable distribuida normalmente X con media m y desviación estándar sigma, y ​​quiero probar la hipótesis m = 0.

¿Qué es una prueba paramétrica?

Este es un proceso para probar una hipótesis sobre un parámetro para una variable aleatoria. Como solo tenemos acceso a observaciones que son realizaciones concretas de la variable aleatoria, generalmente se procede al calcular una estadística de estas realizaciones. Una estadística es más o menos una función de las realizaciones de una variable aleatoria. Llamemos a esta función S, podemos calcular S en x_1, ..., x_n, que son tantas realizaciones de X.

¡Por lo tanto, usted comprende que S (X) también es una variable aleatoria con distribución, parámetros, etc.! La idea es que para las pruebas estándar, S (X) sigue una distribución muy conocida para la que se tabulan los valores. eg: http://www.sjsu.edu/faculty/gerstman/StatPrimer/t-table.pdf

¿Qué es un intervalo de confianza?

Dado lo que acabamos de decir, una definición para un intervalo de confianza sería: el rango de valores para el parámetro probado, de modo que si las observaciones se hubieran generado a partir de una distribución parametrizada por un valor en ese rango, no lo haría tener probabilistically improbable. En otras palabras, un intervalo de confianza da una respuesta a la pregunta: dadas las siguientes observaciones x_1, ..., x_n n realizaciones de X, podemos decir con confianza que la distribución de X está parametrizada por dicho valor. 90%, 95%, etc. ... afirma el nivel de confianza. Por lo general, las restricciones externas fijan este nivel (normas industriales para la evaluación de la calidad, normas científicas, por ejemplo: para el descubrimiento de nuevas partículas).

Creo que ahora es intuitivo para ti que:

  1. Cuanto mayor sea el nivel de confianza, mayor será el intervalo de confianza. por ejemplo, para una confianza del 100%, el intervalo de confianza oscilaría entre todos los valores posibles tan pronto como haya alguna incertidumbre

  2. Para la mayoría de las pruebas, bajo condiciones que no describiré, cuantas más observaciones tengamos, más podremos restringir el intervalo de confianza.

Con un 90% de confianza, sabemos que el punto de datos 10 cae en el intervalo (9.6345012890050086, 10.365498710994991)

Es incorrecto decir eso y es la fuente más común de errores. Un intervalo de confianza del 90% nunca significa que el parámetro estimado tenga un 90% de probabilidad de caer en ese intervalo. Cuando se calcula el intervalo, cubre el parámetro o no, ya no es una cuestión de probabilidad. 90% es una evaluación de la confiabilidad del procedimiento de estimación .

¿Qué es una prueba de estudiante?

Ahora vamos a su ejemplo y miremos bajo las luces de lo que acabamos de decir. Usted debe aplicar una prueba de Estudiante a su lista de observaciones. Primero: una prueba de estudiante tiene como objetivo probar una hipótesis de igualdad entre la media m de una variable aleatoria distribuida normalmente con una desviación estándar desconocida y un cierto valor m_0.

La estadística asociada con esta prueba es t = (np.mean(x) - m_0)/(s/sqrt(n)) donde x es su vector de observaciones, n el número de observaciones y s la desviación estándar empírica . Sin sorpresa, esto sigue una distribución de Estudiantes.

Por lo tanto, lo que quiere hacer es:

  1. calcule esta estadística para su muestra, calcule el intervalo de confianza asociado con una distribución de Estudiante con tantos grados de libertad, esta media teórica y nivel de confianza

  2. mira si tu t calculado cae en ese intervalo, lo que te indica si puedes descartar la hipótesis de igualdad con ese nivel de confianza.

Quería darte un ejercicio, pero creo que he sido lo suficientemente largo.

Para concluir sobre el uso de scipy.stats.t.interval . Puedes usarlo de una de dos maneras. Calcula el estadístico t con la fórmula que se muestra arriba y comprueba si t se ajusta en el intervalo devuelto por el interval(alpha, df) donde df es la duración del muestreo. O puede llamar directamente al interval(alpha, df, loc=m, scale=s) donde m es su media empírica, y s la desviación estándar empírica (dividida por sqrt (n)). En tal caso, el intervalo devuelto será directamente el intervalo de confianza para la media.

Entonces, en su caso, su llamada da el intervalo de confianza para el parámetro medio de una ley normal de parámetros desconocidos de la cual observó 100 observaciones con un promedio de 10 y un stdv de 29. Además, no es correcto interpretarlo, además del parámetro error de interpretación que ya he señalado, ya que su distribución claramente no es normal, y porque 10 no es la media observada.

Recursos

Puede consultar los siguientes recursos para ir más allá.

enlaces de wikipedia para tener referencias rápidas y una visión general elborada

https://en.wikipedia.org/wiki/Confidence_interval

https://en.wikipedia.org/wiki/Student%27s_t-test

https://en.wikipedia.org/wiki/Student%27s_t-distribution

Para llegar más lejos

http://osp.mans.edu.eg/tmahdy/papers_of_month/0706_statistical.pdf

No lo he leído, pero el de abajo parece bastante bueno. https://web.williams.edu/Mathematics/sjmiller/public_html/BrownClasses/162/Handouts/StatsTests04.pdf

También debería verificar los valores de p, encontrará muchas similitudes y espero que los comprenda mejor después de leer esta publicación.

https://en.wikipedia.org/wiki/P-value#Definition_and_interpretation

Dada una lista de valores:

>>> from scipy import stats >>> import numpy as np >>> x = list(range(100))

Utilizando la prueba t de Student, puedo encontrar el intervalo de confianza de la distribución en la media con un alfa de 0.1 (es decir, al 90% de confianza) con:

def confidence_interval(alist, v, itv): return stats.t.interval(itv, df=len(alist)-1, loc=v, scale=stats.sem(alist)) x = list(range(100)) confidence_interval(x, np.mean(x), 0.1)

[fuera]:

(49.134501289005009, 49.865498710994991)

Pero si tuviera que encontrar el intervalo de confianza en cada punto de datos, por ejemplo, para el valor 10 :

>>> confidence_interval(x, 10, 0.1) (9.6345012890050086, 10.365498710994991)

¿Cómo debe interpretarse el intervalo de los valores? ¿Es un sonido estadístico / matemático interpretar eso en absoluto?

¿Va algo así como:

Con un 90% de confianza, sabemos que el punto de datos 10 cae en el intervalo (9.6345012890050086, 10.365498710994991) ,

alias

Con un 90% de confianza, podemos decir que el punto de datos cae a 10 + - 0.365 ...

Entonces, ¿podemos interpretar el intervalo como una especie de diagrama de caja del punto de datos?


Los intervalos de confianza son irremediablemente contraintuitivos. Especialmente para programadores, me atrevo a decir que como programador.

Wikipedida usa un 90% de confianza para ilustrar una posible interpretación:

Si este procedimiento se repitiera en numerosas muestras, la fracción de intervalos de confianza calculados (que diferirían para cada muestra) que abarque el parámetro de población real tenderá hacia el 90%.

En otras palabras

  1. El intervalo de confianza proporciona información sobre un parámetro estadístico (como la media) de una muestra.
  2. La interpretación de, por ejemplo, un intervalo de confianza del 90% sería: Si repite el experimento un número infinito de veces, el 90% de los intervalos de confianza resultantes contendrán el parámetro verdadero.

Suponiendo que el código para calcular el intervalo es correcto (que no he verificado) puede usarlo para calcular el intervalo de confianza de la media (debido a la distribución t , que modela la media muestral de una población distribuida normalmente con desviación estándar desconocida) )

Para fines prácticos, tiene sentido pasar la media de la muestra. De lo contrario, usted está diciendo " si fingiera que mis datos tenían una media muestral de, por ejemplo, 10, el intervalo de confianza de la media sería [9.6, 10.3] ".

Los datos particulares pasados ​​al intervalo de confianza tampoco tienen sentido. Es muy poco probable que los números que aumentan en un rango de 0 a 99 sean extraídos de una distribución normal.