Python - Valor p
El valor p se refiere a la fuerza de una hipótesis. Construimos hipótesis basadas en algún modelo estadístico y comparamos la validez del modelo usando el valor p. Una forma de obtener el valor p es mediante la prueba T.
Esta es una prueba de dos caras para la hipótesis nula de que el valor esperado (media) de una muestra de observaciones independientes 'a' es igual a la media poblacional dada, popmean. Consideremos el siguiente ejemplo.
from scipy import stats
rvs = stats.norm.rvs(loc = 5, scale = 10, size = (50,2))
print stats.ttest_1samp(rvs,5.0)
El programa anterior generará la siguiente salida.
Ttest_1sampResult(statistic = array([-1.40184894, 2.70158009]),
pvalue = array([ 0.16726344, 0.00945234]))
Comparando dos muestras
En los siguientes ejemplos, hay dos muestras, que pueden provenir de la misma distribución o de una distribución diferente, y queremos probar si estas muestras tienen las mismas propiedades estadísticas.
ttest_ind- Calcula la prueba T para las medias de dos muestras independientes de puntuaciones. Ésta es una prueba de dos caras para la hipótesis nula de que dos muestras independientes tienen valores promedio (esperados) idénticos. Esta prueba asume que las poblaciones tienen variaciones idénticas por defecto.
Podemos utilizar esta prueba, si observamos dos muestras independientes de la misma o diferente población. Consideremos el siguiente ejemplo.
from scipy import stats
rvs1 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
rvs2 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
print stats.ttest_ind(rvs1,rvs2)
El programa anterior generará la siguiente salida.
Ttest_indResult(statistic = -0.67406312233650278, pvalue = 0.50042727502272966)
Puede probar lo mismo con una nueva matriz de la misma longitud, pero con una media variada. Utilice un valor diferente enloc y prueba lo mismo.