reemplazo - grafica hipergeometrica
Prueba hipergeométrica(phyper) (4)
Tengo una pregunta sobre la prueba hipergeométrica.
Tengo datos como este:
tamaño pop: 5260
tamaño de la muestra: 131
Número de ítems en el pop que están clasificados como éxitos: 1998
Número de ítems en la muestra que se clasifican como éxitos: 62
Para calcular una prueba hipergeométrica, ¿es correcto?
phyper(62, 1998, 5260, 131)
@Albert,
Para calcular una prueba hipergeométrica, obtiene el mismo valor de p, P (observado 62 o más), usando:
> phyper(62-1, 1998, 5260-1998, 131, lower.tail=FALSE)`
[1] 0.01697598
Porque:
lower.tail: logical; if TRUE (default), probabilities are P[X <= x],
otherwise, P[X > x]
Casi correcto. Si nos fijamos en ?phyper
:
phyper(q, m, n, k, lower.tail = TRUE, log.p = FALSE)
x, q vector of quantiles representing the number of white balls drawn
without replacement from an urn which contains both black and white
balls.
m the number of white balls in the urn.
n the number of black balls in the urn.
k the number of balls drawn from the urn.
Así que usando sus datos:
phyper(62,1998,5260-1998,131)
[1] 0.989247
Creo que esta prueba debería ser como la siguiente:
phyper(62,1998,5260-1998,131-62,lower.tail=FALSE)
Entonces la suma de todas las filas será igual a la suma de todas las columnas. Esto es importante cuando se trata de tablas de contingencia.
Creo que quieres calcular el valor p. En este caso, quieres.
P(Observed 62 or more) = 1-P(Observed less than 62).
Entonces quieres
1.0-phyper(62-1, 1998, 5260-1998, 131)
Tenga en cuenta que -1
hay en los primeros parámetros. Y también necesitas restar eso de 1.0 para obtener el área de la cola derecha.
Corrígeme si me equivoco..