teoria reemplazo historia hipergeometrica grafica geometrica distribucion con binomial aplicaciones r testing

reemplazo - grafica hipergeometrica



Prueba hipergeométrica(phyper) (4)

Tengo una pregunta sobre la prueba hipergeométrica.

Tengo datos como este:

tamaño pop: 5260
tamaño de la muestra: 131
Número de ítems en el pop que están clasificados como éxitos: 1998
Número de ítems en la muestra que se clasifican como éxitos: 62

Para calcular una prueba hipergeométrica, ¿es correcto?

phyper(62, 1998, 5260, 131)


@Albert,

Para calcular una prueba hipergeométrica, obtiene el mismo valor de p, P (observado 62 o más), usando:

> phyper(62-1, 1998, 5260-1998, 131, lower.tail=FALSE)` [1] 0.01697598

Porque:

lower.tail: logical; if TRUE (default), probabilities are P[X <= x], otherwise, P[X > x]


Casi correcto. Si nos fijamos en ?phyper :

phyper(q, m, n, k, lower.tail = TRUE, log.p = FALSE) x, q vector of quantiles representing the number of white balls drawn without replacement from an urn which contains both black and white balls. m the number of white balls in the urn. n the number of black balls in the urn. k the number of balls drawn from the urn.

Así que usando sus datos:

phyper(62,1998,5260-1998,131) [1] 0.989247


Creo que esta prueba debería ser como la siguiente:

phyper(62,1998,5260-1998,131-62,lower.tail=FALSE)

Entonces la suma de todas las filas será igual a la suma de todas las columnas. Esto es importante cuando se trata de tablas de contingencia.


Creo que quieres calcular el valor p. En este caso, quieres.

P(Observed 62 or more) = 1-P(Observed less than 62).

Entonces quieres

1.0-phyper(62-1, 1998, 5260-1998, 131)

Tenga en cuenta que -1 hay en los primeros parámetros. Y también necesitas restar eso de 1.0 para obtener el área de la cola derecha.

Corrígeme si me equivoco..