Estadísticas: bondad de ajuste
los Goodness of FitLa prueba se utiliza para verificar si los datos de la muestra se ajustan a una distribución de una población. La población puede tener distribución normal o distribución de Weibull. En palabras simples, significa que los datos de muestra representan correctamente los datos que esperamos encontrar de la población real. Los estadísticos suelen utilizar las siguientes pruebas:
Chi-square
Kolmogorov-Smirnov
Anderson-Darling
Shipiro-Wilk
Prueba de chi-cuadrado
La prueba de chi-cuadrado es la más comúnmente utilizada para probar la bondad de ajuste y se usa para distribuciones discretas como la distribución binomial y la distribución de Poisson, mientras que las pruebas de bondad de ajuste de Kolmogorov-Smirnov y Anderson-Darling se usan para distribuciones continuas .
Fórmula
Donde -
$ {O_i} $ = valor observado del i-ésimo nivel de variable.
$ {E_i} $ = valor esperado del i-ésimo nivel de variable.
$ {X ^ 2} $ = variable aleatoria de chi-cuadrado.
Ejemplo
Una empresa de juguetes fabrica juguetes para jugadores de fútbol. Afirma que el 30% de las cartas son mediocampistas, el 60% defensores y el 10% delanteros. Teniendo en cuenta una muestra aleatoria de 100 juguetes, hay 50 mediocampistas, 45 defensores y 5 delanteros. Dado el nivel de significancia de 0.05, ¿puede justificar la afirmación de la empresa?
Solution:
Determinar hipótesis
Null hypothesis $ H_0 $ - La proporción de mediocampistas, defensores y delanteros es del 30%, 60% y 10%, respectivamente.
Alternative hypothesis $ H_1 $ - Al menos una de las proporciones de la hipótesis nula es falsa.
Determinar el grado de libertad
Los grados de libertad, DF es igual al número de niveles (k) de la variable categórica menos 1: DF = k - 1. Aquí los niveles son 3. Por lo tanto
Determinar el estadístico de la prueba de chi-cuadrado
Determinar el valor p
El valor p es la probabilidad de que un estadístico de chi-cuadrado, $ X ^ 2 $ con 2 grados de libertad sea más extremo que 19,58. Utilice la calculadora de distribución de chi-cuadrado para encontrar $ {P (X ^ 2 \ gt 19.58) = 0.0001} $.
Interpretar resultados
Dado que el valor P (0,0001) es bastante menor que el nivel de significancia (0,05), no se puede aceptar la hipótesis nula. Por tanto, la afirmación de la empresa no es válida.