Estadísticas: bondad de ajuste

los Goodness of FitLa prueba se utiliza para verificar si los datos de la muestra se ajustan a una distribución de una población. La población puede tener distribución normal o distribución de Weibull. En palabras simples, significa que los datos de muestra representan correctamente los datos que esperamos encontrar de la población real. Los estadísticos suelen utilizar las siguientes pruebas:

  • Chi-square

  • Kolmogorov-Smirnov

  • Anderson-Darling

  • Shipiro-Wilk

Prueba de chi-cuadrado

La prueba de chi-cuadrado es la más comúnmente utilizada para probar la bondad de ajuste y se usa para distribuciones discretas como la distribución binomial y la distribución de Poisson, mientras que las pruebas de bondad de ajuste de Kolmogorov-Smirnov y Anderson-Darling se usan para distribuciones continuas .

Fórmula

$ {X ^ 2 = \ sum {[\ frac {(O_i - E_i) ^ 2} {E_i}]}} $

Donde -

  • $ {O_i} $ = valor observado del i-ésimo nivel de variable.

  • $ {E_i} $ = valor esperado del i-ésimo nivel de variable.

  • $ {X ^ 2} $ = variable aleatoria de chi-cuadrado.

Ejemplo

Una empresa de juguetes fabrica juguetes para jugadores de fútbol. Afirma que el 30% de las cartas son mediocampistas, el 60% defensores y el 10% delanteros. Teniendo en cuenta una muestra aleatoria de 100 juguetes, hay 50 mediocampistas, 45 defensores y 5 delanteros. Dado el nivel de significancia de 0.05, ¿puede justificar la afirmación de la empresa?

Solution:

Determinar hipótesis

  • Null hypothesis $ H_0 $ - La proporción de mediocampistas, defensores y delanteros es del 30%, 60% y 10%, respectivamente.

  • Alternative hypothesis $ H_1 $ - Al menos una de las proporciones de la hipótesis nula es falsa.

Determinar el grado de libertad

Los grados de libertad, DF es igual al número de niveles (k) de la variable categórica menos 1: DF = k - 1. Aquí los niveles son 3. Por lo tanto

$ {DF = k - 1 \\ [7pt] \, = 3 -1 = 2} $

Determinar el estadístico de la prueba de chi-cuadrado

$ {X ^ 2 = \ sum {[\ frac {(O_i - E_i) ^ 2} {E_i}]} \\ [7pt] \, = [\ frac {(50-30) ^ 2} {30}] + [\ frac {(45-60) ^ 2} {60}] + [\ frac {(5-10) ^ 2} {10}] \\ [7pt] \, = \ frac {400} {30} + \ frac {225} {60} + \ frac {25} {10} \\ [7pt] \, = 13,33 + 3,75 + 2,50 \\ [7pt] \, = 19,58} $

Determinar el valor p

El valor p es la probabilidad de que un estadístico de chi-cuadrado, $ X ^ 2 $ con 2 grados de libertad sea más extremo que 19,58. Utilice la calculadora de distribución de chi-cuadrado para encontrar $ {P (X ^ 2 \ gt 19.58) = 0.0001} $.

Interpretar resultados

Dado que el valor P (0,0001) es bastante menor que el nivel de significancia (0,05), no se puede aceptar la hipótesis nula. Por tanto, la afirmación de la empresa no es válida.