Estadísticas: muestreo estratificado

Esta estrategia de examen se utiliza como parte de una circunstancia en la que la población puede dividirse sin esfuerzo en grupos o estratos que en particular no son exactamente iguales entre sí, pero los componentes dentro de una reunión son homogéneos con respecto a algunos atributos, por ejemplo, estudiantes suplentes de la escuela. se puede separar en estratos sobre la base de la orientación sexual, los cursos ofrecidos, la edad, etc. En este, la población se divide inicialmente en estratos y luego se toma una muestra irregular básica de cada estrato. Las pruebas estratificadas son de dos tipos: inspección estratificada proporcional y examen estratificado desproporcionado.

  • Proportionate Stratified Sampling- En esto, el número de unidades seleccionadas de cada estrato es proporcional a la proporción del estrato en la población, por ejemplo, en una universidad hay un total de 2500 estudiantes, de los cuales 1500 están inscritos en cursos de posgrado y 1000 están inscritos en cursos de posgrado. Si se elige una muestra de 100 utilizando un muestreo estratificado proporcional, entonces el número de estudiantes de pregrado en la muestra sería 60 y 40 serían estudiantes de posgrado. Por lo tanto, los dos estratos están representados en la misma proporción en la muestra que su representación en la población.

    Este método es más adecuado cuando el propósito del muestreo es estimar el valor poblacional de alguna característica y no hay diferencia en las varianzas dentro del estrato.

  • Disproportionate Stratified Sampling- Cuando el propósito del estudio es comparar las diferencias entre los estratos, es necesario extraer unidades iguales de todos los estratos independientemente de su participación en la población. A veces, algunos estratos son más variables con respecto a alguna característica que otros estratos, en tal caso se puede extraer un mayor número de unidades de los estratos más variables. En ambas situaciones, la muestra extraída es una muestra estratificada desproporcionada.

    La diferencia en el tamaño del estrato y la variabilidad del estrato se puede asignar de manera óptima utilizando la siguiente fórmula para determinar el tamaño de la muestra de diferentes estratos

    Fórmula

    $ {n_i = \ frac {n.n_i \ sigma_i} {n_1 \ sigma_1 + n_2 \ sigma_2 + ... + n_k \ sigma_k} \ para \ i = 1,2 ... k} $

    Donde -

    • $ {n_i} $ = el tamaño de muestra de i estratos.

    • $ {n} $ = el tamaño de los estratos.

    • $ {\ sigma_1} $ = la desviación estándar de i estratos.

    Además de esto, puede haber una situación en la que el costo de recolectar una muestra sea mayor en un estrato que en otro. El muestreo desproporcionado óptimo debe realizarse de manera que

    $ {\ frac {n_1} {n_1 \ sigma_1 \ sqrt {c_1}} = \ frac {n_2} {n_2 \ sigma_1 \ sqrt {c_2}} = ... = \ frac {n_k} {n_k \ sigma_k \ sqrt { c_k}}} $

    Donde $ {c_1, c_2, ..., c_k} $ se refieren al costo de muestreo en k estratos. El tamaño de la muestra de diferentes estratos se puede determinar mediante la siguiente fórmula:

    $ {n_i = \ frac {\ frac {n.n_i \ sigma_i} {\ sqrt {c_i}}} {\ frac {n_1 \ sigma_1} {\ sqrt {c_i}} + \ frac {n_2 \ sigma_2} {\ sqrt {c_2}} + ... + \ frac {n_k \ sigma_k} {\ sqrt {c_k}}} \ para \ i = 1,2 ... k} $

Ejemplo

Problem Statement:

Una organización tiene 5000 empleados que se han estratificado en tres niveles.

  • Estrato A: 50 ejecutivos con desviación estándar = 9

  • Estrato B: 1250 trabajadores no manuales con desviación estándar = 4

  • Estrato C: 3700 trabajadores manuales con desviación estándar = 1

¿Cómo se extraerá una muestra de 300 empleados de forma desproporcionada con una asignación óptima?

Solution:

Utilizando la fórmula de muestreo desproporcionado para una asignación óptima.

$ {n_i = \ frac {n.n_i \ sigma_i} {n_1 \ sigma_1 + n_2 \ sigma_2 + n_3 \ sigma_3}} \\ [7pt] \, para el flujo A, {n_1 = \ frac {300 (50) (9 )} {(50) (9) + (1250) (4) + (3700) (1)}} \\ [7pt] \, = {\ frac {135000} {1950} = {14.75} \ o \ say \ {15}} \\ [7pt] \, Para el flujo B, {n_1 = \ frac {300 (1250) (4)} {(50) (9) + (1250) (4) + (3700) (1 )}} \\ [7pt] \, = {\ frac {150000} {1950} = {163.93} \ o \ say \ {167}} \\ [7pt] \, para el flujo C, {n_1 = \ frac { 300 (3700) (1)} {(50) (9) + (1250) (4) + (3700) (1)}} \\ [7pt] \, = {\ frac {110000} {1950} = { 121.3} \ o \ say \ {121}} $