Técnicas de regresión
La regresión es una técnica estadística que ayuda a calificar la relación entre las variables económicas interrelacionadas. El primer paso consiste en estimar el coeficiente de la variable independiente y luego medir la confiabilidad del coeficiente estimado. Esto requiere formular una hipótesis y, con base en la hipótesis, podemos crear una función.
Si un gerente desea determinar la relación entre los gastos publicitarios de la empresa y sus ingresos por ventas, se someterá a la prueba de hipótesis. Suponiendo que un mayor gasto en publicidad conduce a una mayor venta para una empresa. El gerente recopila datos sobre los gastos publicitarios y los ingresos por ventas en un período de tiempo específico. Esta hipótesis se puede traducir a la función matemática, donde conduce a:
Y = A + Bx
Dónde Y son ventas, x es el gasto en publicidad, A y B son constantes.
Después de traducir la hipótesis a la función, la base para esto es encontrar la relación entre las variables dependientes e independientes. El valor de la variable dependiente es de suma importancia para los investigadores y depende del valor de otras variables. La variable independiente se utiliza para explicar la variación en la variable dependiente. Se puede clasificar en dos tipos:
Simple regression - Una variable independiente
Multiple regression - Varias variables independientes
Regresión simple
Los siguientes son los pasos para construir un análisis de regresión:
- Especificar el modelo de regresión
- Obtener datos sobre variables
- Estimar las relaciones cuantitativas
- Pruebe la significancia estadística de los resultados
- Uso de resultados en la toma de decisiones
La fórmula para la regresión simple es:
Y = a + bX + u
Y= variable dependiente
X= variable independiente
a= interceptar
b= pendiente
u= factor aleatorio
Los datos transversales proporcionan información sobre un grupo de entidades en un momento dado, mientras que los datos de series de tiempo proporcionan información sobre una entidad a lo largo del tiempo. Cuando estimamos la ecuación de regresión, implica el proceso de encontrar la mejor relación lineal entre las variables dependientes e independientes.
Método de mínimos cuadrados ordinarios (MCO)
El método ordinario de mínimos cuadrados está diseñado para ajustar una línea a través de una dispersión de puntos de tal manera que se minimiza la suma de las desviaciones al cuadrado de los puntos de la línea. Es un método estadístico. Por lo general, los paquetes de software realizan la estimación de OLS.
Y = a + bX
Coeficiente de determinación (R 2 )
El coeficiente de determinación es una medida que indica que el porcentaje de variación en la variable dependiente se debe a las variaciones en las variables independientes. R 2 es una medida del modelo de bondad de ajuste. Los siguientes son los métodos:
Suma total de cuadrados (TSS)
Suma de las desviaciones al cuadrado de los valores muestrales de Y de la media de Y.
TSS = SUM ( Yi − Y)2
Yi = variables dependientes
Y = media de variables dependientes
i = número de observaciones
Suma de cuadrados de regresión (RSS)
Suma de las desviaciones al cuadrado de los valores estimados de Y de la media de Y.
RSS = SUM ( Ỷi − uY)2
Ỷi = valor estimado de Y
Y = media de variables dependientes
i = número de variaciones
Suma de cuadrados de error (ESS)
Suma de las desviaciones al cuadrado de los valores muestrales de Y de los valores estimados de Y.
ESS = SUM ( Yi − Ỷi)2
Ỷi = valor estimado de Y
Yi = variables dependientes
i = número de observaciones
R 2 mide la proporción de la desviación total de Y de su media que se explica por el modelo de regresión. Cuanto más cerca de la unidad esté R 2 , mayor será el poder explicativo de la ecuación de regresión. Un R 2 cercano a 0 indica que la ecuación de regresión tendrá muy poco poder explicativo.
Para evaluar los coeficientes de regresión, se utiliza una muestra de la población en lugar de la población completa. Es importante hacer suposiciones sobre la población con base en la muestra y emitir un juicio acerca de cuán buenas son estas suposiciones.
Evaluación de los coeficientes de regresión
Cada muestra de la población genera su propia intersección. Para calcular la diferencia estadística se pueden utilizar los siguientes métodos:
Two tailed test −
Hipótesis nula: H 0 : b = 0
Hipótesis alternativa: H a : b ≠ 0
One tailed test −
Hipótesis nula: H 0 : b> 0 (o b <0)
Hipótesis alternativa: H a : b <0 (ob> 0)
Statistic Test −
b = coeficiente estimado
E (b) = b = 0 (hipótesis nula)
SE b = Error estándar del coeficiente
.Valor de tdepende del grado de libertad, una o dos pruebas fallidas y el nivel de significancia. Para determinar el valor crítico det, se puede utilizar t-table. Luego viene la comparación del valor t con el valor crítico. Es necesario rechazar la hipótesis nula si el valor absoluto de la prueba estadística es mayor o igual que el valor t crítico. No rechace la hipótesis nula, si el valor absoluto de la prueba estadística es menor que el valor t crítico.
Análisis de regresión multiple
A diferencia de la regresión simple en el análisis de regresión múltiple, los coeficientes indican el cambio en las variables dependientes asumiendo que los valores de las otras variables son constantes.
La prueba de significancia estadística se llama F-test. La prueba F es útil ya que mide la significancia estadística de toda la ecuación de regresión en lugar de solo para un individuo. Aquí En hipótesis nula, no existe relación entre la variable dependiente y las variables independientes de la población.
La fórmula es - H 0 : b1 = b2 = b3 =…. = bk = 0
No existe relación entre la variable dependiente y el k variables independientes para la población.
F-test static −
$$ F \: = \: \ frac {\ left (\ frac {R ^ 2} {K} \ right)} {\ frac {(1-R ^ 2)} {(nk-1)}} $$
Valor crítico de Fdepende del grado de libertad y del nivel de significación del numerador y del denominador. La tabla F se puede utilizar para determinar el valor F crítico. En comparación con el valor F con el valor crítico (F *) -
Si F> F *, debemos rechazar la hipótesis nula.
Si F <F *, no rechace la hipótesis nula ya que no existe una relación significativa entre la variable dependiente y todas las variables independientes.