SAS: regresión lineal

La regresión lineal se utiliza para identificar la relación entre una variable dependiente y una o más variables independientes. Se propone un modelo de la relación y se utilizan estimaciones de los valores de los parámetros para desarrollar una ecuación de regresión estimada.

Luego se utilizan varias pruebas para determinar si el modelo es satisfactorio. Si es así, la ecuación de regresión estimada puede usarse para predecir el valor de la variable dependiente dados valores para las variables independientes. En SAS el procedimientoPROC REG se utiliza para encontrar el modelo de regresión lineal entre dos variables.

Sintaxis

La sintaxis básica para aplicar PROC REG en SAS es:

PROC REG DATA = dataset;
MODEL variable_1 = variable_2;

A continuación se muestra la descripción de los parámetros utilizados:

  • Dataset es el nombre del conjunto de datos.

  • variable_1 and variable_2 son los nombres de las variables del conjunto de datos utilizados para encontrar la correlación.

Ejemplo

El siguiente ejemplo muestra el proceso para encontrar la correlación entre las dos variables caballos de fuerza y ​​peso de un automóvil usando PROC REG. En el resultado, vemos los valores de intersección que se pueden usar para formar la ecuación de regresión.

PROC SQL;
create table CARS1 as
SELECT invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;
proc reg data = cars1;
model horsepower = weight ;
run;

Cuando se ejecuta el código anterior, obtenemos el siguiente resultado:

El código anterior también ofrece una vista gráfica de varias estimaciones del modelo como se muestra a continuación. Al ser un procedimiento SAS avanzado, simplemente no se limita a dar los valores de intersección como salida.