SAS - Análisis de correlación

El análisis de correlación se ocupa de las relaciones entre variables. El coeficiente de correlación es una medida de asociación lineal entre dos variables. Los valores del coeficiente de correlación están siempre entre -1 y +1. SAS proporciona el procedimientoPROC CORR para encontrar los coeficientes de correlación entre un par de variables en un conjunto de datos.

Sintaxis

La sintaxis básica para aplicar PROC CORR en SAS es:

PROC CORR DATA = dataset options;
VAR variable;

A continuación se muestra la descripción de los parámetros utilizados:

  • Dataset es el nombre del conjunto de datos.

  • Options es la opción adicional con un procedimiento como trazar una matriz, etc.

  • Variable es el nombre de la variable del conjunto de datos utilizado para encontrar la correlación.

Ejemplo

Los coeficientes de correlación entre un par de variables disponibles en un conjunto de datos se pueden obtener usando sus nombres en la declaración VAR. En el siguiente ejemplo usamos el conjunto de datos CARS1 y obtenemos el resultado que muestra los coeficientes de correlación entre caballos de fuerza y ​​peso.

PROC SQL;
create table CARS1 as
SELECT invoice, horsepower, length, weight
   FROM 
   SASHELP.CARS
   WHERE make in ('Audi','BMW')
;
RUN;

proc corr data = cars1 ;
VAR horsepower weight ;
BY make;
run;

Cuando se ejecuta el código anterior, obtenemos el siguiente resultado:

Correlación entre todas las variables

Los coeficientes de correlación entre todas las variables disponibles en un conjunto de datos se pueden obtener simplemente aplicando el procedimiento con el nombre del conjunto de datos.

Ejemplo

En el siguiente ejemplo usamos el conjunto de datos CARS1 y obtenemos el resultado que muestra los coeficientes de correlación entre cada par de variables.

proc corr data = cars1 ;
run;

Cuando se ejecuta el código anterior, obtenemos el siguiente resultado:

Matriz de correlación

Podemos obtener una matriz de diagrama de dispersión entre las variables eligiendo la opción de graficar la matriz en el PROC declaración.

Ejemplo

En el siguiente ejemplo, obtenemos la matriz entre caballos de fuerza y ​​peso.

proc corr data = cars1 plots = matrix ;
VAR horsepower weight ;
run;

Cuando se ejecuta el código anterior, obtenemos el siguiente resultado: